西瓜日报

@好东西传送门 整理, 过刊见 http://me.memect.com/baojieai

订阅: 发封邮件 hao@memect.com,标题是 " 订阅西瓜日报 "

2015-03-05 星期四 (14)

马少平THU   原微博 2015-03-05 14:27
基金委网站太虐人了,同意的举手🙋
西瓜大丸子汤 原微博 转发于2015-03-05 14:39  回复 @刘知远THU “昨天把人员信息输进去,点了保存显示保存成果,结果一刷新全都没了。[汗]”
据说基金委的网站叫ISIS [吃惊]

 

西瓜大丸子汤   原微博 2015-03-05 14:08
争取赶快干完现在这个项目,就可以开始准备愚人节重大恶搞了 [嘻嘻]

 

西瓜大丸子汤   原微博 2015-03-05 11:34
中文NER,开箱即用的有什么推荐?

 

700BIKE   原微博 2015-03-05 11:06
秦昊为46岁伊能静庆生 送自行车做礼物 http://t.cn/RwEqMSa
西瓜大丸子汤 原微博 转发于2015-03-05 11:38
还记得“19岁的最后一天”这歌。这过去多少年了

 

西瓜大丸子汤   原微博 2015-03-05 10:31
杂谈
牛逼的洗脑都是靠暗示的。错误的结论都是观众自己脑补,原文的各种材料组织就是在统计上保证80%的观众会犯预期的错误。你非要死扣原文的话,那作者真是没有说啊!常见手段有:暗示相关性就是因果性,有视觉震撼的图像紧跟结论,激发同情或恐惧。
西瓜大丸子汤 原微博 转发于2015-03-05 10:34
大众是非常容易按预期的方式产生错误的结论的,只要你的整个宣传机构足够强大。因为人的思维,如《快思考,慢思考》《进化的大脑》所述,非理性的思维定势是极其有规律的。这些定势保证了5万年狩猎采集生活的高效,但是到了今天就成了洗脑者最爱的大脑后门,随时可以来黑你一下。

 

西瓜大丸子汤   原微博 2015-03-05 10:16
这书讲几个概念:可计算性,可学习性,可演化性,可演绎性。一个新词ecorithm,还不懂是什么意思

 

IBM认知计算_Watson   原微博 2015-03-05 09:24
IBM acquires AlchemyAPI to power up Watson's deep learning skills http://t.cn/RwEzPHK @西瓜大丸子汤 http://t.cn/RwEzPH9 #Knowledge Graph# #IBMWatson#
西瓜大丸子汤 原微博 转发于2015-03-05 09:39
cool

 

phunter_lau   原微博 2015-03-05 07:11
今天看到@王威廉 发的“读博士的计划与现实”,想起来我读博时候。之前给南都周刊写了个稿 《我们发现了“上帝粒子”》链接在 http://t.cn/8DDyWe9 下面这部分是编辑修改之前原稿,发来看看,和各位博士共勉加油。

 

西瓜大丸子汤   原微博 2015-03-05 04:38
技术 语义网
我发表了文章<关于知识管理和语义搜索的一些思考> http://t.cn/RwR8f5H 1)知识管理的坑 2) 自由…不是无代价的 3) 市场的的经验教训 博客原文 http://t.cn/RwR8Iod

 

西瓜大丸子汤   原微博 2015-03-05 03:40
技术 语义网
做知识,做语义,很容易犯的错误,是把实验室成果外推,认为能应用到大几个数量级的数据上。而在实践中,一个人用的东西和十个人用的截然不同,1G数据的分析和1T数据的分析截然不同,不是上Hadoop就能解决的。这里面有太多人的因素,人是没法Hadoop化的。
西瓜大丸子汤 原微博 转发于2015-03-05 03:49
反之亦然,在大市场、大数据上有效的算法,在小市场、小数据上效果反而不好。创业公司就不能眼睛盯着大公司,觉得他们怎么做我们就follow,只要把规模缩小了就可以了。可是大象的骨骼结构小老鼠是不能按比例缩小的。

 

西瓜大丸子汤   原微博 2015-03-05 03:34
技术
我的信箱里还有好多“Twine Digest”,其实和我们现在做的机器学习日报、大数据日报也差不多。Twine的经验教训,时时刻刻都都在提醒我们。
西瓜大丸子汤 原微博 转发于2015-03-05 03:37
如果Twine当时更专注一些,比如专门做书签,或者只做推送,或者专门在一个话题上深挖,会不会更好些呢?至少,它的数据量会少很多,对后端的压力就不会那么大,也就不至于需要分一半的工程力量去搞大数据基础设施,就能更关注于业务本身。当然历史是不容假设的。

 

西瓜大丸子汤   原微博 2015-03-05 02:38
技术 语义网
和Hakia和Powerset的人都聊过。对这两个语义搜索先驱的失败,我的感觉还是他们想做的事情太大,超越了时代。比如Powerset为了搞语义,先发明了HBase,但是语义分析速度实在是太慢。被微软收购后,很长一段时间里Powerset其实是被抛弃了,没法满足微软要求的规模。还是要Lean Startup
西瓜大丸子汤 原微博 转发于2015-03-05 02:41
Hakia和Powerset都是以自然语言理解为核心,想从关键字搜索进步到自然语言搜索。这个路径至少在2006年是超前的。今天是不是还是超前,我不敢定言。但是任何会激发用户图灵测试欲望的界面设计,都是不妥的。

 

西瓜大丸子汤   原微博 2015-03-05 02:29
技术 语义网
Sig.ma已经下线了了。sindice.com全球排名一直在40万上下,再也上不去。如今商业化的通用语义搜索十分的不景气。
西瓜大丸子汤 原微博 转发于2015-03-05 02:34
在不景气名单上的还有kngine 已经加入阵亡或被收编名单的:Hakia, Kosmix, Evri, Powerset, Truevert。唯一和语义有点关系还干的不错的是DuckDuckGo
西瓜大丸子汤 原微博 转发于2015-03-05 02:51
专有领域的一些语义搜索(一般它们都不这么叫自己),比如Yummly和Factual,活得都不错。所以现在的技术和市场条件,还是不太合适通用语义搜索的存在。现在的机器学习技术,做通用知识的自动挖掘还远远没能离开实验室阶段,拿它来做创业太冒险了。

 

老师木   原微博 2015-03-05 02:10
如丁仲礼院士所言,人类的危机最终要靠更好更包容的文明解决。我相信,这个文明一定是中华文明,但现在还不是时候,如梁漱溟所言,早熟的文明。这个文明最终被接受,一定要先经过其它文明(如西方战斗的文明)被否定的过程。
西瓜大丸子汤 原微博 转发于2015-03-05 02:14
我也相信。不过先要我们内部先撕至少一百年,学会内部包容的法则。我们这辈子是肯定看不到了,我们的孩子也看不到。

 

TA点评的更早的微博 (5)

36大数据网   原微博 2015-03-04 22:26
根据咨询机构Wikibon在2014年进行的一项调查,仅有36%正在使用Hadoop,而其中又有64%只是将其用于概念测试环境下。Wikibon还发现,那些部署Hadoop的机构中,仅有25%是付费用户,而有51%是基于Hadoop的开源版本自行开发,还有24%的用户则是使用Cloudera、MapR、Hortonworks等开发商推出的免费版本。

 

西瓜大丸子汤   原微博 2015-03-04 12:31
一个幽灵,绿党的幽灵,在亚洲大陆徘徊
西瓜大丸子汤 原微博 转发于2015-03-05 01:11
以左翼绿党之名,行极右翼茶党之实

 

西瓜大丸子汤   原微博 2015-02-21 08:35
今天又有人问我来自Google的竞争的问题。答:只要Google Plus一天不死,就一天不用担心Google,它会帮我们做所有的事情。
西瓜大丸子汤 原微博 转发于2015-03-05 03:58
现在我担心Google了 [哈哈]

 

西瓜大丸子汤   原微博 2015-02-09 12:37
性非和顺,地实寒微。昔充下陈,曾以更衣入侍。洎乎晚节, 秽乱春宫。潜隐先帝之私,阴图后房之嬖。入门见嫉,蛾眉不肯让人;掩袖工谗,狐媚 偏能惑主。——哦,这不是在说武媚娘,是说Google Plus
西瓜大丸子汤 原微博 转发于2015-03-05 04:03
请看今日之域中,竟是谁家之天下![哈哈]

 

破破的桥   原微博 2015-01-15 20:00
#忽悠的原理与技巧#我发表了文章《教主与仇恨》http://t.cn/RZ9ShgO 恐怖组织可以用语言忽悠到傻瓜,却难以形成规模,更无法形成同情他们的群众基础。没人想整天生活在爆炸里。那怎么办?我们尝试站在教主的角度思考,怎样让更多人为我的利益而死?
西瓜大丸子汤 原微博 转发于2015-03-05 01:49  回复 @破破的桥 “订正部分错误后的版本放在我的博客上。 http://t.cn/RZ9o3IH”
破桥老师的这个理论用在分析这次雾霾讨论也是适用的