爱可可老师今日推荐

@好东西传送门 整理, 过刊见 http://me.memect.com/fly51fly

订阅: 发封邮件 hao@memect.com,标题是 " 订阅爱可可老师今日推荐 "

2015-03-04 星期三 (25)

爱可可-爱生活   原微博 2015-03-04 21:06
[文章]《Auto-regression and Moving-average time series - Simplified》http://t.cn/RwRfXdX 自回归滑动平均(ARMA)时间序列的简单介绍,ARMA是研究时间序列的重要方法,由自回归模型(AR模型)与滑动平均模型(MA模型)为基础“混合”构成

 

爱可可-爱生活   原微博 2015-03-04 19:56
[可视化] shinyStan http://t.cn/RwRGEQ4 基于R和Shiny的在线应用,交互可视化浏览马尔可夫链蒙特卡罗(MCMC)算法拟合的贝叶斯模型,效果相当赞 源码:http://t.cn/RwRGFjd 介绍文章:http://t.cn/RwRqvhY

 

爱可可-爱生活   原微博 2015-03-04 19:18
[文章]《R: How to Layout and Design an Infographic》http://t.cn/RwR4rAJ 用R做Infographic布局和样式设计的精美例子

 

除了众所周知、妇孺皆知、家喻户晓、无人不知、如雷贯耳的搜狗查询日志之外 http://t.cn/ajgvUw ,这里有AOL的search engine query log可以下载,解压后好几G。http://t.cn/RwR4ezw 需要使用英文搜索引擎查询日志来做一些研究的朋友可以参考。

 

爱可可-爱生活   原微博 2015-03-04 18:30
[文章]《ML Pitfalls: Measuring Performance (Part 1)》http://t.cn/Rw8BTiX 机器学习那些坑之性能评价,浅显易懂的实操型文章,跟着过一遍Scikit-Learn也能熟悉熟悉。机器学习的门槛真是越来越低了,赶快学起来!

 

爱可可-爱生活   原微博 2015-03-04 18:15
[论文]《Striving for Simplicity: The All Convolutional Net》(2014) JT Springenberg, A Dosovitskiy, T Brox http://t.cn/RwRLLOg 用于图像识别的简化“全卷积网络”

 

Wenpeng_Yin   原微博 2015-03-04 18:14
Stanford推出利用parsing的树状LSTM, 在Stanford Sentiment Treebank上表现还凑合,句子相似度计算上不错http://t.cn/RwRLwvx

 

统计之都   原微博 2015-03-04 14:01
你是否曾因gbm模型长达几小时的运算对着屏幕无聊地发呆[晕]?抑或立志参加数据挖掘竞赛,烤了一星期电脑后却发现效果平平[泪]? 不妨来试试gbm包升级版——由@陈天奇怪@严酷的魔王 带来的xgboost吧:既可自动多核并行,又能助你准确率更上一层楼: http://t.cn/Rw83Fv1

 

爱可可-爱生活   原微博 2015-03-04 14:01
[IPN]《Python for Data Analysis》http://t.cn/Rw8uquS Python数据分析指南,环境科学数据实战,内容涉及IPython使用、Python基础、Numpy及Scipy基础、统计数据建模、Pandas、Scikit-Learn使用等,相当有料,推荐! ipn:http://t.cn/Rw8uosi

 

爱可可-爱生活   原微博 2015-03-04 13:35
[列表]《Awesome Public Datasets》http://t.cn/Rz2wunu 连开放数据集都有Awsome列表了,无处不Awsome,赞!

 

爱可可-爱生活   原微博 2015-03-04 13:28
《Inspiring! We Asked 5 Successful People About The First Thing They Bought After Making Their First Million》http://t.cn/Rw8naAu 赚到第一笔一百万买什么?看看成功人士怎么说……你今天励志了吗?

 

爱可可-爱生活   原微博 2015-03-04 13:14
[资源]《Top 50 Data Science Resources: The Best Blogs, Forums, Videos and Tutorials to Learn All about Data Science》http://t.cn/Rw8EjKJ 数据科学顶级资源推荐,包括最佳博客、论坛、视频、教程,内容全面,不容错过

 

爱可可-爱生活   原微博 2015-03-04 13:05
[论文]《A Survey of Statistical Methods and Computing for Big Data》(2015) C Wang, MH Chen, E Schifano, J Wu, J Yan http://t.cn/Rw8827g 面向大数据分析的统计算法和软件综述,内容挺全,可以了解一下

 

爱可可-爱生活   原微博 2015-03-04 11:16
[视频]《Deep Learning of Representations》http://t.cn/Rw8WGBO Yoshua Bengio 2012年底Google Tech Talk上的深度学习报告,内容很不错,应该和@zhangjie198x 分享的AAAI2013上的报告(http://weibo.com/1785692303/C6XUPn28n )差不太多,推荐大家参照看看 云:http://t.cn/Rw8WLM9

 

zhangjie198x   原微博 2015-03-04 09:28
Yoshua Bengio在AAAI2013上四小时深度学习教学讲座PPT,230页:http://t.cn/zQ4VRVx 33页综述文:http://t.cn/zjkx49Z 主要从特征学习出发,讲述了DL的进展,以及各种trick。

 

爱可可-爱生活   原微博 2015-03-04 08:29
最让人惋惜的,不是今生无缘相见,而是一见钟情,却来不及品味,匆匆“收藏”了,从此断了联系,待再见面,时过境迁,已没了当初的感触和激情,才真是应了“无缘”二字……生活如此,学习也如此,珍惜眼前好时光,抓住当下,快意人生……“取”有法,“舍”有道,才真是逍遥惬意

 

王威廉   原微博 2015-03-04 07:58
IBM在招Cloudera的大数据架构师,要求有8年的Cloudera实现经历。http://t.cn/Rw8xL3C 结果Cloudera的创始人Mike Olson跳出来说:哎哟,我才7年... #这脸打的#

 

王威廉   原微博 2015-03-04 07:13
来自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章:The NLP Engine: A Universal Turing Machine for NLP http://t.cn/Rw8IAV7 作者用Shannon Entropy来刻画NLP中各项任务的难度。

 

爱可可-爱生活   原微博 2015-03-04 06:59
"Computer Security Career Paths. This is one very funny cartoon!" via:Stu Sjouwerman

 

爱可可-爱生活   原微博 2015-03-04 06:40
[文章]《Predicting and Plotting Crime in Seattle》http://t.cn/RwHbaZR 关于西雅图犯罪情况的可视化和预测分析,基于Pandas、ggplot2进行数据混合分析的好案例,文中提供了部分代码

 

爱可可-爱生活   原微博 2015-03-04 06:12
"The most powerful dimension reduction tool you can ever employ is defining a question as specific as possible" (via:Stefan Breet)
爱可可-爱生活 原微博 转发于2015-03-04 09:16  回复 @箫剑78 “问题是,就是因为看着眼晕而不知道有什么问题,才想着先降降维看看的。。。”
有时候降维(可视化)确实也是为了了解数据——这里的重点,在于提倡不盲目降维(或者说,过于依赖算法),应该尽可能多的获取和利用先验知识,这也是特征工程的重要核心思想

 

爱可可-爱生活   原微博 2015-03-04 05:59
[资源]《Awesome Data Science》http://t.cn/Rw8ckKQ “面向真实世界问题分析与解决”的数据科学资源荟萃,Awesome风格的大列表,很赞!

 

爱可可-爱生活   原微博 2015-03-04 05:48
[音频]《Deep Learning》http://t.cn/Rw8cQcW BBC World Service的深度学习专题节目,嘉宾包括Geoffrey Hinton、Zoubin Ghahramani和Trevor Darrell,介绍深度学习的概念、发展和应用

 

爱可可-爱生活   原微博 2015-03-04 05:27
[论文]《Ensemble System Based on Genetic Algorithm For Stock Market Forecasting》(2014) http://t.cn/Rw8cfP4 学位论文,用于股票市场预测的遗传算法集成系统,用机器学习算法分析预测金融时序数据

 

西瓜大丸子汤   原微博 2015-03-04 04:35
数据的语义,应该尽可能的局部化。过于照顾数据多样的应用中的语义解释,会极大提高数据发布者的发布成本,因为这就需要精确的指定语义(比如说用URI命名)。而事实上,真正产生价值的应用的数量是很少的。在1-1而非n-n的语境下语义的解释成本就会大大的下降。降低这个成本就是知识管理的一个核心任务
爱可可-爱生活 原微博 转发于2015-03-04 10:21
没错。或者放宽一些,在可识别的上下文环境下有限定语义,只要情境有线索、可识别就好办。不过真要解决这个问题可是个系统工程,先行研究要到位,场景设计、表述逻辑、支撑数据也要面面具到。