4月上旬,在blog ,我们曾经说过:
实战测试,数据越多,反而会影响精度。目前个人数据分析的一个重点,就是“小”数据。老子《道德经·第六十三章》有云:天下大事,必做于细。
我在一个blog上面也找到了数学支持,龙格现象,http://zh.wikipedia.org/wiki/龙格现象
::维度越多,可供单一维度的数据量就也少,反而会影响分析结果.
才两个月,今天在csdn,zw的“小数据”理论,也碰到黑天鹅
http://www.csdn.net/article/2015-06-18/2825003
Netflix公司工程总监Xavier Amatriain认为,增加更多的样本到训练集很多时候并不会提高模型的性能,我们需要的是好的方法,来帮助我们理解如何解释数据,模型,以及两者的局限性,这都是为了得到最好的输出。
自从4月,zw“大数据”系列blog发布以来,才两个月,仅仅与zw发布的blog相关的“黑天鹅”事件,就不下十余件
历史总是在不断重复
【黑天鹅才是新常态】
金融市场 大家都是大数据 会反向干扰态势的
现在(2015) 黑天鹅才是新常态
看看:石油价格 瑞士法郎 日元升值 光大砸盘 黄金狂跌
全部没节操 没下限
http://blog.sina.com.cn/s/blog_7100d4220102vkxa.html