据样本积累的越多,成果也就越大。
再加上,齐磊这个挂逼。虽然他不擅长什么大数据分析,只能提一点简单的建议包括他把三石体系内的系统、网站、游戏,以及兄弟单位像是企鹅、网易等等的数据直接接入到大数据中心。
可是别小看这些简单的建议、数据流。
这既是正确的方向,也是底层数据累积的基础,会少走很多弯路。
以至于,大数据中心的那帮人比齐磊还飘。
断言,即便欧米从现在开始追赶,也不可能撼动中国在大数据分析上的领先地位。
事实上,大数据中心已经进入到实际应用的试验阶段,正与京城的交通系统合作,利用京城范围内实时车流数据的分析,来实现红绿灯和路况的事实调度与预报。
总之,北广的大数据研究中心很牛逼,可以说是独步天下。
那么问题来了,吉恩夏普为什么会对这东西感兴趣呢?
呵呵,他可太应该感兴趣了。
这么说吧,后世很多人印象中的大数据,就是给手机上推大伙感兴趣的内容,
用来给购物网站做定向广告?
好吧,那是最low的用法。
打个比方吧,一个热点新闻事件,从统计学的角度来说,它的信源、信息、信道、信宿,相对比例都是有规律的。
就比如说,一个热门信源,根据它所在的类别,会引起多少媒体(信息)的关注和报道。信源出现之后,不同的时间段,会增加多少比例的媒体,这都是固定的。
一个信息,会通过多少信道进行传播,信道之中,有多少比例的理性媒体、多少比例的非理性媒体、多少比例的人际传播,这也是有固定曲线的。
而信宿的反馈,根据信源的性质,又会有什么样的反馈,在大数据之下,也有规律可循。
那么问题来了,假如一个信息的传播完全违背了大数据的曲线呢?
比如说,信源一出现,马上得到了不正常的信息关注,报道的媒体、非理性媒体远远大于理性媒体。
信道曲线脱离正常值,信宿反馈远比正常情况更激烈。
那么,根据这条不正常曲线,基本就可以判定,这条信源的传播属于非正常传播,很有可能是受人操控的。
这就好比,后世一个新闻事件出来了,主流平台比如DY、WB马上就开始屏蔽一些信道,造成平台控制舆论的假象。
更有甚者,认为这新闻
本章未完,请点击下一页继续阅读!