《第三方数据的信任危机》
《第三方数据的信任危机》 (2010-09-19 21:37:21) 第三方数据的信任危机 对于第三方机构的调研数据的质疑从来没有中断。 随着互联网经济越来越重要对于互联网相关的各种数据的需求也越来越多面对越来越多的“专业市场调研公司”发布的各种互联网的数据我们可以相信这些数据吗 事实上对于数据的质疑不仅仅存在于互联网行业。 比如 2009 年年度流行词 “被” 其中就含有很多网民对于国家统计局出台的各项数据的自嘲国家统计局有幸在数据领域成为被时代的代表。工资被增长、物价被降低种种舆论扑面而来。 互联网时代我们应该相信第三方的数据吗 互联网经济最大的特点就是数据——网站排名、流量统计、用户分布等等行业内外的各色人等都需要借助这些数据来评判某一家网站的好坏 是否值得投资 是否具备成长性等等。 互联网行业对于数据的需求也催生了很多的互联网市场调研公司可以举一些例子 国字头的 CNNIC 经常被用到的 Alexa 关注中文互联网的艾瑞、 易观 还有诸如尼尔森、 IDG、互联网实验室等甚至连 、百度这样的搜索巨头也推出了基于互联网的数据等等——不胜枚举。
在早前我的某一篇博文后面有网友质疑我对于某一个数据的解读 “这就算是数据分析了吗你观测过天涯的服务器错误么有第三方基调的数据没另外alexa 由于过多的造假早就不能作为基础数据了” 。 言辞很尖锐也有一些道理。值得说明的是我的博客文章并不是严谨的数据分析论文基之是对一些数据以及现象的简单分析是个人的观点其次对于 alexa 不能作为基础数据的说法值得商榷。 我们知道任何数据的出台都是经过一定方法论来实现的也都可以说是不真实的但是如果按照严谨的方法论出来的数据是可以代表一定程度的客观事实的的。在具体的内容中关于天涯流量的下降不仅仅是 alexa 的数据同样也参照了 DCCI 的数据。 当然我认为这位网友的质疑更多的是质疑数据的来源但是于此同时他也提出希望用第三方的调研数据来批驳我的结论这就提出一个重要的问题 我们应该相信第三方数据吗是什么让我们对于第三方数据失去了信任感 不仅仅是网民对第三方数据表示怀疑相关的企业也经常对某些数据的真实性产生质疑这对于这个行业的从业者投资者以及广告营销人等等都造成了很大的困扰。 对数据的质疑除了和社会整体的诚信度不高以及习惯性阴谋论者外第三方数据机构本身的一些缺陷也是造成外界对于数据不真实的重要原因。 首先是标准统计方法不统一。 以“酷 6 流量造假事件升级”为例世界杯期间酷六网援引多项数据证明在此次世界杯中强于优酷。其中 DCCI 数据显示酷 6 网世界杯频道流量在所有跟世界杯相关的视频流量中达到 46.13%优酷网只有 6.97%。易观国际数据显示在视频世界杯广告市场中酷 6 网位
