百度,请别动我的蛋糕(cookie)!
原来百度是依靠用户的cookie和对关键词的整理分析生成的报告。那么百度的报告靠谱么?
从采样数量看,百度是中国流量最高的网站,每天访问人次数以亿计,百度的报告称采样的数量达到了百万数量级。可见,从调查用户的数量上看的确非常可观。 copyright dedecms
但从调查方法上看,笔者认为还是存在一定的漏洞。
其一、百度的技术后台“屏蔽掉多个用户的cookie”,那么意味着,网吧用户的统计被剔除掉。但国内网民在网吧上网的比例有1/3强,绝对数量巨大。去掉这些信息会导致结果出现偏差,这在网络游戏上的结果上最为 明显。 织梦内容管理系统
其二、国内上网用户还普遍存在一个家庭多个用户的情形,如夫妻共用一台电脑,家庭共用一台电脑的情形(笔者认为这些也比较普遍); dedecms.com
其三、某些用户使用多台电脑,例如笔者办公和家庭就使用不同的电脑,按照百度的统计口径,这些用户的数据被重复计算了,而这正是统计学所忌讳的。 copyright dedecms
其四、百度所有用户的调查结果是基于百度搜索用户的。非搜索引擎用户或者非百度用户,就难以统计进去,这部分用户的比例保守估计也在1/3左右(根据CNNIC的搜索引擎数据)。 内容来自dedecms
因此,百度的报告正如CNNIC的报告一样,在计算方法上还存在一定的漏洞,尽管庞大的采样数据能够弥补其中一些不足。笔者认为百度的报告只具有一定参考意义,并不能完全反映行业全貌。 copyright dedecms
当然,笔者更关心的是百度是如何利用我们的cookie来制作报告的,百度是不是动了我们的cookie,动了我们的蛋糕。 织梦好,好织梦
百度,请别动我的蛋糕 copyright dedecms
Cookie,英文指就着牛奶一起吃的点心,我直接翻译为“蛋糕”。在因特网内,“cookie”这个字有了完全不同的意思。“cookie”是小量信息,由网络服务器发送出来以存储在网络浏览器上,从而下次这位独一无二的访客又回到该网络服务器时,可从该浏览器读回此信息。 内容来自dedecms
Cookie可以保持登录信息到用户下次与服务器的会话,换句话说,下次访问同一网站时,用户会发现不必输入用户名和密码就已经登录了。我们在登录论坛的时候就经常发现这种情形。
百度的报告编制说明中,特意提到了Cookie: 内容来自dedecms
通过“关键词组合”判断各个 Cookie 代表的个人信息,比如性别倾向、收入范围、行业领域的相关喜好,我们对各种需求有一个“群”的把握,比如刚毕业(21-23 岁)的女性的总体消费特征。
文章评论
共有位Admini5网友发表了评论 查看完整内容