百度指数或者Alexa等分析报告中的职业、年龄、学历、性别,这些
来源:网络整理 作者:华北互联 人气: 发布时间:2016-09-05
摘要:参加过一次百度指南的讲解会,本身做互联网分析的,对这方面有些了解。怕被说泄露机密就匿了。 檀斌说的部分内容是真实的。 这个是非常复杂的统计学和数据分析算法得到的相对性的结论(事实上准确性并不高,但可以看到一个群体属性的趋势)。 用户搜索了哪
参加过一次百度指南的讲解会,本身做互联网分析的,对这方面有些了解。怕被说泄露机密就匿了。
檀斌说的部分内容是真实的。 这个是非常复杂的统计学和数据分析算法得到的相对性的结论(事实上准确性并不高,但可以看到一个群体属性的趋势)。
用户搜索了哪些关键字、所在地区的IP、上了哪些网站、停留时间、退出率、甚至各种转化行为监控。 数据准确性确实不高,而他们使用的分析维度就是上面提到的。相信百度指南和百度指数的分析方法是一样的,在百度注册的用户有填写基本的用户信息,包括性别、年龄、学历等等。根据ip地址可以分析地域。另外,去除噪音,就是不靠谱的数据来源,会采用网站停留时间、家庭电脑或网吧等信息来判断是否真人行为。剩下来所谓相对靠谱的数据,也因为样本量不全,只是覆盖到某一特定人群(登录的百度用户),所以数据是有偏向性的。
再说说统计学分析方法 比如你经常搜索股票、汽车、单反、VC、时代周刊、财经、上BBC、上纽约时报网站等又可以对应怎样的用户模型。 比如你经常搜索敏捷开发、ruby、html5、app开发、photoshop、产品设计、SEO、ppc、上知乎、上csdn等又对应怎样的用户模型。 这样基本可以通过统计学分析,得出某人的相关属性,然后根据大量的用户集群,得出该用户集群的属性。建模统计分析什么的,听上去很美好,但是多少公司有能力和资源去做呢。就我所知,百度是没有在这个上面建模的。建模是预测好用的工具,如果有这么厉害可以预测到数字,那百度指数可以做的比现在的要多多了。
不要太迷恋所谓的指数数据什么的,参考看看就好。
|
var jiathis_config = {data_track_clickback:'true'};