cookie调研方法说明
1. 研究原理
搜索引擎能采集用户主动需求的文字表达(即关键词查询)。通过Cookie跟踪,能把关键词与具体的需求挂上钩。我们假设每一个Cookie代表一个潜在消费者(在技术上和统计学上是成立的,同时技术后台可屏蔽掉多个用户使用的Cookie,如网吧Cookie),那么该Cookie在一定时间内的关键词集合能全面反映他(她)关注的信息。我们对这些信息进行系统编码、清理和分析,把不同Cookie检索的关键词进行交叉分析,发现网民搜索的群体行为。
但是,百度不以具体用户的个人信息作为分析对象,一个Cookie只是收集需求(关键词)的桥梁,它代表的人其实是一个与实际需求相联系的虚拟人,我们完全不知道他(她)是谁,也没有联系方式,但通过他们的检索轨迹,我们可以知道他(她)的需求。数据采集好以后,借助统计软件,对用户进行“群体”判断和分析,整合成报告形式。
2. 研究假设
百度假设,关注手机的一部分网民会用百度来搜索信息,他们会根据自己的兴趣和关注点发出搜索请求,输入关键词。为了保证研究的有效性,百度假定在以下情况下,Cookie会被认为无效而排除出研究范畴:如果该用户在30天之内,只搜索过一次手机行业关键词,这样的搜索可能只是用户一时的兴趣,很难说明该用户在百度的研究阶段还在真正关注手机。我们最关注的是对某个手机话题有对话检索行为的Cookie。对有歧义的关键词,我们会通过前期数据清理和后期交叉分析进行严格筛选,保证数据质量。
3. 分析方法
本次对行业搜索行为的调查采用了定性和定量研究结合、线上与线下调研相结合的方法,运用了文献资料检索、定距随机抽样、行业词汇构架和编码、描述统计、内容分析、相关分析以及搜索引擎独特的Cookie跟踪等调研方法,对采集到的数据严格把关,多次进行细致的人工筛选,保证其信度和效度。最后通过专业统计分析平台进行数据清理和分析,通过检索量统计、相关分析、交互分析、回归分析等方法,得出研究结果,并根据数据结果和相关资料做出相应的判断和预测。
4. 调研流程
第一步:确定行业
通过业内调查和深入访谈的形式,了解行业需求,确定调查方向
第二步:行业关键词筛选
对网民搜索该行业的所有关键词进行筛选,去除有歧义的关键词
第三步:样本数据抽取
每月通过定距随机抽样抽取百万级具有搜索行为的网民cookies
第四步:行业特征数据清洗
将行业关键词放到样本库中进行筛选,获取具有行业特征的cookies
步骤五:数据分析
以行业特征数据分析,研究该群体对于某行业的检索及其他行业检索的行为特征
步骤六:报告编制
依据调研结果,归纳调研结论,按照百度数据研究中心报告规范撰写行业研究报告