介绍:搜索引擎查询日志库包括约1个月(2008年6月)的Sogou搜索引擎部分网页查询需求及用户点击情况的网页查询日志数据**。为进行中文搜索引擎用户行为分析的研究者提供基准研究语料。
格式说明:访问时间\t用户ID\t[查询词]\t该URL在返回结果中的排名\t用户点击的顺序号\t用户点击的URL
其中,用户ID是根据用户使用浏览器访问搜索引擎时的Cookie信息自动赋值,即同一次使用浏览器输入的不同查询对应同一个用户ID。
相关任务:相关性排序
用户兴趣挖掘
查询扩展
新词发
来源:数据堂
格式说明:访问时间\t用户ID\t[查询词]\t该URL在返回结果中的排名\t用户点击的顺序号\t用户点击的URL
其中,用户ID是根据用户使用浏览器访问搜索引擎时的Cookie信息自动赋值,即同一次使用浏览器输入的不同查询对应同一个用户ID。
相关任务:相关性排序
用户兴趣挖掘
查询扩展
新词发
来源:数据堂