搜索引擎的三个目标和三个核心问题
三个目标:
1、更全
“更全”是从搜索引擎所索引的网页数量的角度来说的,数据显示,目前能够搜索到的数据大概只有信息量的千分之二,因此,对于“暗网”的抓取需要在“爬虫”上下功夫。
2、更快
“更快”主要指的是建立索引的速度以及检索的速度。
3、更准
“更准”指的是搜索结果的准确性,“链接分析”、“排序”、“用户研究”等技术都会影响搜索结果,当然,搜索结果是否准确或者“相关”带有一定的主观性。
三个核心问题:
1、用户的真正需求是什么
每个人的表达方式不同,用户输入的关键词可谓多姿多彩,然而,用户所输入的并不一定能准确地体现用户所期望的搜索需求。
2、哪些信息和用户的真正需求相关
果农输入“苹果”关键词应该是为了查询有关农业的信息而不是“iPhone”的信息吧。
3、哪些信息是可以让用户信赖的
很多时候都是由我们自己判断哪些网站可信,哪些不可信,其实应该由机器判断的。