最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
搜索引擎评价指标-搜索引擎技术
时间:2022-07-02 20:27:52 编辑:袖梨 来源:一聚教程网
在传统信息检索中,衡量系统的基本指标:查全率(Recall)和查准率(Pricision),查全率是检索出的相关文档数和文档库中所有的相关文档数的比率;查准率是检索出的相关文档数与检索出的文档总数的比率。对于一个检索系统来讲,召回率和精度不可能两全其美:召回率高时,精度低,精度高时,召回率低。
对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的WEB网页,所以召回率很难计算。由于互联网海量信息的特征,查询返回的结果大都非常多,因此目前的搜索引擎系统都非常关心精度。同时,互联网的信息是动态变化的,搜索引擎必须反映这种变化。
简单来讲,搜索引擎要满足用户对信息查询的需求,提高用户的搜索体验。以下是几个比较重要的指标:
1. 网页覆盖率。提高查全率,是保证查准率的基础。
2. 返回结果的准确性,主要是第一页结果的准确性。大部分用户仅仅察看搜索结果的第一页。
3. 重复信息返回的过滤。返回结果应该尽可能不出现重复、类似的结果。
4. 网页更新速度。取决于新网页的发现,和死链(指无法访问网页)的及时删除。结果中大量的死链和过时信息的链接,将会降低用户体验。
5. 搜索服务的相应时间,也就是用户提交检索后得到结果返回的等待时间,一般要低于一秒即可。
6. 搜索服务的系统稳定性。
对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的WEB网页,所以召回率很难计算。由于互联网海量信息的特征,查询返回的结果大都非常多,因此目前的搜索引擎系统都非常关心精度。同时,互联网的信息是动态变化的,搜索引擎必须反映这种变化。
简单来讲,搜索引擎要满足用户对信息查询的需求,提高用户的搜索体验。以下是几个比较重要的指标:
1. 网页覆盖率。提高查全率,是保证查准率的基础。
2. 返回结果的准确性,主要是第一页结果的准确性。大部分用户仅仅察看搜索结果的第一页。
3. 重复信息返回的过滤。返回结果应该尽可能不出现重复、类似的结果。
4. 网页更新速度。取决于新网页的发现,和死链(指无法访问网页)的及时删除。结果中大量的死链和过时信息的链接,将会降低用户体验。
5. 搜索服务的相应时间,也就是用户提交检索后得到结果返回的等待时间,一般要低于一秒即可。
6. 搜索服务的系统稳定性。
相关文章
- 《最强祖师》不用买焰花的天水蛊队有哪些玩法 06-15
- 《女神异闻录:夜幕魅影》安祖面具介绍 06-15
- 十大虚拟货币交易平台app 狗狗币交易平台下载 06-15
- Solana ETF申请现已包含质押功能——获批概率飙升至91% 06-15
- 《高能英雄》金蝉子核心玩法深度拆解 06-15
- 《晶核》艾丽历程任务目标实现方法 06-15