STAKE中国官方网站

STAKE中国官方网站看法

全文搜索

宣布时间:2009-09-02

有专家以为 ,, ,,,, ,,无论对文献标引的质量怎样 ,, ,,,, ,,对用户检索的知足率都不可能百分之百。。。。。

有专家以为 ,, ,,,, ,,无论对文献标引的质量怎样 ,, ,,,, ,,对用户检索的知足率都不可能百分之百。。。。。例如 ,, ,,,, ,,用户想检索关于陈毅在抗日战争中运动的文献 ,, ,,,, ,,接纳对标引词(主题词、要害词)字段的检索就很难知足检索要求 ,, ,,,, ,,只有全文检索才华知足这一检索目的。。。。。因此 ,, ,,,, ,,无论对文献的标引和分类怎样 ,, ,,,, ,,全文检索的功效都是不可替换的。。。。。然而 ,, ,,,, ,,由于全文检索是直接对“原文”的检索 ,, ,,,, ,,检索时会爆发误检 ,, ,,,, ,,大宗的检索垃圾降低了全文检索的查准率 ,, ,,,, ,,同时由于作者用词的不统一 ,, ,,,, ,,同义词繁多 ,, ,,,, ,,全文检索的查全率也受到影响。。。。。以是 ,, ,,,, ,,解决这些问题是刻禁止缓的。。。。。

1.提高查全率

作者用词的不统一 ,, ,,,, ,,影响了用户的查全。。。。。例如 ,, ,,,, ,,查找“非典范肺炎” ,, ,,,, ,,由于差别的文献使用的词汇差别 ,, ,,,, ,,如“非典范肺炎”、“SARS”、“非典”等 ,, ,,,, ,,只用某一词查找就可能泛起漏检 ,, ,,,, ,,若是让用户去枚举出所有同义词来检索 ,, ,,,, ,,势必增添了用户的检索肩负。。。。。因此 ,, ,,,, ,,结构全文检索算法时应思量到检索词的扩充 ,, ,,,, ,,接纳同义词辞书无疑是一个好的要领。。。。。

同义词辞书是把寄义相同的词汇关联起来 ,, ,,,, ,,在全文检索中的作用是 ,, ,,,, ,,当用户使用某个词汇检索时 ,, ,,,, ,,系统直接将同义词取出 ,, ,,,, ,,组成“或”运算检索式 ,, ,,,, ,,在全文中匹配盘问 ,, ,,,, ,,这样确保了具有高查全率的检索效果。。。。。关于同义词辞书 ,, ,,,, ,,应能够实时更新 ,, ,,,, ,,或具有学习功效 ,, ,,,, ,,为维护同义词辞书提供资助。。。。。

2.提高查准率

由于中文词之间没有距离标记 ,, ,,,, ,,以是举行全文检索时极易爆发误检索 ,, ,,,, ,,使查准率偏低。。。。。例如 ,, ,,,, ,,用“华人”一词去检索 ,, ,,,, ,,会使得含有“中华人民共和国”词汇的文献被检索出来;;;;;用“民法’’检索 ,, ,,,, ,,会把“人民法院”检索出来。。。。。解决这类问题同样可通过结构检索辅助辞书来完成 ,, ,,,, ,,而实现这一使命的辞书 ,, ,,,, ,,称为“扫除词辞书”。。。。。

扫除词辞书的结构为 ,, ,,,, ,,将检索用词(如民法)与欲扫除词(如人民法院、移民法等)关联起来 ,, ,,,, ,,用于在检索时消除误检。。。。。用扫除词辞书扫除误检的做法有许多 ,, ,,,, ,,最简朴的要领是将检索词在每一文献中检索出数目(检索词在文献中泛起次数)与所有欲扫除词在文献中泛起的数目相较量 ,, ,,,, ,,若相等 ,, ,,,, ,,该文献就被扫除 ,, ,,,, ,,不然为掷中。。。。。

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】