ZKX's LAB

截词检索搜索引擎

2021-03-09知识6

“分类截词检索”是指什么? 截词检索:预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。截词检索一般是指右截词,部分支持中间截词。截词检索能够帮助提高检索的查全率。分类在截词检索技术中,较常用的是后截词和中截词两种方法。如果按所截断的字符数目来分,有无限截词和有限截词两种。截词算符在不同的系统中有不同的表达形式,需要说明的是并不是所有的搜索引擎都支持这种技术。截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。不同的系统所用的截词符也不同,常用的有?等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。下面以无限截词举例说明:(1)后截断,前方一致。如:comput?表示computer,computers,computing等。(2)前截断,后方一致。如:?computer表示minicomputer,microcomputers等。(3)中截断。

是不是所有数据库和搜索引擎都支持截词检索 检索词尾有变化的词干相同、词义相近词,扩大检索范围词与截词符之间不能有“”、{ }、onear/0 EBSCO数据库:“”(双印号)、空格 搜索引擎:,mTAXmz

截词检索搜索引擎

截词检索的截词检索方式 截词检索的方式有多种,可以分为有限截词、无限截词和中间截词。

#截词检索搜索引擎

随机阅读

qrcode
访问手机版