数据库的数据检索和 搜索引擎的信息检索的不同点是什么?需要解决的核心问题和核心技术有何不同? 信息检索不等于搜索引擎。互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息检索等同于使用搜索引擎就陷入了误区。搜索引擎技术中也普遍采用了全文信息检索技术,但互联网信息搜索和企业信息搜索是不同的。一是数据量。传统信息检索系统一般索引库规模多在GB级,但互联网网页搜索需要处理几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,对大多数企业应用是不合适和不必要的,并不适用于企业应用。二是内容相关性。信息太多,查准和排序就特别重要,Google等搜索引擎发展了网页链接分析技术,根据互联网上网页被连接次数作为重要性评判的依据。但企业网站内部的网页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别重要性的依据。真正的企业应用的检索要求基于内容的相关性排序,就是说,和检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作用。三是实时性。搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜索引擎的更新周期需要以周乃至月度量;而企业信息检索需要实时反映内外信息变化。搜索引擎通常具备哪些基本的检索功能 共1 现有的搜索引擎基本上分为三类: 1.1 single search engine(独立搜索引擎)它的特点是仅在搜索引擎自身的数据库检索信息,比如Yahoo。1.2 Meta search engine(元。信息检索与搜索引擎关系 搜索引擎是指互联2113网上专门5261提供检索服务的一类网4102站,这些站点的服务器1653通过网络搜索软件(例如网络搜索机器人)或网络登录等方式,将Intemet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。索引技术是搜索引擎的核心技术之一。搜索引擎要对所收集到的信息进行整理、分类、索引以产生索引库,而中文搜索引擎的核心是分词技术。分词技术是利用一定的规则和词库,切分出一个句子中的词,为自动索引做好准备。检索器的主要功能是根据用户输入的关键词在索引器形成的倒排表中进行检索,同时完成页面与检索之间的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
随机阅读
- 医用机器人工程 机器人怎样在医用领域实际操作的?
- 我最不缺的就是从头再来的勇气之类的语录 就是不缺重头再来的勇气
- 性格公正严明 明镜高悬,公正严明。指什么动物
- 世纪明珠物资批发市场怎么样 文化产业股票有哪些?
- 有谁知道佛山哪里有百合花花场? 2017里水万顷洋花海
- 新疆阿克苏定向生工资 我是在新疆库车,开塔吊的,我干了3个零七天的工资,老板让我等,可是我等了一个星期了,可是老板让我找会
- 活性炭纤维在污水处理中的应用 求活性炭分类及其在水处理行业的应用??
- 我家阳台想装隐形防盗窗面积大概六至八平方米大概多钱一平方请告诉我谢谢 庄永兴元上都
- 水仙儿户外第三部种子
- 如何正确使用增高鞋垫? 内增高鞋垫怎么选知乎
- 愿天堂没有病痛,一路走好[难过][难过][难过] 意思是大概天堂没有病痛的英文歌曲
- 大连北站到达保定东站的高铁途径瓦房店站是几点 石家庄高铁站到瓦房店高铁站
- 汉中饿了么加入电话 我是陕西汉中的,想问一下在汉中跑滴滴一天能挣多少钱?
- 电力系统一次调频的基本原理是什么 电网的一次调频厂
- 纳税人销售() 免征增值税. 增值税小规模纳税人,月销售额不超过多少的,免征增值税
- 贝瑞佳儿童电动车怎么样 贝瑞佳汽车电池安装视频
- 姜黄色羊毛大衣搭配什么毛衫 姜黄色的大衣怎么搭配
- 国家给下岗职工解决工作问题吗? 如何解决下岗再就业问题
- 二人转路小波的马寡妇开店 二人转正戏大全
- 贴片指甲胶怎么去掉 如何快速去除指甲上贴的水钻?贴的时候涂了一些专用的胶水。