ZKX's LAB

全文检索和搜索引擎有区别吗? 搜索引擎 需要检索快吗

2020-10-12知识8

数据库的数据检索和 搜索引擎的信息检索的不同点是什么?需要解决的核心问题和核心技术有何不同? 信息检索不等于搜索引擎。互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息检索等同于使用搜索引擎就陷入了误区。搜索引擎技术中也普遍采用了全文信息检索技术,但互联网信息搜索和企业信息搜索是不同的。一是数据量。传统信息检索系统一般索引库规模多在GB级,但互联网网页搜索需要处理几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,对大多数企业应用是不合适和不必要的,并不适用于企业应用。二是内容相关性。信息太多,查准和排序就特别重要,Google等搜索引擎发展了网页链接分析技术,根据互联网上网页被连接次数作为重要性评判的依据。但企业网站内部的网页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别重要性的依据。真正的企业应用的检索要求基于内容的相关性排序,就是说,和检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作用。三是实时性。搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜索引擎的更新周期需要以周乃至月度量;而企业信息检索需要实时反映内外信息变化。

搜索引擎检索机制分为哪3种? 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有 (Baidu)。它们都是通过从互联网。

百度等搜索引擎不仅可以检索网页还可以检索什么 等搜索引擎zhidao主要原理是数据库检索,目前能检索的有:网页类;图片类;软件类;音乐类;资讯类;地图类;目前常用的就是这些,当然如果搜索数据内和收集数据很大的话,其他分类容后期也是可以的,是一个不断增加的过程!

搜索引擎能如此快速的在全网范围内检索并抓取关键字,是怎么做到的? 要回答这个问题,我们先玩个游戏,游戏规则是:1.甲事先把一个1000以内的数写在纸片上,乙不知道,由乙来猜。2.乙每次猜一个数,甲需要告诉乙对不对,如果不对,甲要告诉乙,他猜的数比纸片上的数大还是小。3.乙猜的次数少于12次则获胜。1000以内的数,你能在12次以内猜出来吗?如果不知道数学原理就很难,如果知道“折中法”,则很易。1000每次除以2,11次就可以到1。假如纸片上的数字是639。如果从1开始猜,每次加1,要猜639次。如果从1000开始猜,每次减1,需要300多次。而采用折中法,只需9次,如下:乙第一次猜500(1000的一半),甲告诉他小了。乙第二次猜750(500和1000的中间数),甲说大了。乙第三次猜625(500和750的中间值),甲说小了。乙第四次猜687(625和750的中间值取整),甲说大了。乙第五次猜656(625和687的中间值),甲说大了。乙第六次猜641(625和656的中间值),甲说大了。乙第七次猜633(625和641的中间值),甲说小了。乙第八次猜637(633和641的中间值),甲说小了。第九次猜639(637和641的中间值),甲说正确。只用了9次就猜出来了。其实1万以内的数,只需要13次就可以猜出来。10万以内的数,最多17次就可以猜出。搜索引擎索引原理和这个类似。

随机阅读

qrcode
访问手机版