搜索引擎的信息检索方法 21世纪人类社会已进2113入了信息5261化时代,作为信息化时代标志之一的因特4102网在全世界1653以史无前例的速度和规模不断发展壮大,而因特网上的信息也象原子裂变一样迅速膨胀,面对这些浩瀚无边的信息人们已经显得无所适从了。的确,人们要想在这信息的海洋中准确找到自己所需要的信息是一件很不容易的事情。为了能够克服这样的困难,人们制作出来了搜索引擎,它通过内部的某些软件程序把INTERNET上的信息进行分类整理,或者是通过人工组织的方式把某些数据归类,形成一个可供查询的大型数据库。可以说:“搜索是一种组织和查询信息的方式!一般来说,在每个搜索引擎中均提供分类目录及关键词检索这两种信息查询的方法。而这些搜索引擎的基本用法是搜索引擎站点中都提供一个可以输入关键词的文本输入框和一个“搜索”的按钮,用户可以在输入框中键入关键词,然后按“搜索”按钮,搜索引擎就会自动地在其内部的数据库中进行检索,最后把与关键词相符合的或者是与关键词相近的网站显示在结果页中,接着用户只需通过搜索引擎提供的链接地址,就可以访问到相关信息。这种查询方法的关键之处在于关键词的选择和表达上。如果关键词选择不当,搜索的结果会返回大量无用的。
比较搜索引擎和专业数据库在检索方式和检索结果方面的异同。 从搜索方式上看,搜2113索引擎使用起来要5261方便简单易用,4102只需要输入关键词就可搜索1653,而且搜索引擎大多是免费的查找网络上已有的网页,是一种人人可用的检索方式;然而,专业数据库的使用就比较的麻烦复杂,需要具有一定的相关知识才可以运用,而且专业数据库是收费的,需要专门购买。从搜索结果来看,搜索引擎能够搜索到网络上已经存在的大量文章,这其中既有专门的论文也有相关的新闻或者一些网友的看法,相关性和权威性较差,但是信息覆盖广泛;专业数据库则只是收录了各类学术期刊中的论文以及一些学生的毕业论文,信息覆盖面要小一些,因此专业数据库的文章的相关性权威性要较搜索引擎高.
搜索引擎的信息检索和门户网站的信息检索有啥不同 搜索引擎是全部网站进行搜索,而门户网站的就是限于自己网站内的信息检索。腾讯、搜狐除外他们使用的是搜狗。
信息检索与搜索引擎关系 搜索引擎是指互联2113网上专门5261提供检索服务的一类网4102站,这些站点的服务器1653通过网络搜索软件(例如网络搜索机器人)或网络登录等方式,将Intemet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息或相关指针。用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。索引技术是搜索引擎的核心技术之一。搜索引擎要对所收集到的信息进行整理、分类、索引以产生索引库,而中文搜索引擎的核心是分词技术。分词技术是利用一定的规则和词库,切分出一个句子中的词,为自动索引做好准备。检索器的主要功能是根据用户输入的关键词在索引器形成的倒排表中进行检索,同时完成页面与检索之间的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
数据库的数据检索和 搜索引擎的信息检索的不同点是什么?需要解决的核心问题和核心技术有何不同? 信息检索不等于搜索引擎。互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息检索等同于使用搜索引擎就陷入了误区。搜索引擎技术中也普遍采用了全文信息检索技术,但互联网信息搜索和企业信息搜索是不同的。一是数据量。传统信息检索系统一般索引库规模多在GB级,但互联网网页搜索需要处理几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,对大多数企业应用是不合适和不必要的,并不适用于企业应用。二是内容相关性。信息太多,查准和排序就特别重要,Google等搜索引擎发展了网页链接分析技术,根据互联网上网页被连接次数作为重要性评判的依据。但企业网站内部的网页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别重要性的依据。真正的企业应用的检索要求基于内容的相关性排序,就是说,和检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作用。三是实时性。搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜索引擎的更新周期需要以周乃至月度量;而企业信息检索需要实时反映内外信息变化。