搜索引擎的工作原理 搜索引擎原理概述搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。搜索引擎结构划分搜索引擎的基本上分为四个步骤:1.爬行和抓取 搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。搜索引擎会跟踪网页中的链接,访问更多的网页,这个过程就叫爬行。这些新的网址会被存入数据库等待抓取。所以跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本的方法,所以反向链接成为搜索引擎优化的最基本因素之一。没有反向链接,搜索引擎连页面都发现不了,就跟谈不上排名了。搜索引擎抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。2.索引 蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程既是索引(index).在索引数据库中,网页文字内容,关键词。搜索引擎的分类 1.全文索引全文搜2113索引擎是名副其5261实的搜索引擎,国外代表有Google,国内则有着名的4102搜索。它们从互联1653网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。2.目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!新浪分类目录搜索。3.元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的。目录类搜索引擎和全文搜索引擎的区别? 搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果7a686964616fe4b893e5b19e31333332633664返回给用户,因此他们是真正的搜索引擎。从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。目录索引目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录。搜索引擎按其工作方式分为哪两种 搜索引擎按其工作方2113式主要可分为三种,分别是全文5261搜索引擎4102(Full Text Search Engine)、目录索引类搜索引擎(1653Search Index/Directory)和元搜索引擎(Meta Search Engine)。两种是不包括目录索引,因为目录索引虽然有搜索功能,但从严格意义上算不上是真正的搜索引擎,只是一个目录列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。从这个角度说,搜索引擎按其工作方式分为全文搜索引擎和元搜索引擎两种。扩展资料:一个搜索引擎由搜索器、索引器、检索器 和用户接口 四个部分组成。搜索器的功能是在互联网 中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档 以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。参考资料来源:-
随机阅读
- 右图中的圆形种植区直径可达 沙特阿拉伯的沙漠面积
- 3月下旬准备去杭州旅游两天购物两天游玩因为我和一个朋友一起去是学生所以没什么钱想知道西 杭州阿里巴巴购物体验馆
- 关于我国行政法律关系主体的说法错误的是 关于我国司法解释,下列哪些说法是错误的?
- 装窗户,是装不锈钢的好,还是塑钢的好 佳美不锈钢塑钢门窗加工部怎么样
- 母羊有肾吗?公羊有肾,母羊也有肾吗? 母山羊的肾能吃吗
- 郁金香.玫瑰,水仙花,菊花,月季花分别在一天中的哪个时间开放? 水仙郁金香要剥皮吗
- 添加剂氟化镁 什么是氟化镁?
- 大疱性类天疱疮分几种 大疱性类天疱疮症状?
- 星火电子商务贸易有限公司 广西星火源商贸有限公司怎么样?
- 李达 简介 天涯社区李达窑乡
- 金蝉窗帘布艺上海门店 十大窗帘品牌排行有哪些
- 求傲风秦界第四十章。有潇湘VIP的帮忙粘一下!!手打图片都行。谢!!!!!! 第四十章 你的眼睛怎么这么漂亮
- 河南省新乡市获嘉县冯庄镇王井村何时才能实行新农村 河南新乡获嘉县冯酷酷
- 清炖鱼头 清炖鱼头做法大全家常
- 战锤2全面战争怎样才可以玩好? 战锤2全面战争 混沌mod
- 圣托马斯卫浴价格怎么样? 圣托马斯浴室柜价格
- 商河郑路满家村委电话 郑路镇派出所挂失补办身份证还要户口本吗?
- 江苏万载港到阳泉的公里有多少公里 浙江平阳县南山机械厂
- 新型冠状病毒感染的肺炎临床分型重型的是? 以下符合新型冠状病毒感染肺炎的危重病例
- 如何减少胡子的生长速度? 运动可以减少胡子生长