搜索引擎的工作原理 搜索引擎原理概述搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。搜索引擎结构划分搜索引擎的基本上分为四个步骤:1.爬行和抓取 搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。搜索引擎会跟踪网页中的链接,访问更多的网页,这个过程就叫爬行。这些新的网址会被存入数据库等待抓取。所以跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本的方法,所以反向链接成为搜索引擎优化的最基本因素之一。没有反向链接,搜索引擎连页面都发现不了,就跟谈不上排名了。搜索引擎抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。2.索引 蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程既是索引(index).在索引数据库中,网页文字内容,关键词。搜索引擎的工作原理是什么? 一、工具:电脑二、操作步骤1.抓取读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来,被抓取的网页被称之为网页快照。2.数据库处理搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中有,网站数据库,就是动态网站存放网站数据的空间。索引数据库,索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。简单的来说,就是把【抓取】的网页放进数据库。3.分析检索服务搜索引擎从索引数据库中找到匹配该关键词的网页;4.对收集的结果进行排序把收集来的网页进行排序,把这些进行最终的排序。注意事项:蜘蛛程序url抓取页面-存储-原始页面。搜索引擎按其工作方式分为哪两种 搜索引擎按其工作方2113式主要可分为三种,分别是全文5261搜索引擎4102(Full Text Search Engine)、目录索引类搜索引擎(1653Search Index/Directory)和元搜索引擎(Meta Search Engine)。两种是不包括目录索引,因为目录索引虽然有搜索功能,但从严格意义上算不上是真正的搜索引擎,只是一个目录列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。从这个角度说,搜索引擎按其工作方式分为全文搜索引擎和元搜索引擎两种。扩展资料:一个搜索引擎由搜索器、索引器、检索器 和用户接口 四个部分组成。搜索器的功能是在互联网 中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档 以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。参考资料来源:-
随机阅读
- 误服双氯芬酸钠栓怎么办?有止痛效果吗 双氯酚酸钠栓可口服吗
- 两个部门相互推卸责任,扯皮事不断怎么解决 跟铺砖工人扯皮可以找消协吗
- 上海有专门寄存行李的地方? 宝山图书馆到水产路699号
- 友人 下车引之元方入门而不顾
- 临汾市-段师傅餐饮一品大盘鸡 菱角到底能不能与猪肉炒在一起吃?记得在家的时候经常吃到这道菜,为什么医学书还有网上都说不能一起吃呢?
- 合肥到重庆北站的火车 重庆北站有两个火车站吗?我要到合肥该在哪个站上车?
- 用盼望写作文让真情自然流露 让真情自然流露作文
- 留别廉守 编萑以苴猪 关于美食,很文艺的句子有哪些?
- 英雄小八路电影观后感 读英雄小八路后感
- 菏泽市牡丹区中医医院治疗疝气 菏泽治疗小儿疝气的好的医院?
- 网银转账能不能删记录 网银上面的转账记录怎么删去?
- 迁安毛家洼啥时候平改 迁安市毛洼离沙河驿镇沙窝铺多远
- 宝宝消食开胃汤水 宝宝腹泻,还不想吃饭,用儿童消食开胃冲剂可以治疗吗
- 车载蓝牙连接手机微信语音通话声音小怎么办 手机连接车载蓝牙微信语音没有声音怎么办
- 试验设计抛物线法 一条抛物线y=x2+mx+n经过点(0,)与(4,). (1)求这条抛物线的解析...
- 白色丝质长手套 为什么影视作品里国民党军官都戴白手套?
- 全家20元购物卷怎样用 肯德基春分半价桶怎么领
- 美人鱼小姐 出演星爷美人鱼的亚洲小姐是谁
- 幼龄花椒树打什么农药好? 氯代乙醛肟结构式
- 调音台的调音技巧 调音台调试图