ZKX's LAB

20100803信息检索 多媒体信息检索搜索引擎

2020-10-11知识2

数据库的数据检索和 搜索引擎的信息检索的不同点是什么?需要解决的核心问题和核心技术有何不同? 信息检索不等于搜索引擎。互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息检索等同于使用搜索引擎就陷入了误区。搜索引擎技术中也普遍采用了全文信息检索技术,但互联网信息搜索和企业信息搜索是不同的。一是数据量。传统信息检索系统一般索引库规模多在GB级,但互联网网页搜索需要处理几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,对大多数企业应用是不合适和不必要的,并不适用于企业应用。二是内容相关性。信息太多,查准和排序就特别重要,Google等搜索引擎发展了网页链接分析技术,根据互联网上网页被连接次数作为重要性评判的依据。但企业网站内部的网页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别重要性的依据。真正的企业应用的检索要求基于内容的相关性排序,就是说,和检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作用。三是实时性。搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜索引擎的更新周期需要以周乃至月度量;而企业信息检索需要实时反映内外信息变化。

20100803信息检索 多媒体信息检索搜索引擎

搜索引擎如何搜索到信息 机器人利用主页中的超文本链接遍历WWW,通过U趾引用从一个HT2LIL文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HIML文件合法性的验证、uRL。

20100803信息检索 多媒体信息检索搜索引擎

信息检索的作用:节省查找文献的时间有利于查全专题文献克服语言障碍信息的特征 1)普遍性 客观性 抽象性 依附性 可加工性 传递性 共享性信息的作用(1)信息是人类社会生存的条件,信息是人类社会发展的资源2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础4)信息是决策的依据,信息是控制灵魂1、文献的定义记录有知识的一切载体,凡是用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。2、文献的构成要素(1)信息:内容(2)载体:物质形式(3)记录方式:将内容固定在载体上的手段根据载体不同:印刷型,缩微型,机读型,视听型3、文献的主要特点(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献的定义:依据检索语言把大量毫无规律的一次文献系统组织起来,对文献进行报道和供人们进行文献检索的工具。信息检索(Information Retrieval)—是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。三、检索方法(一)常用法1、顺查法:2、倒查法 3、抽查法:。

20100803信息检索 多媒体信息检索搜索引擎

20100803信息检索 1、信息素质的具体内容?信息素质是指用户在利用以计算机及其网络技术为代表的现代科学技术进行知识学习、成长的过程中,逐步形成的制动参与信息活动、。

单选信息检索的发展趋势是( ) A. 集成搜索引擎 B.搜索网站越来越多 C. WWW搜索引擎 D.多媒体信息检索 单选:关于分类搜索引擎,下列说法哪种是不正确的?()选D分类目录搜索引擎往往伴有网络查询功能,也称之为网站检索。通过在查询框内输入用户感兴趣的词组,或关键词,即可获得与之相关的网站信息。而非选项中所说以人工方式搜索。搜索引擎分类有分类目录型、全文检索型、多元集成型、图像搜索型、智能搜索型,所以B是正确的。hao123就属于分类目录型的。单选信息检索的发展趋势是()A.集成搜索引擎 B.搜索网站越来越多 C.WWW搜索引擎 D.多媒体信息检索A

信息资源检索 搜索引擎搜索方式 觉得都应该是全文搜索。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

随机阅读

qrcode
访问手机版