• 回答数

    3

  • 浏览数

    121

成都囡囡
首页 > 期刊论文 > 关于文献与信息检索的论文

3个回答 默认排序
  • 默认排序
  • 按时间排序

jessicabeck

已采纳

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

241 评论

疯中之子

直接去看看(临床医学进展)上的文献吧

138 评论

lukylukycat

浅论医学文献检索的发展 作者:林丹红,苏晓宇,林晓华【关键词】 文献信息检索课;中医高等院校;中医教育中医药文献信息检索课自1985年首批中医院校开课至今已25年,目前国内所有中医院校均已开设检索课,有了相应的统编教材和自编教材、教参和一支教师队伍,不少院校还成立了检索教研室。通过对这门课程的学习,增强了中医院校大学生的信息意识,使广大同学普遍掌握了文献检索最基本的方法和技能,为今后的临床和科研奠定了基础。1医学文献索课程发展早在20世纪70年代,北京大学等已正式设立了《科技文献检索》课程,为国内文献检索教学拉开了序幕。《医学文献检索》课程早期仅在少数高校以选修课或讲座形式开展,但在1984年之后,在多方共同努力下,有了较快的发展。首先,国家教育部在1984和1985年分别颁布两个行政性文件,很大程度上促进了高校文献检索课程的发展。其次,1985年前后国家卫生部在四所医学高校设立了图书情报学系。医学文献检索课程成为此类专业的专业主干甚至核心课程,受到了前所未有的重视。最后,计算机技术和网络通信技术的发展,使文献检索教学有了飞跃式的发展。《医学文献检索》课程是一门工具课,一是文献检索的目的是为其他专业服务,通过检索文献为科研、教学或临床等提供医学信息:二是课程的主要内容是学会使用文献检索的工具书,以获得需要的文献信息。早期的文献检索是手工检索,以印刷版的工具书为检索对象,比如美国的《医学索引》、荷兰的《医学文摘》,虽然编排结构严谨,但使用依然不方便。1 985年,赖茂生主编的《科技文献检索》教材中,认为计算机检索在我国已经成为现实,在某些章节中也穿插了少量计算机检索的内容,但该教材内容以检索理论为主,检索工具的介绍则以国外工具书为主…。随着社会信息化程度的提高,手工检索逐步向计算机检索过渡,特别是通信技术的发展和网络的普及,检索对象由单一的出版物变成了形式多样的网络信息,人们逐渐接受并认可信息检索这一概念。2医学文献检索与医学信息检索概念使用现状2.1医学文献数据库文献分析通过检索中国生物医学文献数据库(CBM),对几个常用的概念(“文献检索”、 “信息检索”、“文献信息检索”、 “信息素养”或“信息素质”)使用频率做一比较,数据见表1,CBM数据库“文献检索”、 “信息检索”等文献数量表,时间截止到2012年12月18日。从表1可见,在医学科技文献中,使用“信息检索”概念始于1995年,使用“文献检索”概念的文献数量明显多于其他概念的使用,数据中不排除同一文献中出现两个以上概念。使用“文献检索”和“信息检索”概念的文献基本呈逐年递增趋势。 “信息检索”文献数量阶段性变化比较明显(将文献数量相近的连续年分为一个阶段),大致可分为四个阶段:1 995—1 998年,年均2.5篇;1 999—2000年,年均1 4篇;2001—2004年,年均37篇;2005—201 2年,年均57篇。而使用“文献检索”概念的文献数量虽然也处于增长态势,但变化趋势不明显,对照上述的四个阶段, “文献检索”概念的年均文献数量分别为,46篇、76篇、1 06.3篇、223篇。对万方医学网1998—2012年的文献分析,发现使用“文献检索”概念的文献数量(3453篇)明显多于使用“信息检索”概念的文献数量(907篇)(时间截止到20 1 2年1 2月1 8日),与CBM数据分析结果一致。2.2课程名称分析关于课程名称,张妍妍于201 O年1月1 1日在中国期刊网数据库中分别以“文献检索课”、“信息检索课”和“文献信息检索课”为检索词,分别得到1580条、360条、17条结果比‘。在万方医学网期刊库(2000—2012年数据)中以“文献检索课”、 “信息检索课”为检索词,分别得到291条、62条数据。在CBM(2000—2012年数据)中以“文献检索课”、 “信息检索课”为检索词,分别得到282条、58条数据。可见教育界对“文献检索”的认可度仍高于“信息检索”。2.3教材或论著名称分析关于教材或论著名称,目前出版的检索类教材,信息检索的种类的数量已经远超过文献检索U1。通过检索南京图书馆(江苏省级图书馆)中文图书库,对“文献检索”、 “信息检索”、“文献信息检索”、 “信息素养”使用频率做一比较,发现虽然使用文献检索为书名的图书种类(213种)多于信息检索(204种)。但21 3种文献检索类图书中有1 14种是在1993年前出版的,其中包括一些翻译文献,及检索工具介绍等。1993—2012年,信息检索使用

201 评论

相关问答

  • 有关文献信息检索的论文

    论文写作中文献资料检索 在社会的各个领域,许多人都写过论文吧,借助论文可以达到探讨问题进行学术研究的目的。一篇什么样的论文才能称为优秀论文呢?下面是我收集整理的

    misskissfion 4人参与回答 2023-12-08
  • 文献与信息检索的论文格式

    1、论文题目:要求准确、简练、醒目、新颖。2、目录:目录是论文中主要段落的简表。(短篇论文不必列目录)3、提要:是文章主要内容的摘录,要求短、精、完整。字数少可

    黑玫瑰1111 1人参与回答 2023-12-12
  • 并检索与信息检索相关的学位论文

    内圈与外圈都是精选的,同等重要,但在影响因子、地区因素、学科平衡等方面有...SCI等检索系统收录,学术水平是基础,编排格式是条件,投稿途径是关键。论文的...

    eugenewoo1986 5人参与回答 2023-12-11
  • 关于文献信息检索与利用的论文

    “信息资源共享”课程检索报告一 检索课题数字图书馆个性化服务研究现状二 主题分析随着数字图书馆建设和网络通讯技术的高速发展, 数字资源越来越多, 而人们获取

    爱谁是谁007 2人参与回答 2023-12-07
  • 文献检索与信息分析论文

    信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等

    bibilove726726 2人参与回答 2023-12-10