• 回答数

    4

  • 浏览数

    259

小石在青岛
首页 > 学术论文 > 文献检索论文3000字模板

4个回答 默认排序
  • 默认排序
  • 按时间排序

贝克街流浪猫

已采纳

信息检索技术论文 – 基于网格的面向专业内容的Web信息检索 1 引言 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。 2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1 (1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。 (2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。 (3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1 本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。 集群系统的设计 由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。 集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。 下面主要说明基于专业内容的XML信息集成系统的构造方法: XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。 目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。 图2 网格中间件的设计 图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。 内部主要功能模块说明如下: (1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。 (2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。 (3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。 (4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。 (5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。 其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。

201 评论

吃货小郡主

计算机论文,看这里:

102 评论

不是我的白云

你是本科吗?

134 评论

乘风秋夜

3000字左右的论文,可以检索相关的计算机资料,其中形成观念和主见,就可以顺利的写好论文;论文写作中文献的检索自从有了文献便有了文献检索。文件检索是在人们查找所需文件时应运而生的。只不过早期可检索的对象比较少,而且早期的文献检索主要是手工检索, 人们通过“心想、手翻、眼看”的方式进行。随着社会的发展和文献量的增加,人们逐渐认识到文献检索的必要性与重要性,现今计算机网络技术和现代信息技术为基础的文献检索逐渐发展起来。一、文献检索概述文献可理解为古今一切社会史料的总称,是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识 。现在通常理解为图书、期刊等各种出版物的总和。文献是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段,也是记录、积 累、传播和继承知识的最有效手段。根据载体把其分为印刷型、缩微型、机读型和声像型。根据不同出版形式及内容可以分为:图书、连续性出版物、特种文献 。文献检索,就是从文献信息集合中找出所需要的文献的过程,相当于人们通常所说的资料查寻。二、文件检索分类:1、纸质文献的检索纸质文献的检索一般分为两种:直接检索和间接检索。文献检索地目的都是为了获取所需要的文献。直接文献检索是直接从报刊杂志中通过浏览的方法直接获得所需文献。它适用于浏览心道的书刊资料,是获得最新情报的方法。它具有方便、快捷的特点,但同时又受到各种限制而漏查很多相关文献。因此,它只能作为一种辅助性的检索方法。间接文献检索是一个利用检索工具并从中查出特定文献的过程。它可以比较系统地、全面地获得相关课题的文献信息。间接检索的方法是文献检索的主要方 式,我们必须掌握它。它大体上可以分为以下五个步骤:(一)分析研究课题,明确检索要求;(二)根据检索课题,选择检索工具或数据库;(三)确定检索策略;( 四)确定检索方法,使用检索工具;(五)通过馆藏文献或各类联合迷路获取原文;这样就完成了文献检索的全过程。文献检索方法主要有三种:(1)追溯法(亦称滚雪球法) 利用著者发表的文献,由近及远进行逐一追踪的查找办法追查原文,再从这些原文后所附的参考文献逐一检索,象滚雪球 似的获得一批批相关文献的方法。它是科研人员常用的一种获得文献的简便途径。(2)常用法 常用法也称工具法,就是直接利用各种文献检索工具查找文献的方法。由于检索工具的种类繁多,一般都是根据课题内容特点,利用综合的检索工具和专业检索工具相结合的半分,这样致于文献资料的漏检。常用法根据时间范围又分为顺查法、倒查法和抽查法。(3)循环法 循环法也称分段法、交替法或综合法,这是追溯法和常用法的结合。是发挥前两个方法的优势分期、分段交替使用,直到搜索到满意的文献为止。2、电子文献的检索电子化图书馆、文献资料网络化服务等正是我们学习、工作和科研的有力助手,也正成为我们获取文献资料的必不可少的手段。掌握好网络信息的搜索 和策略,利用好电子文献和检索工具,对于计算机、数据库和互联网快速发展的今天是非常有必要的。而传统的图书检索手段和方法对电子信息的检索作用有限 。现代文献信息均能通过数字化的形式获得,如电子图书、电子期刊学位论文、会议论文、专利文献等等。电子文献检索途径主要有以下几种(1)网络目录和搜索引擎网络目录是按等级排列的主题类目索引,类别目录按一定的主题分类体系组织,排列方法有字母顺序法、时序法、地序法、主题法等或是各种方法综合使用 。用户通过逐层浏览类别目录、逐步细化的方式来寻找合适的资源直至找到具体文献内容。搜索引擎是各种资源进行标引,并为检索者提供检索的工具。主要强调的是它的检索功能,能提供布尔逻辑检索、短语或邻近检索、模糊检索、自然语言检 索等方式查询信息。基于搜索引擎的检索方法接近于熟悉的检索方法。即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索 ,获取检索结果,并输出给用户。(2)联机馆藏目录网络上有许多机构提供的馆藏书目信息、中外文期刊联合目录信息。比如中国国家图书馆提供网上图书目录在线检索,有题名、责任者、出版者、关键词、 标准书刊号、分类号、出版地、出版国等10个检索途径。全国高等教育文献保障体系(CALIS)提供61所高校的馆藏期刊、书目和学位论文联合查询。(3)网络数据库网络数据库由专门的信息机构或公司专业制作和维护,信息质量高,是专业领域内常用数据库。包括综合性和专业性期刊数据库、专利数据库等信息资源。 这类信息资源可分为商业性和非商业性的数据库。非商业性数据库是免费给用户使用,用户以较低的成本可获得大量所需的信息,所以也有很高的吸引力。(4)电子出版物越来越多的出版商注重网上报刊发行,因为网上信息传播速度非常快。目前国内外已有很多出版社和信息服务中介商介入电子出版行业。电子出版物有 电子图书、电子期刊和电子报纸。(5)参考工具书网络中许多参考资料是可以免费使用的,如新格罗夫音乐与音乐家大词典、英国大不列颠百科全书、汉语词典、学校或企业名录、中国国家统计局统计资料 等大型工具书已加入因特网。文献检索和使用的工作贯穿了论文写作的全过程。我们往往首先确定写作的大致内容,其次根据这个大致内容确定所要搜索的文献范围,然后在阅读了主要 的文献后确定研究写作的具体内容,最后根据具体内容全面检索原始文献,利用搜到的文献充实论文写作的基础。

187 评论

相关问答

  • 小说论文3000字模板

    1(1重视写人,尤其重视写人的思想性格,这是中国古典小说的艺术传统。 (2)受古典散文的影响,精于艺术构思。 (3)讲究语言精练,追求简约美。 (4)受民间传说

    继续改一个 4人参与回答 2023-12-08
  • 检索证明模板论文

    一、一般格式和顺序1.封面:(由文印中心统一制作)2.中文摘要:中文摘要,约300字以内。内容应包括工作目的、研究方法、成果和结论,要突出本论文的创造性成果,语

    只爱小火锅 3人参与回答 2023-12-08
  • 3000字毕业论文模板

    论文就是用来进行科学研究和描述科研成果的 文章 ,写作论文是要按照一定的格式来规范自己的论文的。下面是我带来的关于论文写作格式模板的内容,欢迎阅读参考!论文

    暖暖滴嗳 4人参与回答 2023-12-06
  • 3000字手写论文模板

    在一篇论文写作中,要写好的论文,就要有格式。这是我为大家整理的手写小论文格式,仅供参考!手写小论文格式篇一 《浅谈数学 教育 的数学价值及数学意

    一叶扁舟85 2人参与回答 2023-12-11
  • 艾滋病文献检索的论文3000字

    爱滋病传播途径及预防方法 摘要:艾滋病的医学全称为:"获得性免疫缺陷综合症",英文缩写"AIDS",是由人体感染人类免疫缺陷病毒即艾滋病毒(HIV)引起的免疫缺

    烧卖吃饱了 4人参与回答 2023-12-06