我爱娟子
信息检索技术论文 –基于网格的面向专业内容的Web信息检索1 引言近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。2 基于网格的面向专业内容的Web信息检索体系结构的设计 网格计算是近年来国际上兴起的一种重要信息技术,其目的是将网上各种资源组织在一个统一的大框架下,为解决大型复杂计算、数据服务和各种网络信息服务提供一个方便用户使用的虚拟平台,实现互联网上所有资源的全面连通,实现信息资源的全面共享。 为解决不同领域复杂科学计算与海量信息服务问题,人们以网络互连为基础构造了不同的网格,他们在体系结构,要解决的问题类型等方面各不相同,但网格计算至少需要具有三种基本功能:资源管理、任务管理、任务调度。本文设计的信息检索体系结构,围绕网格计算的基本功能及信息检索的特点,主要有以下三个层次组成:见图1(1) 网格结点:结点是网格计算资源的提供者,本系统主要是由一系列的集群系统组成,它们在地理位置上是分布的,构成了一个分布检索群体,作为信息共享的基础结构平台。集群系统负责整个集群范围内的信息管理,维护和查询。(2) 网格计算中间件:中间件是信息资源管理和用户任务调度、任务管理的工具。它是整个网格信息资源管理的核心部分,它根据用户的信息请求任务,在整个网格内负责信息资源的匹配、定位,实现用户任务到集群系统的映射。(3) 网格用户层:主要为用户应用提供接口,支持用户对所需要的信息资源进行描述、创建、提交等。 图1本系统的主要思想是在逻辑上将地理位置分散的、异构的信息划分、组建成多个集群系统,集群系统对集群内的资源进行管理和任务调度,再利用网格中间件对各集群系统进行管理,从而形成对整个网格资源的管理,并对用户的信息需求进行统一的管理和调度。这种管理模型既可以尊重各个集群系统的本地信息管理策略,又可利用中间件在全局意义上对网格信息资源进行管理。2.1 集群系统的设计由于Web信息资源数量十分庞大,用户在利用现有搜索引擎检索信息时面临一个海量数据的查询问题,往往造成在消耗巨大的通信资源后依然存在资源查不准、查不全的问题。目前基于单一系统映射的Web服务器集群系统能把若干服务器用局域网连接成一个整体,并使其从客户端看来就如同一台服务器在服务,这使得在逻辑上合并、组织地理位置分布的信息资源成为可能。因此本文首先考虑采用分布协作策略,将Web信息资源按地区按专业内容分割,一方面使信息资源数量相对缩小,便于数据的组织、管理和维护,另一方面按专业内容易于制定一个公用的XML规范,便于集群内各类信息资源的描述,从而可建立一个基于XML的面向专业内容的信息集成系统。集群系统的具体结构见图2。集群服务器主要由接口Agent,基于专业内容的XML信息集成系统、资源服务Agent、资源发布Agent等组成。其中接口Agent根据任务提供的接口参数登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。资源服务Agent根据信息资源请求任务,利用XML信息集成系统提供的数据,为用户提供实际的资源检索操作,并将检索结果信息发送给用户。资源发布Agent用于向网格中间件提供本地信息资源的逻辑数据及接口参数。下面主要说明基于专业内容的XML信息集成系统的构造方法:XML(the eXtensible Markup Language)是 W3C于1998年宣布作为Internet上数据表示和数据交换的新标准,它是一种可以对信息进行自我描述的语言,它允许开发人员通过创建格式文件DTD(Document Type Definitions)定制标记来描述自己的数据,DTD规范是一个用来定义XML文件的语法、句法和数据结构的标准。 XML使用普通文本,因此具有跨平台的优点,XML的优点在于(1)简单、规范性:XML文档基于文本标签,有一套严谨而简洁的语法结构,便于计算机、用户理解;(2)可扩展性:用户可以自定义具有特定意义的标签,自定义的标签可以在任何组织、客户、应用之间共享;(3)自描述性:自描述性使其非常适用不同应用间的数据交换,而且这种交换是不以预先定义一组数据结构为前提,因此具有很强的开放性;(4)互操作性:XML可以把所有信息都存于文档中传输,而远程的应用程序又可以从中提取需要的信息。XML数据是不依赖于某个特定的平台的应用,因此它为基于特定专业内容的表达提供了一种极好的手段,可以作为表示专业内容的语言。目前人们研制Web信息集成系统其基本方法可分成两类:存入仓库法(the ware-housing approach)和虚拟法(the virtual approach),可使用这两类方法利用XML在数据组织和交换方面的优越性,采用格式文件DTD和XML文档表示基于专业内容的集成模式和集成模式与资源之间的映射,建立基于XML的Web信息集成系统,其结构与获取信息的工作过程参见文献[2]。图22.2 网格中间件的设计图3所示的网格中间件的主要功能是(1)消除不同用户与集群系统之间数据表达的差异,使信息资源数据对用户来说是透明的;(2)管理、维护Web上分布的各集群系统,网格中间件以关系数据库方式记录所有集群系统及其所包含的专业内容的逻辑信息,对关系数据库的操作可维护集群系统的分布式逻辑,使本结构在可变性和扩充性上具有柔性;(3)接受用户的信息请求任务,能快速定位于满足要求的集群系统,通过对关系数据库的查询实现用户信息请求任务与集群系统的对应关系。内部主要功能模块说明如下:(1) 接收Agent模块:主要用于登记、接收、管理各种信息资源请求任务,并提供安全认证和授权。(2) 关系数据库及数据服务Agent:关系数据库记录了所有集群系统及其所包含的专业内容的逻辑信息。数据服务Agent提供集群系统对关系数据库的使用权限和对数据记录的增加、删除、检索和修改等操作。(3) 格式转换Agent模块:提供用户信息资源请求文档与各集群系统中文档的格式转换功能。由于XML是自定义的,各用户对同一数据有不同的表示方法(对信息资源描述存在差异)由于XML文档中这种格式差异体现在与之相关的DTD/Schema上,因此经过格式转换,可使信息资源的格式对用户是透明的。(4) XML文档分析Agent模块:提取格式转换后的XML文档中各个标签,通过查询网格中间件中的关系数据库,实现用户信息请求任务与集群系统的对应关系,并得到满足条件的集群系统的相关信息,获取各集群系统的接口参数。(5) 发送Agent模块:将转换过的信息资源请求XML文档发送到相应的集群系统中。其中Agent技术是解决分布式智能应用问题的关键技术,Agent是指能够自主地、连续地在一动态变化的、存在于其它系统中运行的、且不断于环境交互的实体。在系统中引入Agent可使系统具有人的特征,代表用户完成用户的任务,并能动态适应环境的变化更好地满足用户的需求,提高信息检索的能力。文秘杂烩网
明明来干啥
生物医学信息检索论文
当代,论文常用来指进行各个学术领域的研究和描述学术研究成果的文章,简称之为论文。下面是生物医学信息检索论文,请参考!
生物医学信息检索课程中双语教学研究
摘要: 本文探讨了双语教学在生物医学信息检索课程中的应用,小结了医学信息检索课程双语教学的方法和技巧,并基于教学实践,对潜在的问题提出了相应的解决方案。
关键词: 生物医学信息检索;双语教学;高等教育
0前言
21世纪全球经济一体化,科学技术飞速发展,英语作为国际上的全球化通用语言,其重要性不言而喻,它发挥的马太效应已经愈来愈明显。而我国传统的英语教育更侧重于理论知识的学习,对更为实际的语言应用能力则有所忽视,尤其是专业英语的教育存在较大的空白,导致相当多的学生在专业领域内英语的实际运用能力有限。但是现如今,无论是各类型企业还是科研机构,对同时具备良好的专业知识和高水平的英语应用能力的人才的需求非常大。可以说,作为高层次的人才,仅仅具备专业知识,而英语应用能力存在短板会极大地限制专业水平的进一步提高,降低国际交流与协作的效率,对职业生涯造成无法低估的伤害。高等教育应从多方面入手,努力培养有国际视野的“专业+英语”复合型人才,满足这一需求。双语教学作为一种与国际接轨的教学模式,一方面有利于提高学生的英语学习能力,另一方面可以更快速更全面地获取专业相关的科技进展,有利于提升学生的专业水平。而生物医学信息检索是一门关于信息获取、知识更新的课程,只有当学生具备良好的英语能力,才能更高效更全面地获取最前沿的信息,学习最先进的知识,更好地服务于生物医学行业。将双语教学应用于生物医学信息检索,是一个事半功倍的方法。①②笔者在生物医学信息检索的双语教学实践中,总结了一些方法与技巧,并对其潜在的问题提供相应的解决方案。
1方法与技巧
1.1精选教材且及时调整课程难度
“工欲善其事,必先利其器”,双语教学的首要问题便是双语教材的选择,教材选择的好与坏,直接影响着教学效果的好坏。教育部高等教育司曾提出:“在有条件的高等学校的某些信息科学和技术课程中推动使用国外优秀教材的影印版进行英语或双语教学,以缩短我国与国际先进水平的差距,同时也有助于强化我国大学生的英语水平。”原版外文教材在内容上更具有前瞻性、专业的前沿知识也更加规范和优越,更利于学生接触到新知识,选择原版外文教材也是营造全英文环境的一个有利措施,可以高效率地学习专业词汇的使用、专业内容的表达。但是,到目前为止,我国的生物医学信息检索的双语教材选择比较少。而直接采用美国等发达国家的生物医学信息检索原版教材,其课程内容并不一致,而且由于国外教材是按照英文的思维方式编写的,对于学生来讲难度较大,会对学生造成很大的学习压力。综合以上原因,我们在授课中参考了国外的一部分原版教材以后,自编了适合学生全英文的教材和练习。该教材兼顾学生按教学大纲要求掌握专业知识和基本技能,重点强调与现行的生物医学前沿进展的联系。最后在教学实践过程中,根据学生的学习和掌握情况随时进行修改和调整。
1.2多媒体教学结合上机实践
现代计算机和网络的普及大大减轻了双语教学中的困难。随着网络技术的发展和网络信息资源的大幅度增长,生物医学信息检索也更多地在网络上进行。为了配合这一现实的应用现状,我们在教学中采用了教师多媒体讲授和学生上机实践相结合的方式,旨在让学生们能摆脱纸上谈兵的桎梏,充分地将字面的知识固化为自己掌握的本领,能利用网络进行生物医学信息的检索。教师在教学中利用课件控制,对临场情况做出及时的响应调整教学策略和学习内容,以适应动态教学环境所带来的变化。在多媒体演示教学环境中,老师可将操作过程和所得到的结果展现在学生面前,让学生亲自动手操作,以使学生对知识的理解更加具体透彻。上机实践使得整个教学环境由静态向动态转变。这个方式一则是充分发挥学生的积极主动性,从老师“教”转化为学生“学”,二则有利于学生将理论学习和技能提升有机地结合在一起。这一方式在没有增加学时的情况下,本科生的生物医学信息检索课程的教学质量有了比较大的提升,得到学生的普遍好评。
1.3小班教学增强师生交流
双语教学要考虑到学生之间的水平差异,采用小班教学的模式。我们在教学中发现双语教学的最大困难在于学生之间存在专业英语水平的差异,尤其是对于生源来源广泛的民族院校,这种情况尤其突出,教师如何平衡这种差异、并且及时调整教学的进度和难度是重中之重。而小班教学的方式能够保证信息的充分交流和师生的顺畅沟通,有利于增进学生对专业知识的理解和应用,也可以给授课老师及时反馈。小班教学可以营造一个良好的每个人都可以参与其中的双语氛围,获得更好的教学效果。
2问题与对策
2.1加强专业英语学习
笔者在双语教学实践中发现,教学效果的好坏很大程度取决于学生自身的英文水平,尤其是专业英文水平。当学生的专业英文水平有限的'时候,会出现不能理解关键词的准确含义、无法阅读摘要的主要内容,进而不能获得所需要的信息。在这种情形之下,无论老师如何讲授信息检索的原理,介绍信息检索的方法,对于学生来讲,都会出现茫然不知所措的状态。比如说指定检索癌症相关信息,部分同学只知道cancer可以表示癌症,不知道还有tumor、carcinoma也可以表示癌症,并且词义在医学领域存在差异。再比如,在表述胃癌的时候,可以用stomachcancer,也可以用gastricCancer。针对这一情况,笔者在授课之初会详细讲解MeSH(MedicalSubjectHeadings),即由美国国家医学图书馆建立的一套完整详细的生物医学领域的主题词库。同时,笔者也建议先导课的专业课老师在授课的过程中,尽量采用全英文幻灯片展示,中英文对照学习的方式。上述措施可以有意识地帮助学生扩大专业词汇量和帮助学生理解专业描述,进而帮助学生克服双语教学中的最大障碍。这是从根本上解决双语教学对于学生来说较为困难的方式,也唯有真正具备良好的专业英语水平才可以从本质上掌握生物医学信息检索的方法,才能够满足今后的学习和工作的需求。另一方面,对于生物医学数据库的英文界面不熟悉才会增加学生学习的难度。笔者比较困惑的是,在上课之初,一部分同学不太理解starmenu的含义,对于全英文界面的数据库NCBI(NationalCenterforBiotechnologyInformation),ScienceDirect,Highwire,以及软件Endnote初次接触的时候更是如同看天书。这本身并不困难,但是会极大地增加学生的心理压力,所以这需要授课老师对界面进行详细的讲解和介绍,并给予学生足够的时间去熟悉界面,达到能够熟练掌握的水平,消除学生的畏难心理。
2.2循序渐进
为了避免在学习过程中,学生出现习得性无助的情况,双语教学一定要采用循序渐进的方式进行。切忌一开始就加重学习任务加大学习难度,这样的结果是多数同学会跟不上老师的进度,产生严重的厌学心理,进而会完全放弃这门课程的学习。教师授课以前需要对学生的英文水平和专业覆盖面有一个大概的了解,和学生沟通交流他们的学习兴趣、需求和困难所在,并根据获取的信息结合教学大纲及时调整授课的内容、重点和难点。当学生第一次接触到该门课程的双语学习时,教师需利用其最初的新奇感和参与意识激发同学们的学习兴趣,从简到难的学习进度中,让同学们自主地参与到课程的学习中来,收获到成功的喜悦是进一步深入学习的强大动力。教师在课堂讲授中要循序渐进地增加英语表达的比例,在遇到部分专业词汇时需要做详尽的中文解释;在遇到英文表意较为复杂的情况也需要辅以中文指导,全场和学生保持沟通顺畅,把握教学难点和内容。双语授课不能单纯为了英文表达而表达,忽视了学生在课堂上专业水平的提升。同时也可以让学生自发组成学习小组,让英语基础比较好的同学带动其他同学的学习,同学之间互相促进互相合作,形成一个良好的互动氛围,从教师的“教”彻底转变为学生的“学”,让所有的同学参与到这个过程中来,避免个别同学落后于集体学习进度的情况。
3结语
双语医学信息检索这门课程既有利于学生英语应用能力的提高,同时也有利于学生专业知识的扩展和深化,可以极大地增强学生在今后的深造和就业中的竞争力。虽然这门课中还存在很多问题有待我们做进一步思考与改进,但是只要我们勇于拓新,这门课一定会发挥其作用、展现其价值。随着高等教育中教育理念的更新,双语教学在医学信息检索教学课中的运用会真正服务于学生,服务于社会。
我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋
《学术论文写作与发表指引》(王雨磊)电子书网盘下载免费在线阅读 链接: 书名:学术论文写作与发表指引 作者:王雨磊 豆瓣评分:6.9 出版社:中国人民大学出版社
高校文献信息检索的必要性与有效方法论文 在学习、工作中,大家总免不了要接触或使用论文吧,论文可以推广经验,交流认识。如何写一篇有思想、有文采的论文呢?以下是我收
计算机信息管理专科毕业论文计算机信息技术的管理尹全喜摘要:大量的信息数据被储存到计算机中,如何建立一个稳健的信息系统是一个需要研究的话题。本文概述了信息系统以及
本书是一部具有参考工具书特点的学术研究入门与信息素养教育读本,其整体框架有别于其他同类书籍。编著者将文献信息检索、学术规范与论文写作看作学术研究的基本要素,并置