• 回答数

    4

  • 浏览数

    337

欧罗百利
首页 > 期刊论文 > 情报学报审稿界面

4个回答 默认排序
  • 默认排序
  • 按时间排序

开心宝贝萱萱

已采纳

internet技术与应用基于Internet的信息资源发现技术与实现王继成 邹 涛 杨小江 潘金贵 张福炎摘 要:Internet上大量、异质、分布、动态的信息造成了“信息过载”.在信息充斥的情况下,如何有效地为用户提供基于Internet的资源发现服务已经成为一项重要而迫切的研究课题.搜索引擎部分地解决了资源发现的问题,然而其效果却远不能使人满意.文中首先提出了分布协作式资源发现策略,讨论了资源发现服务中所涉及的几项关键技术,包括:多维文档立方体数据模型、Web文档检索、基于的书目检索以及基于Agent的用户接口等,并给出了相应的解决方案.在此基础上,文中构造了一个系统原型RDSCC,以有效地提高Internet上资源发现的质量.关键词;资源发现,多维文档立方体,Web,,Agent中图法分类号:TP391; TP393THE TECHNOLOGY AND IMPLEMENTATION OF RESOURCEDISCOVERY ON INTERNETWANG Ji-Cheng, ZOU Tao, YANG Xiao-Jiang, PAN Jin-Gui, and ZHANG Fu-Yan(State Key Laboratory for Novell Software Technology, Nanjing University, Nanjing 210093)(Department of Computer Science and Technology, Nanjing University, Nanjing 210093)Abstract A mass of heterogeneous, distributed, and dynamic information on Internet has resulted in “information overload”. With the flood of information, it has become an important research issue to provide users with effective service of resource discovery on Internet. Search engines attempt to solve this problem, yet their effect are far from satisfying. In this paper, a distributed cooperative strategy for resource discovery on Internet is firstly presented. Then, several key technologies involved in resource discovery are studied, including data model, Web document retrieval, bibliographic retrieval based on , and agent-based user interface. Finally, a system prototype RDSCC is designed to improve the quality of resource discovery on words resource discovery, multi-dimension document cube, Web, , agent1 引 言人们已经进入信息极大丰富的时代.一方面,信息来源广泛,包括Web文档、图书文献,数字化资料等,这些异构的信息分布在Internet空间中;另一方面,信息量巨大.以Web文档为例,目前已经拥有3亿页面,而且这个数字仍以每4至6个月翻一倍的速度增加〔1〕.面对信息的海洋,人们觉得力不从心,往往花费了很多时间却所获甚少.在这种情况下,如何有效地提供基于Internet的资源发现服务,以帮助用户从大量信息资源的集合中找到与给定的查询请求相关的、恰当数目的资源子集,也就成为一项重要而迫切的研究课题.传统的搜索引擎,例如AltaVista,Yahoo等,试图解决Internet上的资源发现问题.但是,从资源覆盖度、检索精度、检索结果可视化、可维护性等诸多方面来看,其效果远不能够令人满意.此外,搜索引擎仅提供对Web文档的检索,缺乏对书目文献等其它重要信息资源的支持.在本文中,我们针对Internet资源发现的现状,提出了分布协作式资源发现策略,同时,讨论了资源发现服务中所涉及的几项关键技术,其中包括:多维文档立方体数据模型、Web文档检索、基于的书目检索以及基于Agent的用户接口等.在此基础上,我们设计了一个系统原型RDSCC,以有效地提高Internet上资源发现的质量.2 资源发现的分布协作策略我们注意到,搜索引擎采用的是典型的集中方式,它们试图遍历整个Web,对其上所有的文档生成索引,供用户检索.这种集中方式给Web文档检索带来了一些严重的弊端,主要表现在:①覆盖度有限,据估计,任何一个搜索引擎索引的Web页面都不到页面总数的三分之一〔2〕;②维护困难,搜索引擎索引数据库的更新频率有限,往往会产生索引失效〔3〕;③消耗太大,包括网络带宽、搜索引擎自身昂贵的硬件设施等.元搜索引擎,例如MetaCrawler,通过综合多个搜索引擎的结果,在一定程度上扩大了覆盖度.但是,元搜索引擎对搜索引擎的依赖,使它无法从根本上解决上述问题.随着信息资源的种类和数量的急剧增长,集中方式使得上述弊端更为恶化.一方面,需要管理的信息资源极其巨大,任何一个集中式资源发现系统都无法完全满足需求;另一方面,各个集中式资源发现系统各行其是,重复建设.因此,我们认为,Internet上的资源发现应该采取分布协作的策略.资源发现的分布协作策略,是指按照某种原则对Internet上的信息资源空间进行划分,得到若干个信息资源子空间.对于每个子空间,分别建立一个资源发现系统以提供相应的资源发现服务.目前,分布计算以及多Agent系统等领域的研究已经取得了丰硕的成果,可以用于集成这些自制、异构的资源发现系统,从而构成Internet上的协作检索群体.信息资源空间的划分原则可以是按照学科领域,也可以按照地理区域等.例如,我们可以为各种不同专业的科研人员建立专业领域资源发现系统.用户可以根据自己的需要向相应的系统提出请求.采用分布协作的资源发现策略,各个资源发现系统所要管理的信息资源相对缩小,可以降低消耗,便于维护;同时,各系统之间通过相互协作,扩大了覆盖度.可见,这种策略可以有效地克服集中方式的不足,提高资源发现服务的质量.3 资源发现服务中的关键技术资源发现系统的开发是一个涉及多领域、多技术的复杂工作.其中,数据模型是系统的核心,Web文档和书目数据是系统的两个重要信息来源,而用户接口的好坏直接决定了系统的使用效率.下面,我们对这几项关键技术分别加以讨论,给出相应解决方案. 数据模型就管理信息资源而言,数据库优于平面式文件系统.因此,资源发现系统通常采用文档数据库来存储异构的信息资源.文档数据库的内部实现一般采用半结构化的逻辑模型,而其外部表现,即反映给用户的视图,则构成了资源发现系统的概念模型.例如,搜索引擎返回给用户的通常是一个顺序固定的线性列表,其中包含了Web文档的标题、URL和摘要.在这种概念模型中,用户必须逐个地浏览以找到相关文档,花费了大量的精力.当返回的结果数目众多时(这种情况非常普遍),这个问题更为突出.对用户行为的有关研究表明,用户经常希望能够从多个角度观察信息资源,而不满足于简单的、固定的列表.OLAP是数据库环境中的一种有力的分析工具,它为用户提供了关于数据的多维视图〔4〕.虽然Web文档等信息资源和数据库有着本质的区别,但我们认为OLAP技术对其仍有借鉴之处.下面,我们引入多维文档立方体作为资源发现系统的一种新的概念模型.定义1. 维d,是指人们观察文档的角度.例如,某个用户希望从时间、机构等角度来观察文档.用户也常常关心某个主题分类的文档情况.这里的时间、机构、主题分类等元数据就构成了文档的维.定义2. 多维文档立方体CDocument,是指以文档Document为中心,以文档的元数据(维di)分布在文档的周围,从而构成的一个超级立方体(d1, d2,…,dm, Document).在多维文档立方体上,可以进行各种多维分析操作,包括:切片、切块、旋转、上钻、下钻等,从而生成多种文档视图,使用户能够从多个角度观察文档资源的各种特征,深入了解包含在其中的信息内涵.例如,用户可以通过切片从文档集合中来选择某个机构的文档子集.在该子集中,按照主题内容来分组,在同一个主题内按照时间进行排序.用户既可以通过上钻来折叠视图,观察每个主题的总体特性;也可以通过下钻来展开视图,观察每个子主题或每个文档的具体特性.如图1所示.图1 文档超立方体与多维文本视图除了能够为用户提供有效的可视化手段以外,在多维文档立方体上还可以进行统计分析,从而能够揭示文档资源中的特征分布.例如,我们可以比较不同的机构在不同的时间中关于各个主题的文档的情况,从而回答一些搜索引擎无法回答的问题,例如“近年来哪所大学在图形图像领域中发表文章最多?”.需要说明的是,上述多维文档立方体和多维文档分析必须建立在利用计算机语言学和信息处理技术对文档资源进行预处理的基础之上.文档维来自于预处理所得到的元数据,例如时间、作者、主题等. Web文档检索目前,Web已经成为人们获取信息的重要来源. Altavista等搜索引擎的检索算法相对简单,检索精度有限,这使得检索到的Web文档的相关性得不到保证〔3〕.Yahoo通过对Web文档进行分类以方便用户的浏览和查找,但分类工作由人工完成,大大影响了其处理的页面数目(Yahoo! 对Web文档的覆盖度远远小于Alta-vista等).为此,我们设计了一种新的Web文档检索模型,包括语料库维护、词典维护、Robot、特征矢量生成器、训练器、分类器等6个部分组成,如图2所示.该模型能够分析用户的信息需求,然后自动搜集满足目标特征的Web文档供用户查阅.图2 Web文档检索模型在该模型中,我们采用了常用的向量空间模型(vector space model,VSM)〔5〕作为用户信息需求和文档特征的表示方法.VSM将每一个(或每一类)文档映射为由一组范化正交词条矢量所张成的向量空间中的一个点.每个用户信息需求或未知文档都可以表示为该向量空间中的一个特征矢量(T1,W1;T2,W2;…,Tn,Wn),其中Ti为特征词条项,Wi为特征词条权值.这样,文档与用户信息需求的匹配以及文档的分类都转化为向量空间中的矢量匹配处理.该模型的工作分为训练和分类两个阶段.(1) 在训练阶段,用户首先建立语料库,即给出一批代表其信息需求的示例文档(每个文档被标上一个类别标识).特征矢量生成器利用词典库(常用词典和专业技术词典)将训练文档表示为一系列特征矢量.训练器对每类训练文档的特征矢量进行统计,生成代表该类的特征矢量.(2) 在分类阶段,Robot模块首先将Web文档收集到本地.特征矢量生成器将本地的待分类文档表示为一系列特征矢量.分类器将待分类文档的特征矢量与训练器生成的类别特征矢量进行相似度匹配以得到文档的分类,并将符合相似度阈值条件的已分类文档返回给用户.经实用表明,该模型能够对大量Web文档进行自动、快速地分类〔6〕.由于使用了专业技术词典,分类精度明显高于面向普通文档的系统,较好地保证了检索到的Web文档与用户需求的相关性. 基于的书目信息检索图书文献是人们获取信息的另一个重要来源,因此联机书目检索是资源发现系统的重要组成部分.图书馆的联机书目检索服务传统上是通过Telnet方式提供的.近年来,许多图书馆采用Web加CGI的形式为书目检索提供图形化界面.这些服务方式的一个重要缺陷在于各个图书馆的书目检索界面不一致,用户要检索每个图书馆就必须熟悉相应的界面.为此,ISO制定了协议,作为检索远程图书馆书目的标准〔7〕.是一个运行在TCP/IP协议之上的应用层协议.它规定了客户机查询服务器以及提取结果记录等过程中所涉及的数据结构和数据交换规则,从而解决了现存书目数据库检索接口的异构性问题.目前,该标准已经被国外许多图书馆所采纳,但国内尚未有一家图书馆提供基于的书目检索服务.我们设计了一个基于的联机书目检索模型,并在此基础上成功地开发出国内第一套基于的书目信息检索系统〔8〕,如图3所示.图3 基于的书目信息检索模型在该模型中,图书馆的书目存放在数据库服务器的一个或几个书目数据库中.服务器在约定端口上侦听用户的连接请求(InitRequest).在成功地建立连接后,客户发出查询请求(SearchRequest),服务器将接收到的“抽象的”标准查询转换为“具体的”SQL查询,提交给后台数据库服务器执行,生成查询结果集.然后,服务器将查询的执行情况以及部分结果返回.客户可以多次发出提取请求(PresentRequest)来获得结果集中的所有书目数据.为了使一个客户能够同时查询多个图书馆的书目,我们在客户端采用多进程(多线程),和多个服务器并发地建立连接,并对查询结果进行后处理,包括综合各进程的查询结果、消去其中重复出现的书目等. 基于Agent的用户接口在资源发现系统中,用户接口在用户与信息资源之间起着桥梁作用.由于信息资源的大容量、动态性和复杂性,传统的人机交互方式显得无能为力.基于Agent的用户接口被认为是解决人机交互问题的一个突破口〔9〕.目前,Agent技术的研究虽然十分流行,但对于其定义和特征还没有统一的结论.我们从软件抽象的角度出发,给出如下定义.定义3. Agent是一种抽象手段,它既可以用来描述复杂系统又能够描述系统与用户之间的交互.定义4. 用户接口Agent是用户在与计算机系统接口时使用的一种形象化抽象,可以简要地表示为一个四元组(Task, Knowledge, Constrain, Status).其中,Knowledge是知识库,保存从外界学习到的知识,例如用户的信息需求和爱好等;Constrain是约束条件集合,例如用户对Agent运行时间作出的限制等;Status是Agent运行状态的集合;Task是任务求解模块,它在知识库、约束集、状态集的基础上运用推理规则处理事件及完成任务.在用户看来,用户接口Agent是一个半自主的应用程序.一方面,它拥有知识,了解用户的需求和爱好,能够代表用户智能地完成某个任务,并具有学习和适应能力;另一方面,它受用户的控制.用户可以观察它的活动状态,也可以临时性地暂停或恢复其活动,甚至将它永久性地撤销.用户接口Agent在资源发现系统中执行的任务是多种多样的.当系统中增添了用户感兴趣的信息资源时,Agent将通知用户. Agent也可以根据用户的需求或偏爱对信息资源进行过滤,建立个性化的界面.可见,基于Agent的用户接口为用户与复杂、动态的信息世界进行交互提供了重要手段.4 基于Internet的资源发现系统原型在上述讨论的基础之上,我们开发了的一个资源发现系统原型RDSCC(resource discovery system for computer community). RDSCC是一个面向计算机学科领域的专业资源发现系统,其目的是为该领域的研究人员提供Internet资源发现服务以掌握本专业的全面、最新信息.该系统结构如图4所示.图4 Internet资源发现系统原型RDSCCRDSCC由8个模块组成.其中,文档数据库系统负责管理半结构化文档资源.为了提高易用性,我们采用Web服务器来向用户提供资源发现服务.转换器作为Web服务器和文档数据库系统的中介,可以将文档数据库的内容转换成HTML格式,也可以把用户输入转换成对文档数据库系统的操作.Web文档收集与分类器下载符合用户信息需求的有关计算机方面的Web文档并进行自动分类.元数据抽取器从已分类文档中抽取文档元数据,导入器将文档和元数据存储到Web文档库中,并建立索引.网关提供基于的书目检索服务,依据用户通过HTML表单提交的查询请求(包括查询哪些图书馆以及何种计算机书目),同时查询多个图书馆的服务器.用户利用浏览器可以进行各种多维文档分析操作,从多个角度来阅读和检索文档库的内容.系统还利用Agnet技术为用户提供了配置(profile)机制,用户可以订阅文档,定制浏览界面.5 结束语在信息充斥的情况下,基于Internet的资源发现服务是一个具有极大潜力的研究方向,用户可以从分布的不同资源发现系统中获取所需的信息资源.本文提出了分布协作式资源发现策略,对资源发现系统开发中所涉及的数据模型、Web文档检索、书目检索以及用户接口等关键技术作了研究,并简要介绍了一个网络信息服务系统原型RDSCC.在该领域仍有许多问题值得深入探讨,包括:在DCOM/CORBA计算环境上实现多个资源发现服务器之间的分布协作;利用HTML、XML等规范从Web文档中抽取元数据等等,这些都将是我们下一步要进行的工作.*本课题得到江苏省“九五”科技重点攻关项目(项目编号BE96017)和江苏省教委图书馆自动化项目资助.作者简介:王继成,男,1973年6月生,博士研究生,主要研究方向为计算机网络、信息处理.邹涛,男,1970年11月生,博士研究生,主要研究方向为计算机网络、信息处理.杨小江,男,1965年6月生,博士研究生,主要研究方向为超媒体、信息处理.潘金贵,男,1952年1月生,教授,主要研究方向为中间件、Agent技术.张福炎,男,1939年11月生,教授,博士生导师,主要研究方向为多媒体、CAD与图形学、信息处理.作者单位:南京大学软件新技术国家重点实验室 计算机科学与技术系 南京 210093参考文献1 Gudivada V N et al. Information retrieval on the world wide web. IEEE Internet Computing, 1997, 1(5): 58~682 Lawrence S, Giles C L. Searching the world wide web. Science, 1998, 280(5360): 98~1003 Lawrence S, Giles C L. Context and page analysis for improved web search. IEEE Internet Computing, 1998, 2(4): 38~464 王珊等. 数据仓库技术与联机分析处理. 北京:科学出版社, 1998(Wang Shan et al. The Technology of Data Warehouse and OLAP(in Chinese). Beijing: Science Press, 1998)5 Salton G et al. A vector space model for automatic indexing. Communications of ACM, 18(5): 613~6206 邹涛, 王继成, 张福炎等. 基于Web的资料搜集系统的设计与实现. 情报学报, 18(3): 195~201(Zou Tao, Wang Jicheng, Zhang Fuyan et al. The design and implementation of an information gathering system. Journal of the China Society for Scientific and Technical Information(in Chinese), 18(3): 195~2017 ANSI. Information Retrieval(): Application Service Definition and Protocol Specification. ANSI/NISO . Bethesda, MD: NISO Press, 19958 杨晓江, 张福炎等. 利用提供联机书目检索服务. 软件学报, 10(8): 824~828(Yang Xiaojiang et al. Bibliographic retrieval based on . Journal of Software(in Chinese), 10(8): 824~828)9 Baecker R et al. Readings in Human-Computer Interaction: Towards the Year 2000. Morgan Kaufmann Publishers, 1995

146 评论

美丽的大蒜君

仅供参考论文突然在知网找不到 可能就是由于出版周期,上网周期的原因,就是时间还没到,说简单点就是还在排队上传中,你所发表的那本刊物的刊期还在上传之前的几期,一般正常情况是出版后1-3个月文章在知网可检索。那么你也不必要担心,大不了多待一段时间罢了。也有可能你

82 评论

玉米大叉叉

pdf文献,不便复制,要的话请联系我邮箱(点我可见)。Internet的技术与应用(上) CAJ原文下载 PDF原文下载 【作者】 吴克忠. 【刊名】 电子展望与决策 1996年02期 编辑部Email CJFD收录期刊 【机构】 电子工业部第六研究所. 【聚类检索】 同类文献 引用文献 被引用文献 【摘要】 Internet的技术与应用(上)电子工业部第六研究所吴克忠编者按:从本期起我们在“专题讲座”栏目中刊登吴克忠老师的“internet的技术与应用”讲座,全文共五部分:Internet的发展史、有关技术、提供的服务、网上资源和安全性等,以飨读者。近年... 【光盘号】 INFO9601 Internet的技术与应用(下) CAJ原文下载 PDF原文下载 【作者】 吴克忠. 【刊名】 电子展望与决策 1996年03期 编辑部Email CJFD收录期刊 【机构】 电子工业部第六研究所. 【聚类检索】 同类文献 引用文献 被引用文献 【摘要】 Internet的技术与应用(下)电子工业部第六研究所研究员吴克忠真克忠先生PPP(pointtopointprotocol)也是串行通信中提供传输包的Internet标准。它包括三部分:串行网络上包的封装(AsyncHDLC)、链路控制通后协议(L... 【光盘号】 INFO9601

258 评论

爱米利的米粒

1、信息素养或素质的具体内容要求又哪些?信息素质是指用户在利用以计算机机器网络技术为代表现代科学技术进行知识学习、成长的过程中,逐渐形成的主动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。信息素质是一个内涵机器广泛的综合行概念,包括强雷的信息意识、系统化的信息理念、综合信息能力等内容。1)信息素质的体系结构一般来讲,信息素质的体系结构由信息意识、信息知识、信息能力三个方面组成。2、信息、知识、情报、文献的概念?(1)信息:信息与现代科学技术息息相关,是当代科学技术发展的产物,从某种程度上说,信息体现为一种载体,承载知识内容。20世纪90年代后一些关于信息的经典定义:1)信息是人们根据一定的目的和需要,把自然现象和社会现象中搜集的院士材料进行加工、处理,找出其中关系二形成的对象实体。2)信息是有一定含义的、经过加工处理的、对决策有价值的数据,即信息=数据+处理。(2)知识:是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的以求经验的总和。(3)情报:在关于情报要领的讨论中,所提出的情报定义大都与信息知识有关。如情报是“被人们所利用的信息”、“被人们感受并可交流的信息”;情报是“为了解决一个特定问题所需要的知识”、“借助语言、符号在载体上传递的知识”等。显然,对情报概念的定义分成两派——“信息派”和“知识派”。(4)文献:一是《文献情报术语国际标准(草案)》(ISO/DIS5127)定义:为了吧人类知识传播开来和继承下去,人们用文字、图形、符号、音频和视频等手段将其记录下来,或写在纸上,或洒在蓝图上,或摄制在感光片上,或录到唱片上,或存在磁盘上,这种附着在各种载体上的记录统称为文献。一是《中华人民共和国国家标准•文献著录总则》()的定义:文献是记录有知识的以求载体。3、信息、信息资源有哪些类型?(1)信息:(2)信息资源:信息源、信息服务、信息系统4、文献有哪些类型?将文献分成这些类型的依据是什么?(1)根据载体材料、存储技术和传递方式划分:印刷型、缩微型、视听型和嫉妒型(2)根据加工程度的不同划分:一次文献信息源、二次文献信息源、三次文献信息源(3)根据文献信息源的内容形式划分:图书、期刊、报纸、科技报告、政府出版物、会议文献、专利文献、学位论文、标准文献、档案文献、产品样本5、数据库的类型?网络资源有哪些特点?数据库的类型:网络资源特点:数量庞大、增长迅速;内容丰富、形式多样;变化频繁、价值不一;结构复杂、分布广泛;信息分散、无序等。6、何为“核心期刊”?本专业的核心期刊有哪些?(1)核心期刊:在某一学科中 ,少数期刊覆盖了该学科的大部分文献 ,而多数期刊仅包含该学科的少量文献 ,这少数期刊就是该学科的核心期刊。(2)本专业的核心期刊:《机械工程学报》《中国机械工程》《摩擦学学报》《机械科学与技术》《机械设计》《仪器仪表学报》《计算机集成制造系统》《润滑与密封》《机械传动》《机床与液压》《工程机械》《机械设计与研究》《起重运输机械》《轴承》《流体机械》《光学精密工程》《制造业自动化》《机械设计与制造》《水泵技术》《液压与气动》《制造技术与机床》《仪表技术与传感器》《压力容器》等7、什么是信息检索?信息检索的类型有哪些?信息检索:是通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。信息检索的类型:文献检索、数据检索、事实检索、手工信息检索、脱机信息检索、联机信息检索、光盘信息检索、网络信息检索8、简述信息检索的原理?是根据读者需求,确定检索概念及其范围,然后选择一定的检索语言,并将此检索概念转换成检索特征标志后到检索系统中查找文献线索,最后对其进行逐篇筛选,以确定需要阅读的文献。即检索指提供一定的检索手段,按照一定的检索方法,根据读者需要,迅速全面地查出文献线索,这是文献检索输出的过程,可见存贮是检索的基础,检索是存贮的目的。9、什么是计算机信息检索系统,它由哪几个部分组成?计算机信息检索系统是信息检索所用的硬件资源、系统软件和检索软件的总合。组成部分:硬件、软件、数据库10、计算机检索技术有哪些?计算机检索技术是指利用现代信息检索系统,如联机数据库、光盘数据库和网络数据库检索有关信息二而采用的技术,11、从外表特征与内容特征来看,检索语言的类型各有哪些?不同特征各举一简单的检索式。外部特征:题名、著者姓名/单位名称、出版事项、代码/序号等。如《围城》内部特征:分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。如关键词:机械12、为什么要创建“检索语言”,它有哪些类型?比较分类语言和主题语言的优缺点。①原因:创建“检索语言”后检索会更加方便快捷。②类型:外部特征、内部特征③分类语言具有单维性特点,适用于按学科体系进行族性检索,但不适用于多维性的、按专题概念进行的特性检索。主题语言,不论是叙词法还是标题法,具有直接性、专指性、灵活性等优点,克服了体系分类法只能从一种概念为中心检索文献的缺点,但缺乏族性检索能力又成了它的缺点。13、信息(文献)检索的方法与途径,详细论述检索步骤?信息(文献)检索的方法:⑴ 常用法:是指在文献检索中经常使用的方法,可细分为:顺查法--是以检索课时的起始年代为起点,按时间顺序由远及近地查找,直到查得的文献信息可以满足要求为止,这种方法系统、全面、可靠。 倒查法--是一种由近及远地查找文献的方法一般用于新开课题,比较注意近期的文献,以便掌握最近一段时间该课题所达到的水平及研究和动向。抽查法--是针对学科发展特点,抽出其发展迅速、发表文献较多的一段时期,逐年进行检索的一种方法,能以较少的时间获得较多的文献。⑵ 追溯法:这是利用已有的文献后面的参考文献进行追溯查找的方法这是在没有检索工具或检索工具不全的情况下使用的一种方法,但这种方法查找的文献不全,目前已很少有人使用。⑶ 分段法:这是将常用法与追溯法交替使用的一种方法即利用工具书检索文献,又利用文献后面的参考文献进行追溯,两种方法交替使用,直到满足读者需要为止。这种方法可根据文献和本单位工具书收藏的情况分期分段交叉运用不同的查找方法,既能获得一定时期内的文献,还可节约查找时间。信息(文献)检索的途径:文献信息检索有两种不同的检索途径。根据文献的特征检索文献信息是最简捷的途径。其特征有两个:一是文献的外表特征,即“著者、书名、刊名、号码”等;二是内容特征,即“分类、主题、关键词”等。文献检索的步骤:人们的检索课题和需要虽各不相同,但为了达到检索目的,都要利用一定的检索工具按照一定的途径与方法才能把需要的文献检索出来。一般而言,要经过以下几个步骤: 分析研究课题→明确检索目的和要求→选择检索工具和检索方法→选择检索途径和检索标志→查找文献线索→整理检索结果→索取原文。14、什么是文献线索?列举五种以上不同文献类型(期刊论文、会议论文、图书、标准等)的线索。文献线索:文献检索的概念有狭义和广义之分。狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。这里的文献集合,不是通常所指的文献本身,而是关于文献的信息或文献的线索。如果真正要获取文献中所记录的信息,那么还要依据检索所取得的文献线索索取原文。广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。15、简述“超星电子图书馆”、“书生之家数学图书馆”、“中国学术期刊全文数据库”、“维普中文科技期刊数据库”和“万方数字化期刊”收藏资源的特点。超星电子图书馆:内容丰富,包括经典理论、哲学、社科、经济、语言文字、文学、数理化、生物、工业技术、计算机等五十余个学科分类,现拥有中文电子图书80万种,论文300万篇,全文总量4亿余页,并且每天仍在不断的增加与更新。书生之家数学图书馆:是一个基于互联网的全球性中文书刊网上开架交易平台,下设中华图书网、中华期刊网、中华报纸网、中华CD网等子网,集成了图书、期刊、报纸、论文、CD等各种出版物的书目信息、内容提要、精彩篇章、全文等内容,是著书、出书、售书、购书、读书、评书的网上交流园地。中国学术期刊全文数据库:中国期刊全文数据库(SupFree5CJFD)SupFree6是以中国学术期刊电子杂志社编辑出版的《中国学术期刊(光盘版)》全文数据库为核心,SupFree0目前已收录94年以来5300种期刊的全文文献,SupFree0读者可以利用任何一台校园网终端检索、SupFree3浏览、SupFree3下载和打印文摘索引和全文信息。SupFree1维普中文科技期刊数据库:全文版:从1989年至今的8000余种期刊刊载的1370余万篇文献,并以每年150万篇的速度递增。涵盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的8000余种中文期刊数据资源。引文版:从1989年至今公开出版的5000余种科技类期刊(其中包括《中文核心期刊要目总览》中的核心期刊1500余种),总数据量约224万篇文献。全面覆盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等信息资源。文摘版:从1989年至今的8000余种期刊的980余万篇文献,并以每年150万篇的速度递增。全面覆盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等信息资源。万方数字化期刊:目前集纳了理、工、农、医、人文五大类70多个类目的2500多种科技类核心期刊,实现全文上网。从2001年底开始,数据化期刊已囊括我国所有科技核心期刊,成为中国网上期刊的第一大门户。主要包括:中国医学会系列杂志、大学学报、中国科学系列杂志、科学普及期刊。该系统收录的期刊种类主要有7个:基础科学、农业科学、社会科学、哲学政法、医药卫生、教育文艺、经济财政。到2006年5月15日为止,共收录期刊数为5065种。浏览全文前需要下载PDF全文阅览器。该浏览器可在万方数据资源系统的数字化期刊子系统中下载。下载PDF全文阅览器前计算机中应安装有压缩软件。16、结合“中国学术期刊全文数据库”、“维普中文科技期刊数据库”两种数据库,谈各自的“高级检索”的方法。中国学术期刊全文数据库:维普中文科技期刊数据库:17、简述特种文献的特点和作用,学位论文的结构。特点:专利文献是重要的技术信息源;特种文献是重要的法律信息源;专利文献是重要的经济信息源。作用:特种文献不论从数量和质量上,都堪称最重要的特种信息源。它具有三大重要作用:一、专利文献是重要的技术信息源;二、特种文献是重要的法律信息源;三、专利文献是重要的经济信息源。结构:学术论文的结构:目录、序言、导论、本论、结论、参考文献目录、后记。18、按级别分的标准的类型?我国标准分为那些级别?分别用哪些符号表示?按级别分的标准的类型:国家标准、区域标准、国家标准、行业标准、地方标准、企业标准。我国标准级别与符号:级别 符号国家标准 如GB7718—94强制性国家标准 如GB/T3860—95推荐性标准 如GB/*1645—9819、专利的新颖性、创造性和实用性各自含义,中国保护的专利类型?新颖性:是指在申请日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国家知识产权局提出过申请并且记载在申请日以后公布的专利申请文件中。创造性:是指同申请日以前已有的技术相比,该发明有突出的实质性特点和显著的进步,该实用新型有实质性特点和进步。实用性:是指该发明或者实用新型能够制造或者使用,并且能够产生积极效果。20、中国何时实施专利法?中国专利法对专利采用怎样的审批程序?受中国专利法保护的对象分别有哪些?时间:《中国人民共和国专利法》1984年3月12日第六届全国人民代表大会常务委员会第四次会议通过程序:申请专利的发明涉及新的生物材料,该生物材料公众不能得到,并且对该生物材料的说明不足以使所属领域的技术人员实施其发明的,除应当符合专利法和本细则的有关规定外,申请人还应当办理下列手续:(一)在申请日前或者最迟在申请日(有优先权的,指优先权日),将该生物材料的样品提交国务院专利行政部门认可的保藏单位保藏,并在申请时或者最迟自申请日起4个月内提交保藏单位出具的保藏证明和存活证明;期满未提交证明的,该样品视为未提交保藏;(二)在申请文件中,提供有关该生物材料特征的资料;(三)涉及生物材料样品保藏的专利申请应当在请求书和说明书中写明该生物材料的分类命名(注明拉丁文名称)、保藏该生物材料样品的单位名称、地址、保藏日期和保藏编号;申请时未写明的,应当自申请日起4个月内补正;期满未补正的,视为未提交保藏。保护对象: 一、专利权人二、专利法的客体(一)发明专利 1.产品发明专利2.方法发明专利(二)实用新型专利(三)外观设计专利21、中国专利文献的编号提心含有几种专利文献号?如何称谓?22、专利文献的特点、专利说明书的结构。特点:1)数量巨大、内容广博。(2)集技术、法律、经济信息于一体。专利文献记载技术解决方案,确定专利权保护范围,披露专利权人、注册证书所有人权利变更等法律信息。同时,依据专利申请、授权的地域分布,可分析专利技术销售规模、潜在市场、经济效益及国际间的竞争范围。是一种独一无二的综合科技信息源。(3)反映新的科技信息。首先,大多数国家专利局采用先申请制原则,致使申请人在发明完成之后尽早提交申请,以防他人捷足先登。其次,由于新颖性是专利性的首要条件,因此,发明创造多以专利文献而非其他科技文献形式公布与众。第三,20世纪70年代初专利申请早期公开制度的推行,更加速了科技信息向社会的传播速度。(4)格式统一、形式规范。结构:一、现将本文书的制作要点介绍如下: 1.说明书中对发明或者实用新型内容的描述务必做到清楚、完整。2.写作应符合注意事项中所列各项要求。二、格式:说 明 书注意事项一、申请发明或实用新型专利必须提交说明书,一式两份怔、副本各一份)。二、说明书应当打字或者印刷,字迹整齐清晰、黑色,符合制版要求,字高在厘米至厘米之间,行距在厘米至厘米之间。说明书首页用此页,续页可用同样大小和质量相当的白纸续写。纸张纵向使用,只限使用正面,四周须留有空白:左侧和顶部各厘米,右侧和底部各厘米。三、邮寄申请文件不得折叠。四、发明或者实用新型专利中请的说明书,除发明或者实用新型的性质需用其他方式和顺序说明的以外,应持下列顺序撰写:1.发明或者实用新别名称,该名称应与请求书中的名称一致;2.发明或者实用新型所属技术领域;3.就申请人所知,写明对发明或者实用新型的理解、检索、审查有参考作用的现有技术,并且引证反映该项技术的文件;4.发明或者实用新型的目的;5.清楚、完整地写明发明或者实用新型的内容,以所属技术领域的普通技术人员能够实现为准;6.发明或者实用新型与现有技术相比所具有的优点或者积极效果;7.如有附图,应当有图面说明;8.详细描述中请人认为实现发明或者实用新型的最好方式,有附图的应当+照附图。发明或者实用新型可以有化学式或数学式,但不得有商业性宣传用语。五、发明或者实用新型名称居中。名称与正文之间空一行。23、专利文献的分类方法,分类号的结构组成,专利检索的目的。24、国际上主要国家和国际组织的专利“国别代码”。25、简述“中国学位论文数据库”、“中国标准文献数据库”的使用方法。26、什么是科技报告?它有那些类型?用哪些检索工具查找我国的科技报告?27、什么是会议文献?若查找国外各种学术会议的信息,利用哪些检索工具?28、简述我校图书馆引进或购置的外文数据库的类型机器收录特点。29、Springerlink提供的个性化服务包括哪些?读者在使用个性化服务前需要什么操作程序?30、Springerlink主页面默认为简单检索页面。请用简单检索功能查找“计算机优化”方面近2年内的文献2条。31、Springerlink系统可以对于符合预期的检索结果进行标记。标记过的记录,可以暂时保存在系统中,可以通过个性化服务功能,进行永久保存。写出检索结果的几种输出方式。32、EBSCO提供的个性化服务包括哪些?读者在使用个性化服务前需要什么操作程序?33、网络资源的特点与种类;搜索引擎的功能。34、队百度、中文搜狐、北大天网、一搜四种搜索引擎的功能进行比较。35、文献信息的先进性、可靠性、适用性判断方法。36、查阅有关文献,写出“标准文献、专利文献、学位论文研究报告”作为参考文献时的标注格式。37、学术论文一般由哪几部分构成?各部分的写作规范分别是什么?学术论文的结构:目录、序言、导论、本论、结论、参考文献目录、后记下面对各部分作简要说明:(一)导论导论起什么作用?导论的作用在于引起读者的阅读兴趣。读者拿到一篇学术论文,通常好多万字、二三十万字,是否值得花费宝贵的时间,光看题目还难以判断,总是首先读导论,希望从导论的内容判断本文是否有阅读价值,是否值得花费时间阅读。导论的内容,通常是交待课题,本文究竟要研究一个什么课题,这个课题的产生背景,说明作者为什么要研究这个课题,它有什么理论意义和现实意义。如果是博士论文,通常还要交待所采用的研究方法,交待论文的大体结构。(二) 结论 学术论文应当有结论,是学术研究的规律性决定的。学术研究是一个过程,有其始端和终端。导论是始端,结论是终端。结论表明一项科学研究的结束。同时,一项研究当有其研究结果。最终得到一个什么研究结果,应当在结论部分作出概括。如果还有遗留问题没有解决,也应在结论部分指出。 从学位论文答辩的角度讲,论文要经专家鉴定,写出评语。答辩委员会成员也要审读论文,写出评语。考虑到一篇博士学位论文通常二十多万字,甚至三十多万字,专家教授通常不可能一口气读完。总是读几页,放下了,又读几页,有什么事情又放下了。经过好多次才断续读完,读到末尾,前面的内容已经模糊、记不清了。不可否认,有的评定人因时间关系不可能读完全文,阅读了导论部分,翻阅、选读几个章节,然后就写评语。如果有一个结论,概括本文的研究结果、作者的基本学术见解、本研究结果的理论意义和实践价值,对于审定人作出总的评价有莫大的帮助。这对于论文最后能否通过答辩,有极重大的意义。切不可掉以轻心!(三) 本论本论是一篇学位论文的本质部分,没有本论就不成其为一篇论文。就象没有头和躯干不能成其为人一样。本论的内容是研究过程的反映,应当写什么,自然不用我在这里说。这里只是介绍本论部分的结构安排。评价一篇论文的结构是否合理,主要是针对本论部分的结构是否合理。

155 评论

相关问答

  • 情报学报投稿多少钱

    《情报学报》由中国科学技术情报学会、中国科学技术信息研究所主办。主要发表情报科学的理论研究和实验研究的学术论文,以及优秀的综述评论。内容包括:人类知识信息产生、

    小怡子乖乖 4人参与回答 2023-12-09
  • 情报学报审稿速度

    核刊里面最快的,《图书情报工作》,一般要5、6个月,我也见过非大牛3个月出刊的,但似乎是赶上什么专栏了。一般至少要半年,《中图学报》、《情报学报》什么的一年起。

    贝贝哈拉 6人参与回答 2023-12-09
  • 金属学报审稿费和版面费

    从读研到读博,一直关注《Transactions of nonferrous metals society of China》,也就是《中国有色金属学报英文版》

    cHeN&Li$Li 3人参与回答 2023-12-10
  • 草地学报审稿

    首先,这两个期刊都是CSCD。如果你是草学学子的话,应该很清楚。草业科学是16年还是15年才升的重要核心,私以为为了巩固这个名头,需要的稿件量肯定是要多一些的;

    juan娟娟123 6人参与回答 2023-12-10
  • 审稿快的学报

    1、清华大学学报(自然科学版) 《清华大学学报(自然科学版)》创刊于1915年,已有百年历史,是中国最早同时以大学校名和“学报”冠名的期刊,是以客观的学术语言记

    几丁不二 4人参与回答 2023-12-11