• 回答数

    6

  • 浏览数

    324

Herculeses
首页 > 学术期刊 > 爬数据课程论文范文

6个回答 默认排序
  • 默认排序
  • 按时间排序

天津小吃好

已采纳

一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程,教师为学生授课,学生选修课程并取得成绩。 2、概念世界 概念世界是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述,从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语: 实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。 实体集:同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。 属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。 关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如"职工号"就可作为关键字。 联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。 3、机器世界 存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。数据模型将概念世界中的实体,及实体间的联系进一步抽象成便于计算机处理的方式。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模,用于DBMS的实现。 关系数据库采用关系模型作为数据的组织方式。 关系数据库因其严格的数学理论、使用简单灵活、数据独立性强等特点,而被公认为最有前途的一种数据库管理系统。它的发展十分迅速,目前已成为占据主导地位的数据库管理系统。自20世纪80年代以来,作为商品推出的数据库管理系统几乎都是关系型的,例如,Oracle,Sybase,Informix,Visual FoxPro等。 网络数据库也叫Web数据库。促进Internet发展的因素之一就是Web技术。由静态网页技术的HTML到动态网页技术的CGI、ASP、PHP、JSP等,Web技术经历了一个重要的变革过程。Web已经不再局限于仅仅由静态网页提供信息服务,而改变为动态的网页,可提供交互式的信息查询服务,使信息数据库服务成为了可能。Web数据库就是将数据库技术与Web技术融合在一起,使数据库系统成为Web的重要有机组成部分,从而实现数据库与网络技术的无缝结合。这一结合不仅把Web与数据库的所有优势集合在了一起,而且充分利用了大量已有数据库的信息资源。图1-1是Web数据库的基本结构图,它由数据库服务器(Database Server)、中间件(Middle Ware)、Web服务器(Web Server)、浏览器(Browser)4部分组成。 Web数据库的基本结构 它的工作过程可简单地描述成:用户通过浏览器端的操作界面以交互的方式经由Web服务器来访问数据库。用户向数据库提交的信息以及数据库返回给用户的信息都是以网页的形式显示。 Internet技术与相关协议 Internet技术在Web数据库技术中扮演着重要的角色。Internet(因特网)专指全球最大的、开放的、由众多网络相互连接而成的计算机网络,并通过各种协议在计算机网络中传递信息。TCP/IP协议是Internet上使用的两个最基本的协议。因此也可以说Internet是全球范围的基于分组交换原理和TCP/IP协议的计算机网络。它将信息进行分组后,以数据包为单位进行传输。Internet在进行信息传输时,主要完成两项任务。 (1)正确地将源信息文件分割成一个个数据包,并能在目的地将源信息文件的数据包再准确地重组起来。 (2)将数据包准确地送往目的地。 TCP/IP协议的作用就是为了完成上述两项任务,规范了网络上所有计算机之间数据传递的方式与数据格式,提供了数据打包和寻址的标准方法。 1.TCP/IP协议 TCP协议(Transmission Control Protocol,传输控制协议)规定了分割数据和重组数据所要遵循的规则和要进行的操作。TCP协议能保证数据发送的正确性,如果发现数据有损失,TCP将重新发送数据。 2.IP协议 在Internet上传送数据往往都是远距离的,因此在传输过程中要通过路由器一站一站的转接来实现。路由器是一种特殊的计算机,它会检测数据包的目的地主机地址,然后决定将该数据包送往何处。IP协议(Internet Protocol,网际协议)给Internet中的每一台计算机规定了一个地址,称为IP地址。IP地址的标准是由4部分组成(例如),其中前两部分规定了当前使用网络的管理机构,第3部分规定了当前使用的网络地址,第4部分规定了当前使用的计算机地址。 Internet上提供的主要服务有E-mail、FTP、BBS、Telnet、WWW等。其中WWW(World Wide Web,万维网)由于其丰富的信息资源而成为Internet最为重要的服务。 3.HTTP协议 HTTP协议(Hypertext Transfer Protocol,超文本传输协议)应用在WWW上,其作用是完成客户端浏览器与Web服务器端之间的HTML数据传输。 Web的工作原理与工作步骤 万维网简称为Web。Web可以描述为在Internet上运行的、全球的、交互的、动态的、跨平台的、分布式的、图形化的超文本信息系统。 1.Web的工作原理 Web是伴随着Internet技术而产生的。在计算机网络中,对于提供Web服务的计算机称为Web服务器。Web采用浏览器/服务器的工作方式。每个Web服务器上都放置着大量的Web信息。Web信息的基本单位是Web页(网页),多个网页组成了一个Web节点。每个Web节点的起始页称为“主页”,且拥有一个URL地址(统一资源定位地址)。Web节点之间及网页之间都是以超文本结构(非线性的网状结构)来进行组织的。 2.Web的工作步骤 Web的工作步骤如下。 (1)用户打开客户端计算机中的浏览器软件(例如Internet Explorer)。 (2)用户输入要启动的Web主页的URL地址,浏览器将生成一个HTTP请求。 (3)浏览器连接到指定的Web服务器,并发送HTTP请求。 (4)Web服务器接到HTTP请求,根据请求的内容不同作相应的处理,再将网页以HTML文件格式发回给浏览器。 (5)浏览器将网页显示到屏幕上. 图1-2 Web的工作步骤 WWW世界中的标记语言 1.HTML语言 HTML(Hypertext Markup Language,超文本标记语言)是创建网页的计算机语言。所谓网页实际上就是一个HTML文档。文档内容由文本和HTML标记组成。HTML文档的扩展名就是.html或.htm。浏览器负责解释HTML文档中的标记,并将HTML文档显示成网页。 (1)HTML标记 HTML标记的作用是告诉浏览器网页的结构和格式。每一个标记用尖括号<>括起来。大多数标记都有一个开始标记和一个结束标记。标记不分大小写。多数标记都带有自己的属性。例如字体标记有FACE、COLOR、SIZE等属性:FACE定义字体;COLOR定义字体的颜色;SIZE定义字体的大小。 使用格式: BEIJING 。 网页中有很多文本链接和图片链接。链接,又被称为超链接,用于链接到WWW万维网中的其他网页上。在HTML文档中表示超链接的标记是,通过属性HREF指出链接的网页地址URL。 使用格式: BEIJING 。 (2)HTML程序 HTML程序必须以标记开始,以标记结束。在和标记之间主要由两部分组成:文件头和文件体。文件头用标记 来标识,文件体用标记来标识。在文件的头部通常包含整个网页的一些信息。例如标记是用来说明网页的名称;标记是用来说明网页的其他信息,如设计者姓名和版权信息等。所有在浏览器中要显示的内容称为网页的主体,必须放在标记中。下面给出的是一个空网页的HTML程序。 (在此标记中写网页的标题) (在此标记中写网页的内容) (3)HTML规范 HTML规范又称为HTML标准,它总在不断地发展。每一新版本的出现,HTML都会增加新的特性和内容。有关HTML版本的详细信息请访问网站。 在不同的浏览器中,网页的显示效果可能会有所不同。每一个浏览器都使用自己独特的方式解释HTML文档中的标记,并且多数浏览器不完全支持HTML的所有特性。因为,像Microsoft和Netscape公司在HTML标准上又开发了一些特有的HTML标记和属性,称之为HTML的扩展。这些标记和属性只被他们自己的浏览器所识别,不可能被其他公司的浏览器识别。如果浏览器不能识别HTML文档中的标记,则会忽略这个标记。 (4)HTML程序的编辑环境与运行环境 HTML文档是一个普通的文本文件(ASCII),不包含任何与平台、程序有关的信息。因此HTML文档可以利用任何文本编辑器来方便地生成。要注意的是HTML文档的扩展名必须是.html或.htm。运行HTML文档可以在任何浏览器下进行,并可在浏览器上查看网页的HTML源代码。 关于HTML语言中标记的种类与使用方法将会在第5章中更详细地进行介绍。 2.可扩展标记语言(XML) HTML是Web上的通用语言,随着Internet的深入人心,WWW上的Web文件日益复杂化、多样化,人们开始感到了HTML这种固定格式的标记语言的不足。1996年W3C开始对HTML的后续语言进行研究,并于1998年正式推出了XML(Extensible Markup Language,可扩展标记语言)。在设计网页时,XML提供了比HTML更灵活的方法。 (1)XML语言的特点 XML是国际组织W3C为适应WWW的应用,将SGML (Standard Generalized Markup Language)标准进行简化形成的元标记语言。简单地说,XML是使用标记来描述内容或与内容相关的形式信息的通用语言。一个XML文档由标记和字符数据组成。 而作为元标记语言,XML不再使标记固定,允许网页的设计者定义数量不限的标记来描述内容,同时还允许设计者创建自己的使用规则。 (2)XML的DTD DTD(Document Type Definition,文档类型定义)是一组应用在XML文档中的自定义标记语言的技术规范。DTD中定义了标记的含义及关于标记的语法规则。语法规则中确定了在XML文档中使用哪些标记符,它们应该按什么次序出现,标记符之间如何 嵌套,哪些标记符有属性等等。DTD可以包含在它所描述的XML文档中,但通常它是一份单独的文档或者一系列文档。作为外部文件可通过URL链接,被不同的XML文档 共享。 XML把DTD的定义权开放,不同行业可以根据自己的实际需求定义描述内容的DTD,以适应本行业内部的信息交流和存档需要。因此,适合于不同行业、不同平台的标记语言大批涌现。 (3)XML的CSS与XSL 强调内容描述与形式描述的分离,一方面可以使XML文件的编写者更集中精力于数据本身,而不受显示方式的细节影响;另一方面允许为相同的数据定义不同的显示方式,从而适合于不同应用、不同媒体,使XML数据得到最大程度的重用。XML文档数据的显示形式是通过样式单定义的。CSS(Cascading Style Sheets)是XML使用的一种标准的级联样式单,XSL(Extensible Style Language)则是可扩展的样式语言。 由于XML允许用户创建任何所需的标记,而通用浏览器却既无法预期用户标记的意义,又无法为显示这些标记而提供规则,因此用户必须为自己创建的XML文档编写样式单,样式单可以实现共享。 浏览器对一个XML文档的处理过程是,首先去关联它所指定的样式单文件,如果该样式单是一个XSL文件,则按照规定对XML数据进行转换然后再显示,XSL本身也是基于XML语言的,可以将XML转化为HTML后再显示。如果该样式单是一个CSS文件,浏览器就会按照样式单的规定给每个标记赋予一组样式后再显示。 Web数据库访问技术 Web数据库访问技术通常是通过三层结构来实现的,如图1-3所示。目前建立与Web数据库连接访问的技术方法可归纳为CGI技术,ODBC技术和ASP、JSP、PHP 技术。 Web数据库访问的三层结构 CGI技术 CGI(Common Cateway Interface,通用网关界面)是一种Web服务器上运行的基于Web浏览器输入程序的方法,是最早的访问数据库的解决方案。CGI程序可以建立网页与数据库之间的连接,将用户的查询要求转换成数据库的查询命令,然后将查询结果通过网页返回给用户。一个CGI工作的基本原理如图1-4所示。 CGI程序需要通过一个接口才能访问数据库。这种接口多种多样,数据库系统对CGI程序提供了各种数据库接口如Perl、C/C++、VB等。为了使用各种数据库系统,CGI程序支持ODBC方式,通过ODBC接口访问数据库。 CGI工作流程 ODBC技术 ODBC(Open Database Connectivity,开放数据库互接)是一种使用SQL的应用程序接口(API)。ODBC最显著的优点就是它生成的程序与数据库系统无关,为程序员方便地编写访问各种DBMS的数据库应用程序提供了一个统一接口,使应用程序和数据库源之间完成数据交换。ODBC的内部结构为4层:应用程序层、驱动程序管理器层、驱动程序层、数据源层。它们之间的关系如图1-5所示。由于ODBC适用于不同的数据库产品,因此许多服务器扩展程序都使用了包含ODBC层的系统结构。 ODBC的内部结构 Web服务器通过ODBC数据库驱动程序向数据库系统发出SQL请求,数据库系统接收到的是标准SQL查询语句,并将执行后的查询结果再通过ODBC传回Web服务器,Web服务器将结果以HTML网页传给Web浏览器,工作原理如图1-6所示。 Web服务器通过ODBC访问数据库 由于Java语言所显示出来的编程优势赢得了众多数据库厂商的支持。在数据库处理方面,Java提供的JDBC为数据库开发应用提供了标准的应用程序编程接口。与ODBC类似,JDBC也是一种特殊的API,是用于执行SQL语句的Java应用程序接口。它规定了Java如何与数据库之间交换数据的方法。采用Java和JDBC编写的数据库应用程序具有与平台无关的特性。 ASP、JSP、PHP技术 ASP是Microsoft开发的动态网页技术,主要应用于Windows NT+IIS或 Windows 9x+PWS平台。确切地说ASP不是一种语言,而是Web服务器端的开发环境。利用ASP可以产生和运行动态的、交互的、高性能的Web服务应用程序。ASP支持多种脚本语言,除了VBScript和Pscript,也支持Perl语言,并且可以在同一ASP文件中使用多种脚本语言以发挥各种脚本语言的最大优势。但ASP默认只支持VBScript和Pscript,若要使用其他脚本语言,必须安装相应的脚本引擎。ASP支持在服务器端调用ActiveX组件ADO对象实现对数据库的操作。在具体的应用中,若脚本语言中有访问数据库的请求,可通过ODBC与后台数据库相连,并通过ADO执行访问库的操作。关于ASP的编程技术将会在第7章中详细介绍。 JSP是Sun公司推出的新一代Web开发技术。作为Java家族的一员,几乎可以运行在所有的操作系统平台和Web服务器上,因此JSP的运行平台更为广泛。目前JSP支持的脚本语言只有Java。JSP使用JDBC实现对数据库的访问。目标数据库必须有一个JDBC的驱动程序,即一个从数据库到Java的接口,该接口提供了标准的方法使Java应用程序能够连接到数据库并执行对数据库的操作。JDBC不需要在服务器上创建数据源,通过JDBC、JSP就可以实现SQL语句的执行。 PHP是Rasmus Lerdorf推出的一种跨平台的嵌入式脚本语言,可以在Windows、UNIX、Linux等流行的操作系统和IIS、Apache、Netscape等Web服务器上运行,用户更换平台时,无需变换PHP代码。PHP是通过Internet合作开发的开放源代码软件,它借用了C、Java、Perl语言的语法并结合PHP自身的特性,能够快速写出动态生成页面。PHP可以通过ODBC访问各种数据库,但主要通过函数直接访问数据库。PHP支持目前绝大多数的数据库,提供许多与各类数据库直接互连的函数,包括Sybase、Oracle、SQL Server等,其中与SQL Server数据库互连是最佳组合。 网络数据库应用系统的层次体系 当前,Internet/Intranet技术发展异常迅速,越来越多的数据库应用软件运行在Internet/Intranet环境下。在此之前,数据库应用系统的发展经历了单机结构、集中式结构、客户机/服务器(C/S)结构之后,随着Internet的普及,又出现了浏览器/服务器(B/S)结构与多层结构。在构造一个应用系统时,首先考虑的是系统的体系结构,采用哪种结构取决于系统的网络环境、应用需求等因素。 客户机/服务器结构 1.二层C/S结构 二层C/S结构是当前非常流行的数据库系统结构,在这种结构中,客户机提出请求,服务器对客户机的服务请求做出回答。它把界面和数据处理操作分开在前端(客户端)和后端(服务器端),这个主要特点使得C/S系统的工作速度主要取决于进行大量数据操作的服务器,而不是前端的硬件设备;同时也大大降低了对网络传输速度的要求,因为只须客户端把服务请求发送给数据库服务器,数据库服务器只把服务结果传回前端,如图1-7所示。 在设计时,对数据可能有如下不同的处理形式。 (1)在处理时,客户机先向服务器索取数据,然后释放数据库,即客户机发出的是文件请求,在客户机端处理数据,最后将结果送回服务器。这种处理方式的缺点很明显:所有的应用处理都在客户端完成,这就要求客户端的计算机必须有足够的能力,以便执行需要的任何程序。更为糟糕的是,由于所有的处理均在客户端完成,每次运行时都要将文件整体传送到客户端,然后才能执行。如:Student表中有30 000条记录,客户端发出命令: Select * From Student Where Sno='200101' 这条命令将要求服务器将Student表中的所有记录传送到客户端,然后在客户端执行查询,结果只用到一条记录;如果查询的记录不存在,网络传输的数据实际上是无 用的。如此大的数据传输量是不可想象的。因此,人们提出了在服务器中能够执行部分代码的客户机/服务器结构。 (2)在处理时,客户机接受用户要求,并发给服务器;在服务器端处理用户要求,最后将结果传回客户机显示或打印。这种处理方式网络通信量较小。客户机向服务器发出的是处理请求,而不是文件请求,处理请求中的代码在服务器端执行后向客户机传送处理后的结果。 这样,为了特定任务,客户机上的程序和服务器上的程序协同工作:客户机端的代码用于完成用户的输入输出及数据的检查,而服务器端的代码完成对数据库的操作。 客户机/服务器结构的另一个主要特点在于软件、硬件平台的无关性。数据库服务器上的数据库管理系统集中负责管理数据,它向客户端提供一个开放的使用环境,客户端通过数据库接口,如ODBC(开放数据库连接)和SQL语言访问数据库,也就是说,不管客户端采用什么样的硬件和软件,它只要能够通过网络和数据库接口程序连接到服务器,就可对数据库进行访问。 在客户机/服务器结构中,常把客户机称为前台,而把服务器端称为后台。前台应用程序的功能包括用户界面、接收用户数据、处理应用逻辑、向后台发出请求、同时接收后台返回的结果,最后再将返回的结果按一定的格式或方式显示给用户。而后台服务器则负责共享外部设备、存取共享数据、响应前台客户端的请求并回送结果等工作。前台的应用程序和数据一般是用户专用的,而后台的数据和代码是所有用户可以共享的。 由于数据库服务器不仅要管理共享数据,保证数据的完整性,还要执行一部分代码,完成客户端的一些处理请求,所以对用于服务器的计算机提出较高的要求。最好要采用一台专用的服务器,有较快的处理速度,有大容量的硬盘和内存,支持磁带等大容量的存储设备。 上面讲的客户机/服务器结构将应用分在了客户机、服务器两级,称其为两层客户机/ 服务器结构。总之,两层C/S结构的基本工作方式是客户程序向数据库服务器发送SQL请求,服务器返回数据或结果。 这种C/S结构有两种实现方式,一种是客户来完成表示部分和应用逻辑部分,而服务器完成数据访问部分,这种情况是以客户为中心的,适用于应用相对简单、数据访问量不是很大的情况。另一种是以服务器为中心的,把一些重要的应用逻辑部分放到服务器上,这样可充分利用服务器的计算能力,减少网络上需要传送的数据。通常以存储过程和触发器的形式出现,但存储过程都依赖于特定数据库,不同数据库之间很难移植,而三层C/S结构可以很好地解决这个问题。 注意:触发器(trigger)是数据库系统中,一个在插入、删除、修改操作之后运行的记录级事件代码。不同的事件可以对应不同的动作。通常有3种类型的触发器:INSERT触发器、DELETE触发器和UPDATE触发器。 2.三层C/S结构 由于两层结构的客户机/服务器系统本身固有的缺陷,使得它不能应用于一些大型、结构较为复杂的系统中,故出现了3层结构的客户机/服务器系统,将两层结构中服务器部分和客户端部分的应用单独划分出来,即采用“客户机—应用服务器—数据库服务器”结构(如图1-8所示)。典型的数据库应用可分为三部分:表示部分、应用逻辑(商业逻辑)部分和数据访问部分,三层结构便是对应于这三部分。 图1-8 三层C/S结构 其中,应用服务器和数据库服务器可位于同一主机,也可位于不同主机。客户机是应用的用户接口部分,负责用户与应用程序的交互,运行在客户机端的软件也称为表示层软件。应用服务器存放业务逻辑层(也称为功能层)软件,是应用逻辑处理的核心,实现具体业务。它能响应客户机请求,完成业务处理或复杂计算。若有数据库访问任务时,应用服务器层可根据客户机的要求向数据库服务器发送SQL指令。应用逻辑变得复杂或增加新的应用时,可增加新的应用服务器。数据库服务器便是用来执行功能层送来的SQL指令,完成数据的存储、访问和完整性约束等。操作完成后再通过应用服务器向客户机返回操作结果。 浏览器/服务器结构 随着Internet技术和Web技术的广泛应用,C/S结构已无法满足人们的需要。因为在典型C/S体系中,通常为客户安装前端应用程序的做法已不再现实,并且限制客户端工作环境只能基于Windows、Macintosh或UNIX等操作系统也不切实际。于是基于浏览器/服务器结构(Browser/Server)的系统应运而生。 采用B/S结构后,在客户端只需安装一个通用的浏览器即可,不再受具体操作系统和硬件的制约,实现了跨平台的应用。 基于B/S结构的典型应用通常采用三层结构:“浏览器—Web服务器—数据库服务器”,B/S模式的工作原理是:通过浏览器以超文本的形式向Web服务器提出访问数据库的请求,Web服务器接受客户请求后,激活对应的CGI程序将超文本HTML语言转化为SQL语法,将这个请求交给数据库,数据库服务器得到请求后,进行数据处理,然后将处理结果集返回给CGI程序。CGI再将结果转化为HTML,并由Web服务器转发给请求方的浏览器,如图1-9所示。 图1-9 B/S工作原理 在B/S模式中,客户端的标准配置是浏览器,如IE;业务功能处理由独立的应用服务器处理,Web服务器成为应用处理的标准配置;数据处理仍然由数据库服务器处理。 从本质上讲,B/S结构与传统的C/S结构都是以同一种请求和应答方式来执行应用的,区别主要在于:C/S是一种两层或三层结构模式,其客户端集中了大量应用软件,而B/S是一种基于超链接(HyperLink)、HTML、Java的三级或多级C/S结构,客户端仅需单一的浏览器软件,是一种全新的体系结构,解决了跨平台问题。到目前,这两种结构在不同方面都有着广泛的应用。虽然C/S结构在Internet环境下明显不如B/S结构具有优势,但它在局域网环境下仍具有优势。 Internet/Intranet信息系统的多层体系结构 多层结构应用软件与传统的两层结构应用软件相比,有可伸缩性好、可管理性强、安全性高、软件重用性好等诸多优点,如何在Internet/Intranet环境下构建应用软件体系结构就成为一个非常重要的问题,也是现今软件体系研究的一个新热点。 目前各种技术层出不穷,如最初的静态HTML页面、简单的CGI网关程序、Java Applet程序,现在的ASP等Web数据库技术,还有动态的Java在线游戏及PHP技术等。 实际上,多层的概念是由Sun公司提出来的。Sun公司提出的多层应用体系包括4层:客户层、顶端Web服务层、应用服务层和数据库层。其中顶端Web服务层是Sun公司多层体系结构中非常重要的一层,它主要起代理和缓存的作用。顶端Web服务器的作用是缓存本地各客户机经常使用的Java Applet程序和静态数据,通常被放置在客户机所在的局域网内,起到一个Java Applet主机(向Web浏览器传送Java Applet程序的计算机)和访问其他服务的代理作用。与普通代理服务器的作用相同。构建多层结构应用软件时,选用Java平台是一个很好的选择,因为它跨越各应用平台。总之,在Java平台上构建多层应用软件体系代表着今后Internet/Intranet应用的趋势。

348 评论

周一小姐

有图片的,这里发不了图片,满意我的论文加分后联系我,我发给你。基于关系数据库的模式匹配技术研究摘 要 随着 网络 技术的 发展 ,信息处理需要对大量的、异构的数据源的数据进行统一存取,多源异构数据的集成 问题 就显得十分重要。而模式匹配是数据集成领域的一个基本技术。文章提出一种解决关系数据库语义冲突问题的模式匹配技术,以实现异构数据的共享与互操作。关键词 数据集成;模式匹配;语义冲突1 引言随着 计算 机及网络技术的快速发展,网络上的各种信息以指数级爆炸性增长,成为了一个巨大的信息库,同时各 企业 单位开发了大量的软硬件平台各异的 应用 系统,在各种应用系统下又积累了丰富的数据资源。这样就形成了成千上万个异构的数据源,多为传统的关系数据库数据。这些数据资源由于软硬件平台各异、数据模型各异而形成了异构数据,使各数据源间的互操作变得复杂。为了更好地利用这些异构信息,以及不造成企业应用系统的重复建设和数据资源的浪费,模式匹配技术吸引了众多关注。本文针对模式匹配过程中存在的语义冲突进行分类,并提出了相应的解决策略,以达到异构数据源的共享和互操作。2 模式匹配中的冲突问题在数据集成领域中,由于数据源系统多是独立开发,数据源是相对自治的,因此描述数据的数据模型或存储结构经常会出现模式的不一致,数据源的自治性和数据源模式的异构性使数据源在共享和互操作上存在了语义冲突。这些正是模式匹配的焦点问题,它们形式上的性质使得人们很容易想到要用模式匹配去解决逻辑、语义和知识的描述问题。对于描述模式匹配中的语义冲突有两种较有代表性的分类[4]。第一种分类将冲突分为异类冲突、命名冲突、语义冲突和结构冲突。第二种分类主要是对第一类异类冲突概念的一个细致的改进,但和其它分类仍有细微的不同,它把异类冲突看作是语义不一致的一类(如语义冲突),把冲突分为命名冲突、域冲突、元数据冲突、结构冲突、属性丢失和硬件/软件不同。模式匹配是一项复杂而繁重的任务,所能集成的数据源越来越多,上述冲突情况也会越来越普遍,想解决所有的模式冲突是不现实的。本文主要解决关系数据模式之间的语义冲突。3 模式匹配中的语义冲突本文所提出的模式匹配 方法 是根据关系数据库的特点设计的。关系数据库中关系的基本单位是属性,属性本身就包含着语义信息,因此异构数据源语义相似性就围绕着数据源模式中的属性来进行,并在匹配的过程中解决异构数据源模式之间的一系列语义冲突。 语义匹配体系结构本文提出的语义匹配体系结构采用数据集成中的虚拟法数据集成系统的典型体系结构,采用将局部模式匹配到全局模式的语义匹配体系结构,自下而上地建立全局模式。首先进行模式转化,消除因各种局部数据模式之间的差异所带来的 影响 ,解决各种局部模式之间的语义冲突等,然后在转化后的模式的基础上进行模式匹配,其主要手段是提供各数据源的虚拟的集成视图。数据仍保存在各数据源上,集成系统仅提供一个虚拟的集成视图和对该集成视图的查询的处理机制。系统能自动地将用户对集成模式的查询请求转换成对各异构数据源的查询。在这种体系结构中,中间层根本不实际存储数据,当客户端发出查询请求时,仅是简单地将查询发送到适当的数据源上。由于该方法不需要重复存储大量数据,并能保证查询到最新的数据,因此比较适合于高度自治、集成数量多且更新变化快的异构数据源集成。本文中的语义匹配的体系结构如图1所示。 关系数据库模式中语义冲突问题分类及其解决策略大多数数据库系统提供了一套概念结构来对现实世界的数据进行建模。每一个概念结构被认为是一个类型,它可以是一种复杂类型或一种基本类型。类型和它所表示的数据间的联系就称为语义[3]。在关系数据库中,一个关系模式是一个有序对(R,c),其中R为模式所指向的关系(表)的名称,而c则为具有不同名称的属性的有限集。同时,属性也是一个有序对(N,D),其中N为属性的名称,而D则为一个域。可以看出关系模式的基本单位是属性。属性本身就包含着语义信息,因此模式语义相似性就围绕模式中的属性来进行,并在模式匹配的过程中解决异构数据库模式之间的一系列语义冲突。根据语义的定义,在关系数据库系统中,语义系统是由模式、模式的属性、模式中属性之间的联系和模式间的属性之间的联系构成。这里将语义分为3级:模式级、属性级和实例级。下面将异构模式中存在的语义冲突问题进行了分类,并阐述了各种语义冲突的解决策略:1)模式级冲突(1)关系命名冲突。包括关系名同义词和关系名同形异义词。前者进行换名或建立关系名同义词表以记载该类冲突;后者进行换名或建立关系名同形异义词表以记载该类冲突。(2)关系结构冲突。分为包含冲突和相交冲突。包含冲突是指在含义相同的两个关系 R1 和 R2 中一个关系的属性集是另一个的属性子集。相交冲突是指两关系属性集的交不为空,我们用 attrset 代表关系的属性集。对包含冲突:①如果两个关系的属性集相同即attrset(R1)=attrset(R2),则合并这两个对象,Merge(R1, R2)into R3;②如果 attrset(R1) attrset(R2),则 attrset(R2')=attrset(R2)-attrset(R1),attrset(R1') = attrset(R1);③对相交冲突:通常概括语义进行如下解决:generalize(R1,R2)其中 attrset(R3)=attrset(R1)∩attrset(R2), attrset(R1')= attrset(R1)-attrset(R3);attrset(R2')=attrset(R2)-attrset(R3)。(3)关系关键字冲突:两个含义相同的关系具有不同的关键字约束。包括候选关键字冲突和主关键字冲突。解决候选关键字冲突的 方法 是,将两关系的候选关键字的交集作为两关系的候选关键字;解决主关键字冲突的方法是,从两关系的公共候选关键字中选一个分别作为两关系的主关键字。(4)多对多的关系冲突:两个数据库中用不同数量的关系来表达现实世界的相同语义信息,就产生了多对多的关系冲突,这种冲突分3种:一对多,多对一和多对多。解决方法是在表示相同语义信息的数据库中关系之间建立映射来表示多对多的关系。2)属性级冲突(1)属性命名冲突:分属性名同义词冲突和属性名同形异义词。前者的解决方法是,换名或建立属性名同义词字典;后者的解决方法是,换名或建立属性名同形异义词字典。(2)属性约束冲突:分属性类型冲突和属性长度冲突两种。当在两个相关的关系R1和R2的属性N1和N2具有不同的属性类型时,就发生属性类型冲突。解决方法是在全局模式中将发生属性类型冲突的属性统一到某种属性类型。对属性长度的解决方法是,在全局模式中将发生属性长度类型冲突的属性对统一定义为最大者就可。(3)多对多的属性冲突:两个数据库中的关系分别用不同数量的属性来表达现实世界中相同的语义信息时,就发生了多对多的属性冲突,这种冲突分3种:一对多,多对一和多对多。解决方法是在表示相同语义信息的数据库中关系的属性之间建立映射来表示这种多对多的关系。3)实例级冲突(1)不兼容关系实例冲突:当含义相同的数据项在不同的数据库中存在不一致的数据值时就发生了不兼容关系实例冲突。其解决方法是:将关系实例的最近修改作为关系实例冲突部分的值,但不能保证数据的正确性。(2)关系实例表示冲突:关系实例表示冲突是指用不兼容的符号、量纲和精度来表示相关关系实例中等价的数据元素,主要包括表达冲突、量纲冲突和精度冲突。表达冲突是指在两个相关的关系R1和R2中含义相同的属性N1和N2具有不同的数据表达时,这种冲突使用语义值的概念来解决,即将表示同一概念的多种表达在全局数据中进行统一即可。量纲冲突是指在两个相关的关系R1和R2和中含义相同的属性N1和N2具有不同的量纲表示。量纲冲突也可以语义值加以解决,解决过程如下:分别定义发生量纲冲突的局部数据源的语义值模式和语义值说明,然后再定义全局数据模式中相应的语义值模式和语义值说明,将发生量纲冲突的属性值在全局模式中进行统一。精度冲突是指在两个相关的关系 R1 和 R2 中含义相同的属性具有不同的精度。其解决方法是在全局模式中将发生精度冲突的数据项定义为最高精度即可。4 总结本文针对异构数据源管理自治和模式异构的特点,提出了数据源集成模式匹配的体系结构,制定了匹配策略, 研究 了基于语义的模式匹配过程。以关系模式为 参考 模式,对异构数据源关系模式间可能存在的语义冲突 问题 进行了分类,并阐述了解决这些语义冲突的策略。参考 文献[1] Bergamaschi S, Castano S, Vincini M. Semantic Integration of Semistructured and Structured Data Sources [J]. SIGMOD Record, 1999, 28(1): 54-59.[2] Li W, Clifton C, Liu S. Database Integration Using Neural Network: Implementation and Experiences [J]. Knowledge and Information Systems, 2000, 2(1).[3] Reddy M P, Prasad B E, GReddy P. A Methodology for Integration of Heterogeneous Databases [J]. Information System, 1999,24(5).[4] Rahm E,Bernstein Survey of Approaches to Automatic Schema Matching[J]. The International Journal on Very Large Data Bases (VLDB),2001,10(4):334-350.[5] 孟小峰,周龙骧,王珊.数据库技术 发展 趋势[J].软件学报,2004,15(12):1822-1835[6] 邓志鸿,唐世渭,张铭,等.Ontology研究综述[J].北京大学学报( 自然 科学 版),2002,38(5):730-738[7] 郭志鑫.基于本体的文档引文元数据信息抽取[J].微 计算 机信息,2006,22(6-3)相关文献:基于XML的多数据库系统集成数据模型 - 华中科技大学学报:自然科学版 - 卢晓蓉 陈传波 等基于CORBA和XML的多数据库系统研究 - 郑州轻工业学院学报:自然科学版 - 张素智,钱慎一,卢正鼎,集成数据库和文件系统的多数据库事务模型 - 华中理工大学学报 - 卢正鼎 肖卫军基于主动规则对象的分布式多数据库系统集成 - 小型微型计算机系统 - 胡华,高济,基于CORBA的多数据库系统 - 计算机科学 - 石祥滨 张斌基于XML的文件系统与多数据库系统的集成 - 小型微型计算机系统 - 卢正鼎 李兵 等基于CORBA/XML的多数据库系统的研究与实现 - 计算机研究与发展 - 卢正鼎 李兵 等多数据库系统集成平台CMDatabase体系结构 - 计算机工程 - 魏振钢 郭山清 贾忠伟多数据库系统的数据模式集成与查询处理 - 电脑开发与应用 - 陶世群数据库网格:基于网格的多数据库系统 - 计算机工程与应用 - 任浩 李志刚 肖侬高校学生收费系统基于多数据库系统集成的一种实践 - 昆明冶金高等专科学校学报 - 杨滨生,蒋涛勇,张中祥,谢静静,基于RDBMS的地理信息集成数据库系统 - 计算机工程 - 江崇礼 王丽佳 等基于CORBA的异构数据库系统集成模型的研究 - 现代计算机:下半月版 - 陈刚基于分布式对象技术的多数据库系统 - 计算机工程与科学 - 韩伟红 隋品波基于CORBA的多数据库系统互操作技术 - 计算机科学 - 肖明,肖毅,

141 评论

嘉定美食客

随着我国社会经济的不断发展,计算机信息技术也逐渐普及。下面是我为大家整理的计算机专科毕业论文,供大家参考。

【摘要】本文尝试从计算机软件技术课程教学出发,将CDIO的教学理念融入到平时授课过程,培养学生对课程知识的掌握,更重要的是培养学生团结合作能力。通过一段时间的实践表明,基于CDIO的课程教学能够提供学生自主性和创新性,提高学生学习兴趣和解决问题的能力。

【关键词】教学改革;CDIO;实践能力

1引言

计算机软件技术是一门软件设计的基础知识、方法与实用技术相结合的课程,为计算机软件应用开发、技术管理工作奠定理论基础,目前课程教学多是以传统理论课堂教学结合实验教学的模式进行,学生反映上课即使听懂遇到实际问题时也不知如何下手解决,尤其编程能力弱的学起来更加吃力,通常存在以下几方面问题。(1)课程涉及知识点多,理论性强,要求学生要有较强的逻辑思维和分析能力,尤其有具有较好的编程功底,这使得学这课程之前让部分学生产生畏难情绪。(2)实验课程中学生独立完成的是一些已有结论的验证性实验,以致学生软件编程能力得不到培养和提升。(3)课程考核以闭卷理论知识点考核作为重点,学生为了应付考试,可能死记硬背一些概念甚至一些编程题目,学生素质和实践能力得不到有效的培养和训练。针对以上问题,按照课程特点以及教学规律相应进行一些教学改革探索,以CDIO教学模式(构思Conceive、设计Design、实现Implement、运作Operate)进行每个教学环节落实,让学生以自主主动地、有机联系地方式学习。CDIO模式与传统的以传授知识为主的教学模式相比,更强调知识的运用和个人能力的培养。它要求我们在教学中,既要注重基础知识的传授,又要注重创新、设计和知识的综合应用;既要强调个人专业能力的培养,又要提倡团队合作精神的培养,这种教学模式能开拓学生的创新精神,全面提升学生的综合素质,让学生掌握扎实的基础知识,培养其责任感和团队合作精神。

2教学改革措施

目前,计算机软件技术教学改革主要从两个方面进行,即教学内容的改革和课程实验部分的改革。

教学方法设计[1]

基于CDIO教学理念,在教学过程中,以项目为牵引,以任务为依托,把课堂教学环境模拟成CDIO教育环境,即以项目构思、设计、实现和运行的生命周期为载体来组织教学。具体实施过程如下:

(1)首先选择具有代表性的项目任务,整个项目具备详细的系统开发过程,有较完整的系统结构、及基本需要的一些功能模块,在功能模块中有数据能演示,比如学生成绩管理系统。

(2)在教学过程中,根据教学进度和教学内容,向学生详细地介绍项目任务的构思、设计、实现和运行各个环节,从项目任务的需求分析,到各功能模块的设计与实现,到后期的运行和维护等。尤其一些关键功能模块的实现,为了便于、强化学生理解,可以设计一些类似的小任务。

(3)通过项目任务的贯穿,可以对已讲授的知识点进行总结,对后续课程的知识点以设问方式引出,引导学生积极主动思考,寻求解决方案。通过这种使前后知识点有机联系起来,使课程知识结构更系统。

实验教学设计

以往实验课都是一些验证性实验,学生通过查找互联网翻阅书本很快能找到解决路径。加上现在实验课时有限,通常布置一些小的项目,尽量涵盖课堂教学所涉及知识点,比如布置编程实现计算器。4-5人组成一个小组,以组长牵头组织大家分析,分配任务,利用课余时间共同协作完成。在这过程中包含一个CDIO项目周期[1](构思———需求分析、设计———实施方案、实现———编写代码、运作———作品测试、演示等)。实验课各小组汇报并演示所开发设计的项目。根据演示作品功能完整性、美观性等方面综合评价作为实验考评的依据,在这过程中又培养了学生独立思考,分析问题解决问题的能力,学生间合作沟通能力也得到锻炼。

积极参与各类竞赛

多年来,我们都鼓励学生参加蓝桥杯大学生程序设计大赛等类似比赛,通过参与比赛,学生编程能力得到快速提高,对课程基本概念和基础知识的理解也会更上一个台阶,牢固掌握所学知识,同时通过比赛拓展了学生的视野,学习目的性更强更明确,学习积极性相应地也提高了。这种做法也是符合CDIO理念,提高学生系统分析能力编程能力的。

教改存在问题

教改中存在最大问题可能是项目任务资源不足,类似教材不多,可供参考的有限,每个项目任务要具有代表性同时又包含各知识点,需要花大量的时间编制。经过一段时间积累应该素材不断会增加,并在原有基础上不断完善。

3结束语

CDIO理念在强调学生理论基础知识的同时,注重培养学生理论应用能力、团队合作能力。针对当前计算机软件技术课程教学过程中存在的问题,结合CDIO教学理念对学生的要求,探讨以项目为中心、以任务驱动教学,激发学生学习兴趣,培养学生的CDIO能力,取得了较好的教学效果。

参考文献:

[1]周立章.基于CDIO工程教学模式的C++程序设计教学改革探索[J].大众科技,2011(10):208-210.

[2]邱胜海,高成冲,王云霞,等.基于CDIO模式的数据库课程实验项目设计[J].中国现代教育装备,2012,157(21):43-45.

摘要:提高教学质量是高等院校各项工作的重中之重,而教学管理是提高教学质量的重要途径,加强教学管理对规范高校各项管理工作和提高教学水平起着十分重要的作用。随着高等院校计算机专业招生规模的日益扩大,学校教育资源有限以及学生数量不断增加等因素,使得计算机专业教学的开展存在很多问题。文章立足于计算机专业的发展现状,探讨了当前计算机专业在教学管理当中普遍存在的一些关键问题,讨论了如何建立科学、合理的教学管理模式,从管理者、教师和学生三个角色对计算机专业建立完备的教学管理模式进行分析和探讨。

关键词:计算机专业;教学管理;教学质量

教学质量是体现高等院校培养高质量人才、深化学校教学水平的一个重要指标,提高学校的教育质量,需要制定一套完善的教学管理模式。构建科学、合理、可操作性强的教学管理体系,有助于及时发现问题与不足,为领导者制定管理制度和工作规划提供依据。在当前计算机人才需求日益增多的现实背景下,开展计算机专业教学管理模式和制度建设的研究,能够推动计算机教育教学质量的长期发展,提高人才培养质量,这对推进计算机专业人才创新能力和动手能力具有重要的现实意义。

一、计算机教学管理模式的内涵

建立完善的教学管理模式,有助于及时发现教育教学过程中存在的问题,并能有效地解决问题,从而不断提高教育教学质量,最终实现高技能人才培养目标。学校应该有一个专门的队伍来进行教学的督导,督导者需要从学校的现实条件和发展计划出发来对教学部门的教学管理工作进行总的评价和指导,同时对不同的专业和系别进行具体的规划。针对计算机专业,要保证学生学习到计算机专业基础知识,同时要突出学生专业方向的培养;要能够满足社会或行业、企业用人需求,即高等院校的人才培养目标、课程标准或教学大纲、课程安排、教学内容、教学过程等要满足用人单位的需求以及计算机发展的方向;还应该满足国家创新性人才的培养,鼓励学生以及优秀青年教师勇于实践大胆创新,提高学生的团结合作意识以及沟通问题的能力。总之,督导者不仅要起到严格把关的作用,同时还要做到长期提供优质服务,广泛收集各种建议和意见,尽可能给学生和老师创造宽松有利的学习条件。计算机教学质量管理中教师具有极其重要的地位,要不断帮助和促进教师改进教学工作,不断提高其自身的教学水平,不断加强教师师资队伍建设。老师要注意计算机最新发展动态,紧跟其发展潮流,不能脱离社会落后于时代;青年教师要不断积累教学经验,完善教学方法,提高学生的学习兴趣和自己的教学水平。由于计算机专业的特点,老师需要不断更新、补充课程的教学内容,甚至有很多像慕课(MOOC)这样的网络开放新兴课程不断涌现,老师要终身学习,教学管理上也要给老师更多学习的机会,多组织青年教师到社会上的一线企业进行培训和实训。计算机专业是一个需要不断保持学习的专业,它更新换代特别快,从事计算机方面工作的学生要终身学习。所以老师不能只是授之鱼,更要授之以渔,使得学生在走向社会之后能够跟上计算机发展的步伐,始终保持敏锐的洞察力和很强的学习能力。因此,计算机教学质量管理要更注重学生学习能力的培养,而不是简单地完成当前的学习任务。计算机发展之迅速,已经不是原来单打独斗就可以完成一个任务的时代,要求学生有很强的合作能力、交流能力、适应能力、实践能力和组织能力等。教学中必须坚持对学生实施素质教育,不仅要重视学生的学习态度、出勤率、课堂纪律、作业完成情况,更要鼓励学生参加科技竞赛、课外拓展培训以及加强人文素质的培养。关注用人单位对专业人才培养质量的反馈,及时调整学生培养机制。

二、计算机专业教学管理中存在的主要问题

教学管理系统负责保证正常的教学秩序,是提高教学质量的根本。每个学校其实都有一套教学管理制度,然而对于不同的院系专业来说,有其自身的特点,本文主要针对计算机专业中存在的问题进行分析。

(一)教学管理模式尚不完备

随着计算机专业的不断改革以及国家对计算机教学提出的新要求,原有的管理制度难以跟上实际的发展需求,无论是人才培养目标、专业课程设置、教学管理手段以及学生的质量等,都有很大的变化,以前的教学管理模式往往重理论轻实践,大部分是理论学习为主导的模式,而且不同专业人才培养的目标和要求基本一致,没有根据不同的专业特色建立不同管理体系,这就需要有一套更科学、更灵活的教学质量管理体系,要符合不同专业特色,不断适应时代发展的要求,不断顺应社会科学发展的方向。

(二)实践教学资源短缺

计算机专业教学在条件允许的情况下,应该把大部分课程安排到机房进行教学,学习实践同步教学的模式更符合学生的学习习惯,也有利于老师的教学。但是鉴于学校学习资源的限制,实践课课时明显不足,使得教学的开展不是很顺利。计算机专业作为应用性要求较高的专业系别之一,要比其他专业增加实践教学的学时,特别是实践教学在计算机专业的学习当中占有极其重要的地位,直接关系到学生未来就业,其对社会输送应用型人才有着积极的影响。

(三)缺少以人为本的人才培养模式

学校教学质量管理与监督体系,缺少以人为本的管理理念。对于教学质量管理,还是以行政权力为重要手段,在体系中缺少专家学者的监控,忽视他们的建议,对教学质量的评价,其目的就是奖励和惩罚,很难理性地诊断和解决问题,不能以教育改革为目的对教师进行客观的评价,主管者与教师之间缺少互动。在评价学生的学业方面,过度重视理论化知识,忽视学生的应用实践能力,看重考试成绩,忽略学生的全面发展,导致学生缺乏综合能力。

(四)教学的连贯性和发展性

计算机专业的教学具有连贯性,课程学习必须在前序课程学习的条件下,后序课程才能很好地展开。这就要求排课的老师和讲授的老师有积极的沟通,在先序课程完成的情况下合理安排后序课程,保证学生学习的完整性和连贯性。而实际排课当中排课老师和授课老师往往沟通不足,这也是教学管理中需要重视的问题。

三、加强和完善教学质量管理的措施

计算机专业教学质量的提高和有序运行离不开两方面,一方面需要学校分管教学的领导公正、负责、公开地进行不定期监控,另一方面要充分调用老师、学生的教学积极性,调用各种渠道,全面地收集教学一线反馈的教学信息,并根据教学信息对各教学环节和影响教学质量的各个教学因素进行有效调整。针对上面对计算机专业教学管理中存在问题的分析,下面提出一些措施以期能提高教学质量,建立健全质量管理制度。

(一)设立教学团队和导师制度

计算机专业现在趋向于形成一个团队来完成一个工程,所以需要在一个团队负责人领导下有组织地进行。建立一支稳定、相对独立、具有较丰富教学经验和较强研究能力的团队,可以让大家资源共享,互相交流,让青年教师尽快融入。因为一个团队的研究方向、教学内容大致一样,这就方便组内成员可以经常组织讨论教学计划、课程的建设、课堂教学、课后辅导、作业批改、考试命题、成绩评定、成绩分析、实训实践的实施等问题。对于学生,可以在入校的时候给学生分配导师,导师进一步帮助学生制定适合学生专业方向的学习计划和安排,同时老师有研究项目也可以让学生早日参与到项目中来,为日后的学习工作和就业打下坚实基础。

(二)开展多层次评估工作

教学质量评估是实施教学质量管理的主要环节和有效手段,也是教学质量管理体系的一部分。首先,学院领导组织听课环节,每年安排优秀教师、青年教师进行公开课,一方面给青年教师向优秀骨干教师学习的机会,另一方面可以通过实践,大家给青年教师提出宝贵意见和建议,使青年教师可以及时看到自身教学的优势和不足。其次,教师互评,以教研室为单位,组织本领域或者同一门课的老师互相交流互相学习,资源分享,优势互补,因为同方向老师更加了解相关课程,可以给出更直接的建议。最后是学生评课。学生既是教育的接受者和评判者,也是教学的直接参与者,教与学是双方面的,教学质量的提高需要学生在其中积极参与。学生评教工作一般在每学期末(或课程结束时)进行,由教学系组织各班学生对本班任课教师进行教学工作评价,并将评价结果纳入教师教学工作评价管理系统。学生评教的内容包括教师的教学态度、教学素质、教学内容、教学方法、教学效果等。学生是教学工作的主体,对任课教师的教学质量好坏最有发言权。另外还可以建立学科竞赛,奖学金,扣分机制,惩罚机制等。教师评学与学生评教形成了良性互动,对教师“教”与学生“学”起到相互促进、共同提高教学质量的作用。

(三)提供多渠道学习机会

对于教师,可以组织教学经验不足的老师展开集训,观摩具有教学经验的教师讲课,组织有教学经验的教师深入实践环节,到企业中学习;组织教师进行微课、说课竞赛,分享教学心得;聘请学术型教师开展讲座,开拓视野,关注计算机最新发展动态。对于学生,经常聘请一些专业技术过硬的专家学者展开交流,组织学生去一些实际的企业公司进行参观交流,鼓励学生参加学生竞赛,增强动手能力和实践能力以及合作能力。

(四)转变教学方式和教学观念

从专业的讲解上,不仅要重视学生的基础学习,更要与时俱进地给学生补充学科的前沿知识,让学生对时下比较热门的计算机方向和知识有很好的了解。目前国家大力提倡翻转课堂,在教学过程中把以前单纯的老师在课堂上填鸭式讲解转变为学生互动交流,老师不仅仅是讲授知识,更多是提出问题,让学生自己去讨论问题和解决问题。课堂上不再是老师一个人的表演,而是学生做主角,老师答疑解惑而已的良好教学模式。

(五)重视实践实训的教学

计算机是一个需要学生动手练习的课程。在实践中巩固学生的理论知识,当作以后工作的实战演习,为以后培养较高技术应用能力打基础。除了引进企业工程师来校讲课,在双赢的前提下,可以带领组织学生到企业进行实习,使实训发展得到良性运转。

四、结束语

高等院校肩负着为国家发展和社会进步培养合格、优秀人才的重要任务,提高学校的教学质量,加强教学质量管理是符合学校发展规律的。在教学管理日益受到重视的情况下,如何建立合理的管理体制,使计算机专业的教学质量管理工作既能强化计算机专业的学科特点,又能积极适应教学发展的现代化,保持专业教学质量可持续化发展,是当前各大高校都在积极探讨和实践的问题。管理者、教师和学生三个角色要相互交流,相互监督,才能利于专业的不断进步和可持续发展。要健全质量责任制度,明确领导的管理职责,院系主要领导是教学质量的第一责任人,本部门教学质量优劣反映其工作业绩;要重视教师的培养,给青年教师更多机会提高自己,不仅给学生推行导师制度,也可以给青年教师安排经验丰富的教学名师进行指导;计算机专业是一个不断创新与发展的专业,要以应用型人才培养为目的,重视学生的创新能力和应用能力的培养,重视实践教学。高校应该采取多种手段,鼓励提倡学生积极参加社会实践,为以后的工作奠定基础。要以市场经济发展需求为导向,从社会的实际需求出发,设置计算机专业培养方案和人才培养模式,多与知名计算机企业合作,形成自己的特色与优势。

参考文献

[1]张凡.高职院校计算机专业实践性教学质量保障方案的研究[J].四川职业技术学院院报,2015,25(3):141-143.

[2]邓攀.实施教学质量工程提升教学管理水平[J].高教学刊,2014,14:108-109.

[3]王红茹.提高《机电系统建模与仿真》课程教学质量的新探索[J].科技教育,2015,9:151-152.

[4]王承淑.教学质量监控的问题及对策研究[J].当代教育与文化,2015,7(4):112-116.

[5]施燕.加强教学质量内部监控与管理的实践探索[J].赤峰学院学报,2013,29(10):197-198.

[6]冯志敏,林麒,贾让成.高校内部教学质量监控体系的设计与运行[J].高等农业教育,2003,10(10):28-30.

342 评论

啦啦啦啦7

SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:

甲(斤):、、、、、、、

乙(斤):、、、、、、

问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;

H1:甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:

第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。

第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):

第三步:在Test Type栏中,确定检验方法。

SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步:选择输出的结果形式及缺失值处理方式;

第五步:单击OK,得输出结果。

所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。

关键词: SPSS软件 考试数据 统计分析 操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式:

式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式:

r=1-(2)

式中D为两个变量的秩序之差,n为样本容量。

Cronbach a信度系数法计算公式:

α= 1-(3)

式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):

(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。

(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。

(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:

(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。

(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。

检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下:

(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】,输出软件运算结果。

我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。

假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。

参考文献:

[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.

[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.

[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.

猜你喜欢:

1. 统计学数据分析论文

2. spss统计分析实习心得

3. 统计学学年论文

4. 统计学分析论文

232 评论

cdzsmz5288

人们把客观存在的事物以数据的形式存储到计算机中,经历了对现实生活中事物特性的认识、概念化到计算机数据库里的具体表示的逐级抽象过程,即现实世界-概念世界-机器世界三个领域。有时也将概念世界称为信息世界;将机器世界称为存储或数据世界。 一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程,教师为学生授课,学生选修课程并取得成绩。 2、概念世界 概念世界是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述,从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语: 实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。 实体集:同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。 属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。 关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如"职工号"就可作为关键字。 联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。 3、机器世界 存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。数据模型将概念世界中的实体,及实体间的联系进一步抽象成便于计算机处理的方式。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模,用于DBMS的实现。 关系数据库采用关系模型作为数据的组织方式。 关系数据库因其严格的数学理论、使用简单灵活、数据独立性强等特点,而被公认为最有前途的一种数据库管理系统。它的发展十分迅速,目前已成为占据主导地位的数据库管理系统。自20世纪80年代以来,作为商品推出的数据库管理系统几乎都是关系型的,例如,Oracle,Sybase,Informix,Visual FoxPro等。 网络数据库也叫Web数据库。促进Internet发展的因素之一就是Web技术。由静态网页技术的HTML到动态网页技术的CGI、ASP、PHP、JSP等,Web技术经历了一个重要的变革过程。Web已经不再局限于仅仅由静态网页提供信息服务,而改变为动态的网页,可提供交互式的信息查询服务,使信息数据库服务成为了可能。Web数据库就是将数据库技术与Web技术融合在一起,使数据库系统成为Web的重要有机组成部分,从而实现数据库与网络技术的无缝结合。这一结合不仅把Web与数据库的所有优势集合在了一起,而且充分利用了大量已有数据库的信息资源。图1-1是Web数据库的基本结构图,它由数据库服务器(Database Server)、中间件(Middle Ware)、Web服务器(Web Server)、浏览器(Browser)4部分组成。 Web数据库的基本结构它的工作过程可简单地描述成:用户通过浏览器端的操作界面以交互的方式经由Web服务器来访问数据库。用户向数据库提交的信息以及数据库返回给用户的信息都是以网页的形式显示。 Internet技术与相关协议Internet技术在Web数据库技术中扮演着重要的角色。Internet(因特网)专指全球最大的、开放的、由众多网络相互连接而成的计算机网络,并通过各种协议在计算机网络中传递信息。TCP/IP协议是Internet上使用的两个最基本的协议。因此也可以说Internet是全球范围的基于分组交换原理和TCP/IP协议的计算机网络。它将信息进行分组后,以数据包为单位进行传输。Internet在进行信息传输时,主要完成两项任务。(1)正确地将源信息文件分割成一个个数据包,并能在目的地将源信息文件的数据包再准确地重组起来。(2)将数据包准确地送往目的地。TCP/IP协议的作用就是为了完成上述两项任务,规范了网络上所有计算机之间数据传递的方式与数据格式,提供了数据打包和寻址的标准方法。1.TCP/IP协议TCP协议(Transmission Control Protocol,传输控制协议)规定了分割数据和重组数据所要遵循的规则和要进行的操作。TCP协议能保证数据发送的正确性,如果发现数据有损失,TCP将重新发送数据。2.IP协议在Internet上传送数据往往都是远距离的,因此在传输过程中要通过路由器一站一站的转接来实现。路由器是一种特殊的计算机,它会检测数据包的目的地主机地址,然后决定将该数据包送往何处。IP协议(Internet Protocol,网际协议)给Internet中的每一台计算机规定了一个地址,称为IP地址。IP地址的标准是由4部分组成(例如),其中前两部分规定了当前使用网络的管理机构,第3部分规定了当前使用的网络地址,第4部分规定了当前使用的计算机地址。Internet上提供的主要服务有E-mail、FTP、BBS、Telnet、WWW等。其中WWW(World Wide Web,万维网)由于其丰富的信息资源而成为Internet最为重要的服务。3.HTTP协议HTTP协议(Hypertext Transfer Protocol,超文本传输协议)应用在WWW上,其作用是完成客户端浏览器与Web服务器端之间的HTML数据传输。 Web的工作原理与工作步骤万维网简称为Web。Web可以描述为在Internet上运行的、全球的、交互的、动态的、跨平台的、分布式的、图形化的超文本信息系统。1.Web的工作原理Web是伴随着Internet技术而产生的。在计算机网络中,对于提供Web服务的计算机称为Web服务器。Web采用浏览器/服务器的工作方式。每个Web服务器上都放置着大量的Web信息。Web信息的基本单位是Web页(网页),多个网页组成了一个Web节点。每个Web节点的起始页称为“主页”,且拥有一个URL地址(统一资源定位地址)。Web节点之间及网页之间都是以超文本结构(非线性的网状结构)来进行组织的。2.Web的工作步骤Web的工作步骤如下。(1)用户打开客户端计算机中的浏览器软件(例如Internet Explorer)。(2)用户输入要启动的Web主页的URL地址,浏览器将生成一个HTTP请求。(3)浏览器连接到指定的Web服务器,并发送HTTP请求。(4)Web服务器接到HTTP请求,根据请求的内容不同作相应的处理,再将网页以HTML文件格式发回给浏览器。(5)浏览器将网页显示到屏幕上. 图1-2 Web的工作步骤 WWW世界中的标记语言1.HTML语言HTML(Hypertext Markup Language,超文本标记语言)是创建网页的计算机语言。所谓网页实际上就是一个HTML文档。文档内容由文本和HTML标记组成。HTML文档的扩展名就是.html或.htm。浏览器负责解释HTML文档中的标记,并将HTML文档显示成网页。(1)HTML标记HTML标记的作用是告诉浏览器网页的结构和格式。每一个标记用尖括号<>括起来。大多数标记都有一个开始标记和一个结束标记。标记不分大小写。多数标记都带有自己的属性。例如字体标记有FACE、COLOR、SIZE等属性:FACE定义字体;COLOR定义字体的颜色;SIZE定义字体的大小。使用格式: BEIJING 。网页中有很多文本链接和图片链接。链接,又被称为超链接,用于链接到WWW万维网中的其他网页上。在HTML文档中表示超链接的标记是,通过属性HREF指出链接的网页地址URL。使用格式: BEIJING 。(2)HTML程序HTML程序必须以标记开始,以标记结束。在和标记之间主要由两部分组成:文件头和文件体。文件头用标记 来标识,文件体用标记来标识。在文件的头部通常包含整个网页的一些信息。例如标记是用来说明网页的名称;标记是用来说明网页的其他信息,如设计者姓名和版权信息等。所有在浏览器中要显示的内容称为网页的主体,必须放在标记中。下面给出的是一个空网页的HTML程序。 (在此标记中写网页的标题) (在此标记中写网页的内容) (3)HTML规范HTML规范又称为HTML标准,它总在不断地发展。每一新版本的出现,HTML都会增加新的特性和内容。有关HTML版本的详细信息请访问网站。在不同的浏览器中,网页的显示效果可能会有所不同。每一个浏览器都使用自己独特的方式解释HTML文档中的标记,并且多数浏览器不完全支持HTML的所有特性。因为,像Microsoft和Netscape公司在HTML标准上又开发了一些特有的HTML标记和属性,称之为HTML的扩展。这些标记和属性只被他们自己的浏览器所识别,不可能被其他公司的浏览器识别。如果浏览器不能识别HTML文档中的标记,则会忽略这个标记。(4)HTML程序的编辑环境与运行环境HTML文档是一个普通的文本文件(ASCII),不包含任何与平台、程序有关的信息。因此HTML文档可以利用任何文本编辑器来方便地生成。要注意的是HTML文档的扩展名必须是.html或.htm。运行HTML文档可以在任何浏览器下进行,并可在浏览器上查看网页的HTML源代码。关于HTML语言中标记的种类与使用方法将会在第5章中更详细地进行介绍。2.可扩展标记语言(XML)HTML是Web上的通用语言,随着Internet的深入人心,WWW上的Web文件日益复杂化、多样化,人们开始感到了HTML这种固定格式的标记语言的不足。1996年W3C开始对HTML的后续语言进行研究,并于1998年正式推出了XML(Extensible Markup Language,可扩展标记语言)。在设计网页时,XML提供了比HTML更灵活的方法。(1)XML语言的特点XML是国际组织W3C为适应WWW的应用,将SGML (Standard Generalized Markup Language)标准进行简化形成的元标记语言。简单地说,XML是使用标记来描述内容或与内容相关的形式信息的通用语言。一个XML文档由标记和字符数据组成。而作为元标记语言,XML不再使标记固定,允许网页的设计者定义数量不限的标记来描述内容,同时还允许设计者创建自己的使用规则。(2)XML的DTDDTD(Document Type Definition,文档类型定义)是一组应用在XML文档中的自定义标记语言的技术规范。DTD中定义了标记的含义及关于标记的语法规则。语法规则中确定了在XML文档中使用哪些标记符,它们应该按什么次序出现,标记符之间如何 嵌套,哪些标记符有属性等等。DTD可以包含在它所描述的XML文档中,但通常它是一份单独的文档或者一系列文档。作为外部文件可通过URL链接,被不同的XML文档 共享。XML把DTD的定义权开放,不同行业可以根据自己的实际需求定义描述内容的DTD,以适应本行业内部的信息交流和存档需要。因此,适合于不同行业、不同平台的标记语言大批涌现。(3)XML的CSS与XSL强调内容描述与形式描述的分离,一方面可以使XML文件的编写者更集中精力于数据本身,而不受显示方式的细节影响;另一方面允许为相同的数据定义不同的显示方式,从而适合于不同应用、不同媒体,使XML数据得到最大程度的重用。XML文档数据的显示形式是通过样式单定义的。CSS(Cascading Style Sheets)是XML使用的一种标准的级联样式单,XSL(Extensible Style Language)则是可扩展的样式语言。由于XML允许用户创建任何所需的标记,而通用浏览器却既无法预期用户标记的意义,又无法为显示这些标记而提供规则,因此用户必须为自己创建的XML文档编写样式单,样式单可以实现共享。浏览器对一个XML文档的处理过程是,首先去关联它所指定的样式单文件,如果该样式单是一个XSL文件,则按照规定对XML数据进行转换然后再显示,XSL本身也是基于XML语言的,可以将XML转化为HTML后再显示。如果该样式单是一个CSS文件,浏览器就会按照样式单的规定给每个标记赋予一组样式后再显示。 Web数据库访问技术Web数据库访问技术通常是通过三层结构来实现的,如图1-3所示。目前建立与Web数据库连接访问的技术方法可归纳为CGI技术,ODBC技术和ASP、JSP、PHP 技术。 Web数据库访问的三层结构 CGI技术CGI(Common Cateway Interface,通用网关界面)是一种Web服务器上运行的基于Web浏览器输入程序的方法,是最早的访问数据库的解决方案。CGI程序可以建立网页与数据库之间的连接,将用户的查询要求转换成数据库的查询命令,然后将查询结果通过网页返回给用户。一个CGI工作的基本原理如图1-4所示。CGI程序需要通过一个接口才能访问数据库。这种接口多种多样,数据库系统对CGI程序提供了各种数据库接口如Perl、C/C++、VB等。为了使用各种数据库系统,CGI程序支持ODBC方式,通过ODBC接口访问数据库。 CGI工作流程 ODBC技术ODBC(Open Database Connectivity,开放数据库互接)是一种使用SQL的应用程序接口(API)。ODBC最显著的优点就是它生成的程序与数据库系统无关,为程序员方便地编写访问各种DBMS的数据库应用程序提供了一个统一接口,使应用程序和数据库源之间完成数据交换。ODBC的内部结构为4层:应用程序层、驱动程序管理器层、驱动程序层、数据源层。它们之间的关系如图1-5所示。由于ODBC适用于不同的数据库产品,因此许多服务器扩展程序都使用了包含ODBC层的系统结构。 ODBC的内部结构Web服务器通过ODBC数据库驱动程序向数据库系统发出SQL请求,数据库系统接收到的是标准SQL查询语句,并将执行后的查询结果再通过ODBC传回Web服务器,Web服务器将结果以HTML网页传给Web浏览器,工作原理如图1-6所示。 Web服务器通过ODBC访问数据库由于Java语言所显示出来的编程优势赢得了众多数据库厂商的支持。在数据库处理方面,Java提供的JDBC为数据库开发应用提供了标准的应用程序编程接口。与ODBC类似,JDBC也是一种特殊的API,是用于执行SQL语句的Java应用程序接口。它规定了Java如何与数据库之间交换数据的方法。采用Java和JDBC编写的数据库应用程序具有与平台无关的特性。 ASP、JSP、PHP技术ASP是Microsoft开发的动态网页技术,主要应用于Windows NT+IIS或 Windows 9x+PWS平台。确切地说ASP不是一种语言,而是Web服务器端的开发环境。利用ASP可以产生和运行动态的、交互的、高性能的Web服务应用程序。ASP支持多种脚本语言,除了VBScript和Pscript,也支持Perl语言,并且可以在同一ASP文件中使用多种脚本语言以发挥各种脚本语言的最大优势。但ASP默认只支持VBScript和Pscript,若要使用其他脚本语言,必须安装相应的脚本引擎。ASP支持在服务器端调用ActiveX组件ADO对象实现对数据库的操作。在具体的应用中,若脚本语言中有访问数据库的请求,可通过ODBC与后台数据库相连,并通过ADO执行访问库的操作。关于ASP的编程技术将会在第7章中详细介绍。JSP是Sun公司推出的新一代Web开发技术。作为Java家族的一员,几乎可以运行在所有的操作系统平台和Web服务器上,因此JSP的运行平台更为广泛。目前JSP支持的脚本语言只有Java。JSP使用JDBC实现对数据库的访问。目标数据库必须有一个JDBC的驱动程序,即一个从数据库到Java的接口,该接口提供了标准的方法使Java应用程序能够连接到数据库并执行对数据库的操作。JDBC不需要在服务器上创建数据源,通过JDBC、JSP就可以实现SQL语句的执行。PHP是Rasmus Lerdorf推出的一种跨平台的嵌入式脚本语言,可以在Windows、UNIX、Linux等流行的操作系统和IIS、Apache、Netscape等Web服务器上运行,用户更换平台时,无需变换PHP代码。PHP是通过Internet合作开发的开放源代码软件,它借用了C、Java、Perl语言的语法并结合PHP自身的特性,能够快速写出动态生成页面。PHP可以通过ODBC访问各种数据库,但主要通过函数直接访问数据库。PHP支持目前绝大多数的数据库,提供许多与各类数据库直接互连的函数,包括Sybase、Oracle、SQL Server等,其中与SQL Server数据库互连是最佳组合。 网络数据库应用系统的层次体系当前,Internet/Intranet技术发展异常迅速,越来越多的数据库应用软件运行在Internet/Intranet环境下。在此之前,数据库应用系统的发展经历了单机结构、集中式结构、客户机/服务器(C/S)结构之后,随着Internet的普及,又出现了浏览器/服务器(B/S)结构与多层结构。在构造一个应用系统时,首先考虑的是系统的体系结构,采用哪种结构取决于系统的网络环境、应用需求等因素。 客户机/服务器结构1.二层C/S结构二层C/S结构是当前非常流行的数据库系统结构,在这种结构中,客户机提出请求,服务器对客户机的服务请求做出回答。它把界面和数据处理操作分开在前端(客户端)和后端(服务器端),这个主要特点使得C/S系统的工作速度主要取决于进行大量数据操作的服务器,而不是前端的硬件设备;同时也大大降低了对网络传输速度的要求,因为只须客户端把服务请求发送给数据库服务器,数据库服务器只把服务结果传回前端,如图1-7所示。在设计时,对数据可能有如下不同的处理形式。(1)在处理时,客户机先向服务器索取数据,然后释放数据库,即客户机发出的是文件请求,在客户机端处理数据,最后将结果送回服务器。这种处理方式的缺点很明显:所有的应用处理都在客户端完成,这就要求客户端的计算机必须有足够的能力,以便执行需要的任何程序。更为糟糕的是,由于所有的处理均在客户端完成,每次运行时都要将文件整体传送到客户端,然后才能执行。如:Student表中有30 000条记录,客户端发出命令:Select * From Student Where Sno='200101'这条命令将要求服务器将Student表中的所有记录传送到客户端,然后在客户端执行查询,结果只用到一条记录;如果查询的记录不存在,网络传输的数据实际上是无 用的。如此大的数据传输量是不可想象的。因此,人们提出了在服务器中能够执行部分代码的客户机/服务器结构。(2)在处理时,客户机接受用户要求,并发给服务器;在服务器端处理用户要求,最后将结果传回客户机显示或打印。这种处理方式网络通信量较小。客户机向服务器发出的是处理请求,而不是文件请求,处理请求中的代码在服务器端执行后向客户机传送处理后的结果。这样,为了特定任务,客户机上的程序和服务器上的程序协同工作:客户机端的代码用于完成用户的输入输出及数据的检查,而服务器端的代码完成对数据库的操作。客户机/服务器结构的另一个主要特点在于软件、硬件平台的无关性。数据库服务器上的数据库管理系统集中负责管理数据,它向客户端提供一个开放的使用环境,客户端通过数据库接口,如ODBC(开放数据库连接)和SQL语言访问数据库,也就是说,不管客户端采用什么样的硬件和软件,它只要能够通过网络和数据库接口程序连接到服务器,就可对数据库进行访问。在客户机/服务器结构中,常把客户机称为前台,而把服务器端称为后台。前台应用程序的功能包括用户界面、接收用户数据、处理应用逻辑、向后台发出请求、同时接收后台返回的结果,最后再将返回的结果按一定的格式或方式显示给用户。而后台服务器则负责共享外部设备、存取共享数据、响应前台客户端的请求并回送结果等工作。前台的应用程序和数据一般是用户专用的,而后台的数据和代码是所有用户可以共享的。由于数据库服务器不仅要管理共享数据,保证数据的完整性,还要执行一部分代码,完成客户端的一些处理请求,所以对用于服务器的计算机提出较高的要求。最好要采用一台专用的服务器,有较快的处理速度,有大容量的硬盘和内存,支持磁带等大容量的存储设备。上面讲的客户机/服务器结构将应用分在了客户机、服务器两级,称其为两层客户机/ 服务器结构。总之,两层C/S结构的基本工作方式是客户程序向数据库服务器发送SQL请求,服务器返回数据或结果。这种C/S结构有两种实现方式,一种是客户来完成表示部分和应用逻辑部分,而服务器完成数据访问部分,这种情况是以客户为中心的,适用于应用相对简单、数据访问量不是很大的情况。另一种是以服务器为中心的,把一些重要的应用逻辑部分放到服务器上,这样可充分利用服务器的计算能力,减少网络上需要传送的数据。通常以存储过程和触发器的形式出现,但存储过程都依赖于特定数据库,不同数据库之间很难移植,而三层C/S结构可以很好地解决这个问题。注意:触发器(trigger)是数据库系统中,一个在插入、删除、修改操作之后运行的记录级事件代码。不同的事件可以对应不同的动作。通常有3种类型的触发器:INSERT触发器、DELETE触发器和UPDATE触发器。2.三层C/S结构由于两层结构的客户机/服务器系统本身固有的缺陷,使得它不能应用于一些大型、结构较为复杂的系统中,故出现了3层结构的客户机/服务器系统,将两层结构中服务器部分和客户端部分的应用单独划分出来,即采用“客户机—应用服务器—数据库服务器”结构(如图1-8所示)。典型的数据库应用可分为三部分:表示部分、应用逻辑(商业逻辑)部分和数据访问部分,三层结构便是对应于这三部分。 图1-8 三层C/S结构其中,应用服务器和数据库服务器可位于同一主机,也可位于不同主机。客户机是应用的用户接口部分,负责用户与应用程序的交互,运行在客户机端的软件也称为表示层软件。应用服务器存放业务逻辑层(也称为功能层)软件,是应用逻辑处理的核心,实现具体业务。它能响应客户机请求,完成业务处理或复杂计算。若有数据库访问任务时,应用服务器层可根据客户机的要求向数据库服务器发送SQL指令。应用逻辑变得复杂或增加新的应用时,可增加新的应用服务器。数据库服务器便是用来执行功能层送来的SQL指令,完成数据的存储、访问和完整性约束等。操作完成后再通过应用服务器向客户机返回操作结果。 浏览器/服务器结构随着Internet技术和Web技术的广泛应用,C/S结构已无法满足人们的需要。因为在典型C/S体系中,通常为客户安装前端应用程序的做法已不再现实,并且限制客户端工作环境只能基于Windows、Macintosh或UNIX等操作系统也不切实际。于是基于浏览器/服务器结构(Browser/Server)的系统应运而生。采用B/S结构后,在客户端只需安装一个通用的浏览器即可,不再受具体操作系统和硬件的制约,实现了跨平台的应用。基于B/S结构的典型应用通常采用三层结构:“浏览器—Web服务器—数据库服务器”,B/S模式的工作原理是:通过浏览器以超文本的形式向Web服务器提出访问数据库的请求,Web服务器接受客户请求后,激活对应的CGI程序将超文本HTML语言转化为SQL语法,将这个请求交给数据库,数据库服务器得到请求后,进行数据处理,然后将处理结果集返回给CGI程序。CGI再将结果转化为HTML,并由Web服务器转发给请求方的浏览器,如图1-9所示。 图1-9 B/S工作原理在B/S模式中,客户端的标准配置是浏览器,如IE;业务功能处理由独立的应用服务器处理,Web服务器成为应用处理的标准配置;数据处理仍然由数据库服务器处理。从本质上讲,B/S结构与传统的C/S结构都是以同一种请求和应答方式来执行应用的,区别主要在于:C/S是一种两层或三层结构模式,其客户端集中了大量应用软件,而B/S是一种基于超链接(HyperLink)、HTML、Java的三级或多级C/S结构,客户端仅需单一的浏览器软件,是一种全新的体系结构,解决了跨平台问题。到目前,这两种结构在不同方面都有着广泛的应用。虽然C/S结构在Internet环境下明显不如B/S结构具有优势,但它在局域网环境下仍具有优势。 Internet/Intranet信息系统的多层体系结构多层结构应用软件与传统的两层结构应用软件相比,有可伸缩性好、可管理性强、安全性高、软件重用性好等诸多优点,如何在Internet/Intranet环境下构建应用软件体系结构就成为一个非常重要的问题,也是现今软件体系研究的一个新热点。目前各种技术层出不穷,如最初的静态HTML页面、简单的CGI网关程序、Java Applet程序,现在的ASP等Web数据库技术,还有动态的Java在线游戏及PHP技术等。实际上,多层的概念是由Sun公司提出来的。Sun公司提出的多层应用体系包括4层:客户层、顶端Web服务层、应用服务层和数据库层。其中顶端Web服务层是Sun公司多层体系结构中非常重要的一层,它主要起代理和缓存的作用。顶端Web服务器的作用是缓存本地各客户机经常使用的Java Applet程序和静态数据,通常被放置在客户机所在的局域网内,起到一个Java Applet主机(向Web浏览器传送Java Applet程序的计算机)和访问其他服务的代理作用。与普通代理服务器的作用相同。构建多层结构应用软件时,选用Java平台是一个很好的选择,因为它跨越各应用平台。总之,在Java平台上构建多层应用软件体系代表着今后Internet/Intranet应用的趋势。

161 评论

独角兽z

人们把客观存在的事物以数据的形式存储到计算机中,经历了对现实生活中事物特性的认识、概念化到计算机数据库里的具体表示的逐级抽象过程,即现实世界-概念世界-机器世界三个领域。有时也将概念世界称为信息世界;将机器世界称为存储或数据世界。 一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统中有教师、学生、课程,教师为学生授课,学生选修课程并取得成绩。 2、概念世界 概念世界是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述,从而产生概念模型。概念模型是现实世界到机器世界必然经过的中间层次。涉及到下面几个术语: 实体:我们把客观存在并且可以相互区别的事物称为实体。实体可以是实际事物,也可以是抽象事件。如一个职工、一场比赛等。 实体集:同一类实体的集合称为实体集。如全体职工。注意区分"型"与"值"的概念。如每个职工是职工实体"型"的一个具体"值"。 属性:描述实体的特性称为属性。如职工的职工号,姓名,性别,出生日期,职称等。 关键字:如果某个属性或属性组合的值能唯一地标识出实体集中的每一个实体,可以选作关键字。用作标识的关键字,也称为码。如"职工号"就可作为关键字。 联系:实体集之间的对应关系称为联系,它反映现实世界事物之间的相互关联。联系分为两种,一种是实体内部各属性之间的联系。另一种是实体之间的联系。 3、机器世界 存入计算机系统里的数据是将概念世界中的事物数据化的结果。为了准确地反映事物本身及事物之间的各种联系,数据库中的数据必须有一定的结构,这种结构用数据模型来表示。数据模型将概念世界中的实体,及实体间的联系进一步抽象成便于计算机处理的方式。 数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。数据结构、数据操作和完整性约束是构成数据模型的三要素。数据模型主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模,用于DBMS的实现。 层次模型 若用图来表示,层次模型是一棵倒立的树。在数据库中,满足以下条件的数据模型称为层次模型: ① 有且仅有一个结点无父结点,这个结点称为根结点; ② 其他结点有且仅有一个父结点。 根据层次模型的定义可以看到,这是一个典型的树型结构。结点层次从根开始定义,根为第一层,根的子结点为第二层,根为其子结点的父结点,同一父结点的子结点称为兄弟结点,没有子结点的结点称为叶结点。 网状模型 在现实世界中,事物之间的联系更多的是非层次关系的,用层次模型表示非树型结构是很不直接的,网状模型则可以克服这一弊病。网状模型是一个网络。在数据库中,满足以下两个条件的数据模型称为网状模型。 ① 允许一个以上的结点无父结点; ② 一个结点可以有多于一个的父结点。 从以上定义看出,网状模型构成了比层次结构复杂的网状结构。 关系模型 在关系模型中,数据的逻辑结构是一张二维表。 在数据库中,满足下列条件的二维表称为关系模型: ① 每一列中的分量是类型相同的数据; ② 列的顺序可以是任意的; ③ 行的顺序可以是任意的; ④ 表中的分量是不可再分割的最小数据项,即表中不允许有子表; ⑤ 表中的任意两行不能完全相同。 个人版权,请勿复制

319 评论

相关问答

  • 解析ip数据包课程毕业论文

    能不能把你论文发给我啊 我现在急用 谢谢

    驾驶马桶去飞行 5人参与回答 2023-12-06
  • 爬数据课程论文范文

    一、三个世界 1、现实世界 人们管理的对象存于现实世界中。现实世界的事物及事物之间存在着联系,这种联系是客观存在的,是由事物本身的性质决定的。例如学校的教学系统

    Herculeses 6人参与回答 2023-12-09
  • 数据分析课程论文研究对象是

    对客观事物和现象的调查、考察所得观测资料以及有关文献资料数据为研究对象。 理论性论文具体可分成两种,以纯粹的抽象理论为研究对象,研究方法为严密的理论推导和数学运

    梦紫蝶57 4人参与回答 2023-12-10
  • 大数据检测课程论文

    内容如下: 1、大数据对商业模式影响 2、大数据下地质项目资金内部控制风险 3、医院统计工作模式在大数据时代背景下改进 4、大数据时代下线上餐饮变革 5、基于大

    A广州淘上居 4人参与回答 2023-12-09
  • 数学模型课程论文范文

    历年优秀论文要不?

    麻辣个鸡的 6人参与回答 2023-12-08