• 回答数

    4

  • 浏览数

    268

美食VS钞票
首页 > 期刊论文 > 用回归分析方法研究的论文

4个回答 默认排序
  • 默认排序
  • 按时间排序

老实就奇

已采纳

论文常用数据分析方法

论文常用数据分析方法,对好的论文分析研究方法应该从哪些方面展开,如何表达才能显得自己对该论文真的有所理解,应该看哪些书呢?下面我整理了论文常用数据分析方法,一起了解看看吧!

论文常用数据分析方法分类总结

1、 基本描述统计

频数分析是用于分析定类数据的选择频数和百分比分布。

描述分析用于描述定量数据的集中趋势、波动程度和分布形状。如要计算数据的平均值、中位数等,可使用描述分析。

分类汇总用于交叉研究,展示两个或更多变量的交叉信息,可将不同组别下的`数据进行汇总统计。

2、 信度分析

信度分析的方法主要有以下三种:Cronbach α信度系数法、折半信度法、重测信度法。

Cronbach α信度系数法为最常使用的方法,即通过Cronbach α信度系数测量测验或量表的信度是否达标。

折半信度是将所有量表题项分为两半,计算两部分各自的信度以及相关系数,进而估计整个量表的信度的测量方法。可在信度分析中选择使用折半系数或是Cronbach α系数。

重测信度是指同一批样本,在不同时间点做了两次相同的问题,然后计算两次回答的相关系数,通过相关系数去研究信度水平。

3、 效度分析

效度有很多种,可分为四种类型:内容效度、结构效度、区分效度、聚合效度。具体区别如下表所示:

4、 差异关系研究

T检验可分析X为定类数据,Y为定量数据之间的关系情况,针对T检验,X只能为2个类别。

当组别多于2组,且数据类型为X为定类数据,Y为定量数据,可使用方差分析。

如果要分析定类数据和定类数据之间的关系情况,可使用交叉卡方分析。

如果研究定类数据与定量数据关系情况,且数据不正态或者方差不齐时,可使用非参数检验。

5、 影响关系研究

相关分析用于研究定量数据之间的关系情况,可以分析包括是否有关系,以及关系紧密程度等。分析时可以不区分XY,但分析数据均要为定量数据。

回归分析通常指的是线性回归分析,一般可在相关分析后进行,用于研究影响关系情况,其中X通常为定量数据(也可以是定类数据,需要设置成哑变量),Y一定为定量数据。

回归分析通常分析Y只有一个,如果想研究多个自变量与多个因变量的影响关系情况,可选择路径分析。

274 评论

黑糖丸子

数据可以找找,非得要弄问卷调查吗

95 评论

可爱谈心

运用逐步回归法分析影响上海银行存款的因素1.目的和意义在现代商品经济社会中,人们的工作与生活已经离不开货币。在生活中人们所需的各种商品,都需要用货币去购买;人们所需的各种服务,也需要支付货币来获得;人们劳动工作的所获得的报酬——工资,也是用货币支付的;人们为了种种目的,要积累财富,保存财富,采用的主要方式是积攒货币、到银行储蓄。除个人外,企业、行政事业部门的日常运行同样也离不开货币。财政收支也都是用货币进行的。可见,货币已经融入了并影响这经济运行和人们的生活。作为经营“货币”这种商品的银行的功能是办理各种存款(也称为负债业务)、放款和汇兑业务,其中商业银行所吸收的各种存款(活期、定期、储蓄)约占银行资金来源的70%~80%,为银行提供了绝大部分的资金来源,并为实现银行各职能活动提供了基础。所以说,银行存款对银行本身的生存和发展有着重要意义,除此之外,银行存款也能反映出一个特定时期人们的生活水平以及经济发展的水平。因此对上海的银行存款的分析是非常重要且必要的。本文将介绍运用统计分析软件中的逐步回归法对影响上海银行存款的因素进行分析研究并建立模型,为相关专业人士的决策提供一定参考。2.影响银行存款的因素分析存款作为银行吸收资金来源的主要业务,其之影响因素非常的多。从中我选取了10个主要因素的(1951年至2000年)数据运用SPSS的逐步回归法分析和研究它们对上海银行存款的影响程度。这10个因素分别是全市居民储蓄(亿元)、从业人数(万人)、全市居民消费水平(元/人)、全市银行贷款(亿元)、全社会固定资产投资总额(亿元)、职工工资总额(亿元)、职工劳保福利费用(万元)、社会消费品零售总额(亿元)、外贸出口商品总额(亿美元)、全市财政收入(亿元)。上海全市银行存款及影响其的10个因素的1951年至2000年的数据见下表。表上海全市银行存款数据(1951年~2000年)年份 全市银行存款(亿元) 全市居民储蓄(亿元) 从业人数(万人) 全市居民消费水平(元/人) 全市银行贷款(亿元) 全社会固定资产投资总额(亿元) 职工工资总额(亿元) 职工劳保福利费用(万元) 社会消费品零售总额(亿元) 全市财政收入(亿元) 外贸出口商品总额(亿美元)1964 270 33117 276 33819 298 34536 300 35268 293 36016 309 36780 304 37560 318 38356 334 39169 357 39999 380 40847 397 41737 408 46531 411 49797 442 57424 527 81664 582 94004 638 102061 640 113909 688 127679 789 152282 1030 190217 1190 233574 1298 286323 1680 391974 1928 437789 2009 533797 2421 670676 2842 804903 4162 1038701 5343 1241344 6712 1496034 7742 .30 8699 .21 9202 .03 10328 2095239 11546 2521553 注:该表数据来源:《上海统计年鉴》全市居民储蓄(亿元)个人货币收入是用来供个人消费的,积蓄是准备用作远期消费或不可预测的需要,它们都不是资本,金额也比较小。由于现代银行制度的发展,举办储蓄,并支付利息,小额的货币收入就可以转化为资本,从而扩大了社会资本总量,加速经济的发展。由表可看到,随着社会经济的发展和人们收入的不断提高,全市居民储蓄从1951年的亿元增加至2000年的亿元,特别是1985年之后呈快速增长趋势。可见社会公众的储蓄增长会提高银行盈利资产的规模,一定程度上使商业银行获得更多的收益。所以,全市居民储蓄对银行存款有着直接而深远的影响。从业人数(万人)从业人数是指在全市各行各业的企事业单位中从事工作人数的总和,其包括了国有、集体、合资、独资等其他单位的从业人员,城镇个体劳动者,农村集体和个体劳动者以及其他劳动者。从表可知,从业人数是呈稳定增长趋势的,这与全市人口的增加有着极大的关系。上海近十几年经济的飞速发展和国际大都市的形象,吸引了大批的外来人口(外地和外国)来沪居住、创业以及工作。随着全市企业数量的不断增加,从业人数也在不断的增加。从业人数的多少与银行存款有着紧密的联系,因为每个从业人员都会有自己的收入,不管收入的多与寡,他们每个人都会在银行拥有一个以上的帐户并利用存折、借计卡来取工资或办理各种活期、定期的储蓄或取款;利用信用卡刷卡消费或提款。全市居民消费水平(元/人)居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出来。反映居民消费水平的主要指标有:(1)平均实物消费量指标:平均每人全年主要有消费品的消费量、平均每百户耐用消费品拥有量、人均居住面积、平均每人生活用水量、平均每人生活用电量等;(2)现代化生活设施的普及程度指标:自来水普及率、煤气普及率、平均每百户主要家用电器拥有量、电话普及率等;(3)反映消费水平的消费结构指标:居民生活消费支出中食品的比例、居民生活消费支出中文化生活服务支出比例、不同质量消费品的消费比例等;(4)平均消费量的价值指标:平均每人消费基金、平均每人生活消费额、平均每人用于各项生活消费的支出等。从表中可以看到1990年以后的居民消费水平有了大大的提升,可见人们的生活质量随着改革开放的步伐的加快也越来越好。全市银行贷款(亿元)贷款,又称放款,是银行将其所吸收的资金,按一定的利率贷给客户并约定归还期限的业务。虽然银行运用资金的方式不止贷款一种,但是贷款是商业银行在其资产业务中的比重一般占首位。通过贷款联系,银行可密切与工商企业往来联系,有利于拓宽业务领域,获得更多的利润。银行贷款的种类按不同的标注至少又以下几类:按期限分为短期贷款、中期贷款和长期贷款;按用途可分为投资贷款、商业贷款、消费贷款和农业贷款;按贷款是否有抵押品分为:抵押贷款和无抵押贷款;按换款的方式分为:一次偿还贷款和分期偿还贷款。从表可知,银行贷款不断的大幅度增加,表明了经济的快速发展和人们消费理念的变化。全社会固定资产投资总额(亿元)固定资产投资总额是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。全社会固定资产投资包括基本建设投资、更新改造投资、国有单位其他固定资产投资、房地产开发投资、城镇集体固定资产投资、联营经济、股份制经济、外商投资经济、港澳台投资经济及其他经济类型的固定资产投资,农村集体5万元以上固定资产投资,城镇工矿区私人建房投资和国防、人防基本建设投资。全社会固定资产投资按经济类型可分为国有、集体、个体、联营、股份制、外商、港澳台商、其他等。按照管理渠道,全社会固定资产投资总额分为基本建设、更新改造、房地产开发投资和其他固定资产投资四个部分。是社会固定资产再生产的主要手段。通过建造和购置固定资产的活动,国民经济不断采用先进技术装备,建立新兴部门,进一步调整经济结构和生产力的地区分布,增强经济实力,为改善人民物质文化生活创造物质条件。这对我国的社会主义现代化建设具有重要意义。从表可知,固定资产投资的总额是呈不固定态势来增长的,2000年的固定资产投资总额比1900年的增长倍,非常真实地反映了上海在上世纪90年代经济的腾飞。职工工资总额(亿元)职工工资总额是指各单位在一定时期内直接支付给本单位全部职工的劳动报酬的总和,包括奖金、津贴、补贴、加班工资和其他工资(附加工资、保留工资以及调整工资补发的上年工资等)。职工工资从某种程度上来说是市民收入的主要来源。而收入比较高的话,居民用于消费和储蓄的金额也会有相应的提高,所以职工工资直接影响着银行存款。职工劳保福利费用(万元)劳保福利是指劳动保险和福利。为了保护工人职工的健康,减轻其生活中的困难,我国对劳动保险制定了相应的法律条文。福利指员工与工人福利之总称,亦指以企业员工为对象而实施的福利措施,包括法定的福利,企业主与工会所实施的提高职工生活水准的各种措施。由表可知,2000年,单位支付职工劳保福利费用的总额已经达到2521553万元,并且其比例每年以3%~8%的速度增长,已高达%,这一数据说明人们的基本生活标准可以得到保障,从而有更多的钱用于其它的消费和用于储蓄存款或其他金融投资。社会消费品零售总额(亿元)社会消费品零售总额是指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。包括售给城乡居民用于生活消费的商品(不包括住房)和售给机关、团体、部队、学校、企业、事业单位和城市街道居民委员会、农村村民委员会用公款购买的用作非生产、非经营使用的消费品。这个指标反映通过各种商品流通渠道向居民和社会集团供应生活消费品来满足他们生活需要的情况,是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。全市财政收入(亿元)财政既然要提供公共物品来满足公共需要,就要从国内总收入(GDI——与生产指标GDP相对应的收入指标)中集中一部分收入,从这个意义上来理解,财政收入是指一定量的货币收入,即国家占有的以货币表现的一定量的国内总收入;财政收入又可以理解为一个分配过程,这一过程是财政运行的第一个阶段或第一个环节,在其中形成特定的分配关系或利益关系。财政收入按其形式分为税收、收费、债务收入、铸币税和通货膨胀税。财政运行是国民经济的运行的一个部分,国民经济的运行决定了财政的运行,而财政的运行也反过来影响国民经济的运行,直接影响投资、消费和进出口,影响GDP的增长和结构,影响收入分配和各阶层之间的收入差距,影响经济的稳定和可持续发展。外贸出口商品总额(亿美元)对外出口贸易一直以来是上海经济发展的重要环节及体现,也是赚取外汇,达到国际收支平衡和增加国际储备的前提条件。随着中国加入WTO,上海的对外贸易也越来越频繁且出口的商品数量和金额也大大的提高。目前国际货物买卖合同中买卖双方就支付条款的订立大多都通过银行采用现汇结算的方式。在国际货物买卖中使用的结算工具主要是货币和票据,而银行作为买卖双方的结算中介为其办理汇兑业务、信用证业务、承兑业务。前两者是银行存款业务衍生出来的结算业务,而承兑业务是以银行的信用来确保客户的信用。到2000年底,一般贸易出口增幅继续高于加工贸易,而出口产品结构调整也随之加快,高新技术产品和机电产品出口快速增长。3.回归方法与模型建立研究方法与原理运用多元线性逐步回归方法研究预测影响上海的银行存款的因素。逐步回归是按自变量对因变量的作用程度从大到小逐个引入回归方程,每引入一个变量同时检验方程中各个自变量的显著性,合格保留、不显著剔除,反复进行直到再没有显著的变量可以引入为止。回归分析是根据自变量的最有组合建立回归方程(模型)预测因变量的未来发展趋势。该方法的运用条件是有大量的观测统计数据,适用研究没有确定关系形式的因素对象,运用工具为SPSS统计软件。模型的建立及求解因为银行存款与大部分变量呈指数关系,所以把表的各个原始变量的50年数据进行对数变换(LN10()),并且把转换后的样本数据倒退8年后来建模。设多元线性回归的模型为:lnY=β0+β1X1+β2X2+β3X3+…+β9X9+β10X10其中:Y:全市银行存款(亿元)X1 ——全市居民储蓄(亿元) X6 ——职工工资总额(亿元)X2 ——从业人数(万人) X7 ——职工劳保福利费用(万元)X3 ——全市居民消费水平(元/人) X8 ——社会消费品零售总额(亿元)X4 ——全市银行贷款(亿元) X9 ——全市财政收入(亿元)X5 ——全社会固定资产投资总额(亿元) X10 —— 外贸出口商品总额(亿美元)注:模型中倒退的年数用(t-n)表示,其中n表示倒退几年。(t-n)不参与任何计算,它只做标识之用。利用对样本数据进行统计分析,运行后的输出的结果如表所示。表 逐步回归统计分析结果 CoefficientsModel Unstandardized Coefficients Standardized Coefficients t Std. Error Beta18 (Constant) .334居储7 .692 .146 .595 .000从人1 .604 .216 .029固投6 .046 .000财政4 .146 .000银贷4 .100 .813 .000劳福2 .189 .000工资1 .232 .754 .000财政3 .134 .000从人8 .336 .000从人2 .670 .479 .000银贷2 .520 .110 .440 .000劳福6 .418 .193 .305 .039即回归模型为:lnY=(t-7) +(t-1) -(t-6) -(t-4) +(t-4) -(t-2) +(t-1) -(t-3) -(t-8) +(t-2) +(t-2) +(t-6)所以,在倒退8年的50年数据样本中,银行存款的增长与前7年的全市居民储蓄,前1年、前8年、前2年的从业人数,前6年的全社会固定资产投资总额,前4年和前3年的全市财政收入,前4年和前2年的银行贷款,前2年和前6年的职工劳保福利费用,前1年的职工工资总额等因素之间有显著意义的相关关系。4.结论和评价模型评价进入因素的分析表 Variables Entered/Removed(a)Model Variables Entered Variables Removed Method1 居储7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).2 工资7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).3 固投8 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).4 从人1 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).5 . 工资7 Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).由于软件通过特定程序对上海市相关数据进行整体的统计运算,所以具有更强的客观性和公证性。从上表中可以看出,按自变量对因变量的作用程度从大到小首先引入的是前7年的居民储蓄,等到第五步时把之前进入的前7年的职工工资给剔除了,再后面的第14和第17步中把前8年的固定投资和前3年的银行贷款给剔除了。这3个被剔除的变量在引入变量越来越多的情况下被检验出其显著性不合格。除此之外,在10个自变量中,诸如全市居民消费水平、社会消费品零售总额、外贸出口商品总额没有进入模型。因为的外贸出口商品总额涨幅没有达到足以进入方程的显著性,所以被剔除了。不过,随着贸易全球化和中国国际地位的提高,上海的外贸出口总额也会不断的增加,在不久的将来会对银行存款起明显的作用。我们可以从表看到,在进入的因素中全社会固定资产投资总额、财政收入、前2年的职工劳保福利费用、前8年的从业人员与银行存款是负相关,即随着它们的增加加快,银行存款的增长会减慢,其中前2年的职工劳保福利费用影响最强,其系数为。前8年的从业人员、财政收入、全社会固定资产投资总额的影响顺次递减。比如说,全社会固定资产投资总额增加,表明了国有、集体、个体、联营、股份制、外商、港澳台商提供了对基本建设、更新改造、房地产开发投资和其他固定资产投资额,那么他们必须从银行拿出自己的存款,有时还需要向银行进行贷款来完成投资,所以银行的存款量会增加缓慢是可以想象的。又比如说财政收入,政府的财政收入是通过税收、收费等途径获得,如果国家对个人、企业所征取的税越多的话,个人与企业的支出就会增加,净收入也就变少了,而如果其用于消费的指出不变或提高的话,那么其用于银行存款的货币就会相应减少,从而导致全市银行存款的递增缓慢。而居民储蓄、银行贷款、职工的工资、前1年和前2年的从业人员、前6年的职工劳保福利费用与银行存款呈正相关,即随着它们的增加加快,银行存款的增长也会加快,其中前四年的银行贷款的影响最强,其系数为,其次是居民储蓄等等。比如说,职工工资的增加会使得人们的收入上升,收入上升后虽然有一部分会被用来支付消费,但绝大部分人们还是会把钱存入银行,用于各种类型的投资,这种行为使得银行存款的增加加快。又如:居民储蓄的增加,当然会直接影响银行存款量的增加,这是勿庸置疑的,因为居民储蓄是银行存款业务的主要内容,它是银行吸收资金的主要方式。再如:经济的发展会使得银行贷款量上升,银行想要通过贷款给个人或企业客户来获得更多利润,那么银行就会运用各种手段来增加吸引资金量。在这种情况下,社会上的闲置资金由于较高的收益而会流向银行,使得银行存款增加速度加快。从表中我们可以看到,随着进入的变量越多,F值由大变小,然后再由小变大,使得最后一步的F值达到,表明回归模型包括12个变量,且拟合度较高。自相关问题的诊断DW值一般要求~时,残差与自变量互为独立。从表可见回归模型的DW值为,说明该模型无自相关的问题,此模型可以被使用。表 Model Summary(s)Model R R Square Adjusted R Square Std. Error of 样本检验表年份 取对数值(y1) 取对预测值(y2) 相对误差(%)2001 以上的样本检验的相对误差的计算方法是用2001年~2003年各个取对预测值减去对应的取对数值之后再除以取对数值后得到的。其公式:相对误差=(y2-y1)/y1×100%样本检验的相对误差需不大于10%,表示所建立的模型是可以使用的。表中的所计算的相对误差的都小于10%,说明模型建立的较好。残差正态性检验图 银行存款对数的标准化残差直方图图表明:标准化残差的正态曲线的均值为0,标准差为,接近标准正态曲线,基本满足随机误差项正态分布的假设理论,模型拟合效果比较好。银行存款对数的正态概率图和残差散点图图 正态概率图图 散点图图表明:代表样本残差的数据点基本处在表示指定正态分布的直线上或周围,因此基本符合残差正态分布的假设理论。图表明:残差散点的分布随机均匀,且大多落在水平直线-2和2之间,所以可以判断残差与因变量之间相互独立性较高,基本满足残差独立的假设理论,模型的拟合效果比较好。结论综上所述,商业银行的存款不断的增加,可以反映上海居民的收入在不断地增加、生活品质也在不断的提高,更可以从侧面反映上海金融的飞速发展和经济的繁荣。我国加入世贸组织后,金融对外开放程度加深,国内各银行之间、外资银行与中资银行之间的竞争越来越激烈,而存款是竞争的重要领域。随着我国国民物质生活的丰富,消费观念的变化,投资渠道的增多,这些因素将深刻地影响客户存款需求的特性。目前我国商业银行负债以存款为主,负债结构单一,缺乏稳定性;同时银行特别是国有商业银行由于历史和体制的原因,存在资产质量差,不良贷款率高,资本金不足等问题,使得我国银行业积聚了大量的风险。因此,我国商业银行的存款产品必须进行契约设计的改进,完善其中的激励与约束对等的机制设计,创新存款产品种类,满足不同客户的个性化需求;同时要提高存款的稳定性。上海作为全国的金融中心,应该顺应时代的进步建立一个合理的金融体系并完善其制度,而商业银行作为金融的重要环节应不断地对自身进行改革和创新更好地为个人和企业客户服务,这对于上海人民的生活水平的提高和经济的稳定发展具有重要的意义和作用。参考文献[2]黄达.金融学[M].北京:中国人民大学出版社,2004[3]郑道平.货币银行学原理[M].北京:中国金融出版社,2005[4]陈共.财政学[M].北京:中国人们大学出版社,2004[6]彼得·K·奥本海姆,官青译.跨国银行业务[M].北京:中国计划出版社.2001[6]上海统计年鉴.

336 评论

AndyBarrel

统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!

医学统计学方法应用的错误解析

一、引 言

医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。

关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。

1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。

2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。

3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。

四、小 结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。

参考文献:

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

统计学专业毕业现状分析与对策研究

本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。

中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。

本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]

一、统计学专业毕业论文质量的现状分析

从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为。

从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。

从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的。二是数学专业教育和数学思维的研究,占总数的。研究统计学专业问题的毕业论文占绝大部分,比例为,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。

此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约分。

二、统计学专业毕业论文存在的问题

毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:

1.创新性不够

学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占,与实证型论文的比例为1︰,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。

2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象

有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。

3.相对前沿的分析方法利用较少

前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约,其他各统计方法使用的比例分别为:聚类分析为,判别分析为,相关性分析为,多元统计方法为,时间序列分析为,极少有学生使用教科书外的相对前沿的分析方法。

4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题

从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。

三、存在问题的原因分析

针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:

1.学生对论文不够重视

部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。

2.缺乏指导教师的针对性指导

指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。

3.学生的专业训练还不够

大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。

四、提高毕业论文质量的建议和 实践

1.加强毕业论文重要性的宣传,提高学生的重视度

加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。

2.选题和教师的科研项目相结合,提高论文的创新性

在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。

3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力

为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。

4.加强学生科技论文写作训练

加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。

5.实施激励措施,激发学生的兴趣和主动性

针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。

6.加强教师责任心,建立完善的机制

加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。

259 评论

相关问答

  • 运用回归分析方法研究的论文

    第一节 一元线性回归方程的显著性检验由上面的讨论知,对于任何的两个变量x和Y的一组观测数据( )(i=1,2,……,n)按公式(10)和(11)都可以确定一

    漫漫迷秋途 3人参与回答 2023-12-10
  • 论文回归分析的模板

    论文就是用来进行科学研究和描述科研成果的 文章 ,写作论文是要按照一定的格式来规范自己的论文的。下面是我带来的关于论文写作格式模板的内容,欢迎阅读参考!论文

    凌人happy 5人参与回答 2023-12-12
  • 用回归分析方法研究的论文

    论文常用数据分析方法 论文常用数据分析方法,对好的论文分析研究方法应该从哪些方面展开,如何表达才能显得自己对该论文真的有所理解,应该看哪些书呢?下面我整理了论文

    美食VS钞票 4人参与回答 2023-12-11
  • 论文研究方法回归分析法怎么写

    问题一:多元线性回归分析论文中的回归模型怎么分析 根据R方最大的那个来处理。(南心网 SPSS多元线性回归分析) 问题二:谁能给我列一下多元线性回归

    joannatang2008 3人参与回答 2023-12-08
  • 应用回归分析论文模板

    运用逐步回归法分析影响上海银行存款的因素1.目的和意义在现代商品经济社会中,人们的工作与生活已经离不开货币。在生活中人们所需的各种商品,都需要用货币去购买;人们

    宁波的的汤圆 3人参与回答 2023-12-08