lovejing0326
原假设: 在假设检验中,我们首先对总体参数做一个尝试性的假设 。 备选假设: 定义另一个与院假设的内容完全对立的假设 。 1)将研究中的假设设置为备选假设的情形 在很多应用中都涉及到要通过搜集证据来支持引入某些新方法或新功能会对现状有所改善的研究假设,此时可能将备选假设设置为研究者期望得到的结果。更具体地,假设工程师希望测试一个新开发的引擎能否实现燃油效率超过 24 英里/加仑,那么此时可以将两个假设设置为: 零假设 Null hypothesis:H0: μ ≤ 24 备选假设 Alternative hypothesis:Ha: μ > 24 如果通过抽样得到的燃油效率的均值 ≤ 24,那么此时就将无法拒绝零假设,也即新的设计并未改善燃油效率。反之,如果抽样得到的燃油效率的均值 > 24,那么此时可以拒绝零假设而选择支持备选假设。 2)将受到挑战的假设作为零假设 在很多其他的应用中,需要研究的对象是对总体的某个特征或参数的一个假定,此时,一般将这个假定设置为零假设。通过假设检验需要实现的是对于这个假定进行挑战,进而确认是否能够拒绝零假设而支持备选假设。更具体地,假设某个饮料的容量标示为 300 ml,此时假定其标示是正确的,即: 如果经过抽样得出的结论支持零假设,则证明无需采取任何行动。否则,消费者可能会考虑起诉饮料公司。 而从公司经营的角度,如果饮料持续超标准容量罐装,则会产生额外的生产成本,因此,如果公司需要针对罐装容量做调查,则会希望罐装的均值保持在 300ml左右小范围波动,即此时的假设设定为: 零假设 Null hypothesis:H0= 300 备选假设 Alternative hypothesis:Ha≠ 300 从这个例子中可以看出,即便针对同一个研究对象,不同的出发点也会导致不同的假设形式,因此针对具体情景的假设设定就显得非常重要了。 3)、零假设和备选假设的一般形式 更一般地,如果令 μ0来代表事先主张的某个值,根据不同的假设设定,零假设和备选假设共有三种形式:H0: μ ≥ μ0,HA: μ < μ0 H0: μ ≤ μ0,HA: μ > μ0 H0: μ = μ0,HA: μ ≠ μ0 值得注意的是,三种形式下相等的部分都发生在零假设下,且后续会知道前两种形式称为单尾检验,最后一种为双尾检验 理想情况下无论支持或否定零假设都是基于统计事实的正确决策,但实际情况是由于样本选取的不同,或者说由于抽样误差的存在,我们可能在零假设本身是正确的情况下选择了拒绝零假设,转而支持备选假设,当然也存在零假设原本应该被拒绝的情况下错误的选择了支持零假设,这两类错误分别称为 Type I 错误和 Type II 错误。I 类错误意味着错误的拒绝零假设 Type I error of rejecting H0,II 类错误意味着错误的接受零假设 Type II error of accepting H0。 显著性水平 再一次地,如果被研究对象的总体服从正态分布,那么以下假设检验的讨论计算结果都适用,而当总体不服从正态分布时,如果样本量足够大的情况下也同样适用。 单尾检验又分为以下两种形式:左尾检验 Lower tail test 和右尾检验 Upper tail test,后续我们会看到,之所以称左尾检验是在这个检验中,我们想要了解的是样本统计值是否落在某个设定的临界值/显著水平的左侧。同理,针对右尾检验,我们需要了解的是样本统计值是否落在某个设定的临界值/显著水平的右侧。 左尾检验 H0: μ ≥ ,HA: μ < 右尾检验 H0: μ ≤ ,HA: μ > 举一个更加具体的例子,假设一家公司的产品标牌上注明的产品容量是 3 公斤,消费者权益保护机构也认同不可能每一罐产品的容量都丝毫不差的等于 3 公斤,但从保护消费者权益的角度只要确认总体的均值 μ ≥ 3 公斤即可,这里的 3 就是 。此时为了了解产品实际的填充情况,可以建立对“产品罐装质量大于等于 3 公斤”这个假设的一个检验如下: : μ ≥ 3 : μ < 3 在选定了假设检验的零假设和备选假设后,可以通过对产品进行抽样,假设抽样的产品数量为 36 罐,如果依据抽样的数据计算得到的 x̄ 的值小于 3 公斤,由于样本差异的存在,我们不能简单的直接拒绝零假设。调查者需要确认的是:到底 x̄ 小于 3 公斤的程度达到多少时,我们愿意承担犯第一类错误的风险而确定的宣称罐装重量的差异应该引起重视,或者进一步的采取惩罚行动。在这个决策当中,影响这个差异大小评价的一个重要因素就是显著水平的高低——也即调查者愿意承担的犯第一类错误的风险。 本例中调查人员愿意承担 1% 的犯第一类错误的风险来根据小于 3 公斤的样本统计值宣布对于这家公司进行处罚,也即 α = 。 继续上面的例子,在抽样完成后,如果假定由于对这家公司长期的监督中发现其总体的均方差 σ = ,且灌装质量总体上服从正态分布,那么抽样得到的 x̄ 的抽样分布将服从均值为总体均值 μ,均方误差为 = 的正态分布,在本例中 μ = =3, = 。此时,我们可以通过计算标准值 z = (x̄ - μ) / 来了解在服从前面这个抽样分布的前提下,抽样得到某个 x̄ 取值的概率。在后续可以知道,由于统计在检验中使用 z 这个统计值可以判定检验的结果,在这里 z 被称为检验统计量。 在获取了这个检验统计量以后,我们可以通过以下两种方法得到检验的结论: p-value 法: 前面已经讲到,对于总体均值的左尾检验来说,在零假设中期望总体的均值应该是超过某个假设值的,但由于抽样误差的存在,我们可能会得到一个小于假设值的 x̄,此时必须要回答的一个问题就是,当这个 x̄ 与假设值左偏多少时,我们愿意承担一定的风险来拒绝零假设。 在已经获得 z 这个检验统计量后,可以根据标准正态分布表查取取得这个 z 值的概率,并将这个概率值称为 p-value。如果对应的 p-value 很小,则意味着在服从前述假设前提的概率分布的样本中取得这个 x̄ 的概率很小,这意味着零假设 H0这个前提很可能是有问题的。此时如果我们已经设定好了显著水平 α,即在零假设正确的前提下拒绝零假设的概率,并且发现 p-value 小于这个显著水平,那么我们可以更加确信的拒绝 H0。 回到这个具体的例子,假设我们得到的 x̄ = ,则其 z = ( - 3) / = ,对应标准正态分布中取得这个 z 值或比其更小的 z 值的概率为 ,这意味这我们从一个均值为 3,均方误差为 的正态分布中取得 x̄ = 或更小值的概率为 P(x ≤ ) = 。 前面由于已经知道管理者愿意承担的第一类错误的风险值为 α = ,此时由于 p-value = 远小于这个值,据此可以更加确定地拒绝零假设。 更一般地,在左尾检验中,如果在假设检验中得到的 p-value 小于等于显著水平 α,我们就可以拒绝零假设。由于 p-value 来自于对总体的一个观测,对于任意小于等于 α 的 p-value,我们都会拒绝零假设,因此 p-value 也被称为观测到得显著水平。 临界值法 : 临界值法要求我们为检验统计量设定一个临界值,对于左尾检验来说,如果检验统计量小于临界值,那么就可以拒绝零假设。如果理解了显著水平这个定义,由于其就是对应标准正态分布中 z 取得某个值左侧部分的概率值,这个值也就是这里的临界值,也即 α = P(z ≤ 临界值) 。 在临界值法进行左尾检验中,如果事先已经设定了显著水平,则可以根据标准正态分布表查取取得这个临界值及其左侧部分的概率为 α 时对应的 zα值,然后用这个值和检验统计得到的 zx̄进行对比,如果 zx̄≤ zα那么则可以拒绝零假设。 从上述计算过程可知,p-value 法和临界值法是基于同一个原理,也即在抽样中,符合一定条件的抽样分布服从正态分布,在此基础上 α 就是样本统计值取在某个临界点及其左侧区域内的概率值,此时: 上面的讨论是针对左尾检验来说的,根据 p-value 的定义,在实际应用中有: 多时候我们需要被研究对象的某个特征固定在某个假设的取值附近,既不能太大,也不能太小。此时如果采用抽样的形式对于总体的特征参数进行研究时,有的样本的均值的取值会大于这个假设的取值,有的样本的均值的取值会小于这个假设的取值,也即抽样得到的均值的取值围绕设定值左右波动,那么如何有依据的评价这个波动的大小进而拒绝这个假设还是不拒绝这个假设就需要采用双尾检验。其零假设和备选假设的一般形式为: 再一次地,这个评价的依据就是选择好的显著性水平 α,只不过与单尾检验最重要的区别在于,α 对应的概率值被平均分配为正态分布的左右两侧 面积下的概率,其目的是考察抽样统计值围绕事先设定的假设值的左右偏离程度。相应的 p-value 也是取得检验统计值及其相反数的正态分布两侧的概率,并且当 P(z ≥ ) + P(z ≤ - ) ≤ α 时拒绝零假设,或者当采用临界值法时样本统计值 z ≥ 或 z ≤ - 可以认为在服从前述假设分布的情况下取得这个 z 值是小概率事件,也可以拒绝零假设。 至此,对于总体均方差已知的情况下对于总体均值的假设检验的讨论就结束了,总结前面的内容如下:
LD中国王海如
方差分析背后的逻辑是以共同总体方差 的两个独立的估计量为基础。 的一个估计量是以样本均值它们自己之间的变异性为依据, 的另一个估计是每个样本内部数据的变异性为依据。通过比较 的这两个估计量,我们能够确定总体均值是否相等。 假定从 个总体或处理中的每一个抽取一个容量为 的简单随机样本,对于得到的样本数据,令 代表第 个处理的第 个观测值; 代表第 个处理的观测值个数; 代表第 个处理的均值; 代表第 个处理的样本方差; 代表第 个处理的样本标准差。 第 个处理的样本均值与样本方差的计算公式如下:总样本均值的计算公式如下: 其中 若每个样本的容量是相等的,都为 ,则 ,则 式简化为均方处理(mean square due to treatment, ): 其中, (sum of squares due to treatment)的计算公式如下: 若 为真,则 给出了 的一个无偏估计。但是,如果 个总体均值不相等,则 就不是 的无偏估计;在这种情形下, 将会高估总体方差 。 均方误差(mean square due to error, ) 其中, (sum of squares due to error)的计算公式如下: 是以每个处理内部的变异性为依据,它不受原假设是否为真的影响,因此, 永远给出 的一个无偏估计。 总平方和( )代表处理个数, 代表区组个数, 代表总样本容量( ), 代表在区组 中对应于处理 的观测值, 代表第 个处理的样本均值, 代表第 个区组的样本均值, 代表总样本均值。 第 步:计算总平方和( ) 第 步:计算处理平方和( ) 第 步:计算区组平方和( ) 第 步:计算误差平方和( )代表因子 的水平数, 代表因子 的水平数, 代表复制的个数, 代表实验中观测值的总数( ), 对应于因子 的处理 和因子 的处理 的第 次复制的观测值, 代表处理 (因子 )的观测值的样本均值, 代表处理 (因子 )的观测值的样本均值, 代表处理 (因子 )和处理 (因子 )的组合的观测值的样本均值, 代表总样本均值。 第 步:计算总平方和( ) 第 步:计算因子 的平方和 第 步:计算因子 的平方和 第 步:计算交互作用的平方和 第 步:计算误差平方和( )建立原假设与备择假设 检验统计量 拒绝法则 值法:如果 值 ,则拒绝 临界值法:如果 ,则拒绝 其中, 是分子自由度为 ,分母自由度为 时,使 分布的上侧面积或者概率为 时的 值。 完全随机化设计的方差分析表 多重比较方法是在成对的总体均值之间进行统计比较,以确定在 个均值之间到底哪几个均值之间存在差异。 建立原假设与备择假设 检验统计量 拒绝法则 值法:如果 值 ,则拒绝 临界值法:如果 或者 ,则拒绝 其中, 是自由度为 时,使 分布的上侧面积为 时的 值。 建立原假设与备择假设 检验统计量 显著性水平 下的拒绝法则 如果 ,则拒绝 式中 其中, 是自由度为 时,使 分布的上侧面积为 时的 值。式中 其中, 是自由度为 时,使 分布的上侧面积为 时的 值。 如果式 的置信区间包含数值 ,则我们不能拒绝两个总体均值相等的原假设;如果式 的置信区间不包含数值 ,则我们可以得出两个总体均值之差存在差异的结论。 区组划分的过程就是对所有的处理使用相同的或者相似的实验单元的过程,区组划分的目的是从误差项中删除来自外部的变异,因此给出了总体或处理均值之间是否存在差异的更有力的检验。 因为有 个区组使得自由度减少了 ,所以随机化区组设计的误差自由度小于完全随机化设计的误差自由度。如果 很小,因为误差自由度的减少,区组的潜在影响可能被掩盖;当 很大时,这种影响被最小化了。 析因实验的实验设计方法允许我们得到有关两个或者两个以上因子同时存在的统计结论。
珠宝理财
统计学的生命力就在于应用,应用为统计学的发展赋予活力。 “十五”期间异方差性时间序列问题研究、离散多元统计分析研究、数据挖掘理论研究、异常数据诊断的研究、非参数理论与方法的研究、抽样与非抽样误差理论的研究等将是统计理论研究的热点。知识经济、新经济对统计理论与方法提出更高要求,如何适应电子商务时代统计数据的收集,空间遥感技术的运用等都为统计理论提出新挑战,统计工作者必须创新出适合各种复杂类型数据的统计方法才能适应实践的需求。 2.开展空间统计学理论与应用的研究 空间统计学是近几年统计学发展的一个新领域,主要指运用遥感技术进行国土资源的测定,农业和林业、海洋生物、环境生态的观测。这种观测数据通常表现为网络形式,而且这些数据受到大气效应、观测工具等诸多因素的影响。空间统计学的应用在于,针对这种特殊的数据,研究误差控制、数据处理、模型建立、统计推断。这将是统计学研究的新领域。 计算机技术的发展对统计学发展影响的研究 3.生命科学与生物技术中统计方法的应用研究 21世纪是生命科学的世纪,人类不久将完全揭示人类基因排序。19世纪中叶基因学说的创立,就是依赖于统计推断技术,21世纪生命科学中将有大量的相关研究要借助统计方法与技术,这个领域的学者将大有作为。21世纪医学领域的科技创新,将使许多不治之症得到解决,生物制药将在医学领域大放异彩,统计学方法在生物制药技术中的广泛应用将是不争的事实。美国辉瑞制药公司每年投入50亿美金用于研究发展,在美的生物统计人员极易找到高薪的工作就足以说明这一领域的广阔前景。 4.国家经济安全与金融、保险领域的应用研究 国家的经济安全及其金融危机的防范问题是中国改革开放中必须高度重视的问题。国家经济安全、金融危机的预警系统的研究是与统计学方法紧密联系的研究热点,投资项目的风险管理研究也将依赖统计学者去研究解决。保险产品的精算理论与实践在“九五”期间得到一定的进展,为这一领域的深入发展奠定了基础,如何将发达国家保险精算的理论与中国保险业实际相结合值得深入研究,尤其是保险精算方法向社会保障领域延伸的研究是中国国情赋予给这个领域的迫切任务。 5.政府统计数据质量的进一步研究 政府统计数据的质量在“九五”期间得到国人的普遍关注。不仅国家哲学社科基金设立重点研究课题,几乎各地方政府也设专项研究,发表的论文已有近百篇。然而这方面的研究还有待深入,不仅从制度上约束、控制数据的可靠性,从检测、验证的方法上还需进一步探讨。有的重点课题已在检验方法上有所突破,但如何具体与中国政府实际数据紧密结合,实施这些方法还须加大力度进行研究和实践。 6.统计学在社会、人口、教育、环境等领域的应用研究 社会的发展、人口的控制、教育结构的调整与发展、环境的保护等领域存在着大量急待研究的问题,统计学方法是定性与定量研究的有力工具。统计学方法在这些领域将会有广阔的应用前景。
F23会计类核心期刊表1会计研究2审计研究3财会月刊4财务与会计5财会通讯6审计与经济研究7中国审计8中国农业会计9广西会计10中国会计电算化11财会研究(兰州
分类: 资源共享 >> 文档/报告共享 解析: 1.实施中部崛起战略的调查研究 2.建设节约型社会的调查研究 3.农业劳动力转移对策研究 4.人
审计与经济研究是a类。《审计与经济研究》总排名则为第11位,位列A+类期刊即权威学术期刊目录中。
时代金融摘 要:关键词:一、 引言一个国家的国民经济有很多因素构成, 省区经济则是我国国民经济的重要组成部分, 很多研究文献都认为中国的省区经济是宏观经济的一个
随着现代信息技术和 网络技术 的飞速发展,电子商务也在全球市场中迅速发展起来。下面是我为大家整理的电子商务 毕业 论文,供大家参考。 一、跨境电子商务的