1引言
目前,在日常生活中,假设检验对生活和工作有着至关重要的作用,人们面对问题经常会使用假设检验进行思考,这样就可以降低人们自身因素带来的偏差,从而最大程度避免结果的不确定性给人们生活带来的影响。通过实例的调查,可以进而拓展对假设检验的理论研究。在现实生活中,建立的模型和解法被讨论,模型被完全讨论。这些原则为将来假设检验在多个行业的应用提供了思路。通常假设检验多是用在有针对性的解决问题,对问题进入深入的探讨,方案的制定等等方面。所以,科学技术的发展,以及当前社会生活的进步都离不开假设检验。
从当前学术界关于假设检验的相关研究来看,研究成果十分丰富。潘素娟等人[1]分别介绍了参数假设检验和非参数假设检验两种方法,并通过案例分析了假设检验理论的应用,对抽样的数据进行推断分析,为以后的实际应用提供理论依据。缪海斌和周炳海[2]在对具体案例进行研究时发现,制造产品过程中的问题,可以引用假设检验来进行测试,从而以最短的时间找到解决的办法。从产品在生产过程中的众多输入因素中,选出问题存在的深层次原因。对于原因的查找需要采用假设检验的方法展开统计,从而可以探知真正的问题所在,并使用实验设计等工业工程和六西格玛改善工具对根本原因进行改进,最终显著改善了产品的质量。张淑贵[3]指出假设检验亦称显著性检验,是统计推断的重要内容。其目的是在一定的假设条件基础上,以样本推断总体并检测实验组与对照组之间是否有差异以及差异是否显著。工程实践中,为保证系统和零部件的可靠性,必须结合概率分布和假设检验的方法建立相关的数学模型并进行必要的计算。牛凯和陈悦[4]指出假设检验中T是问题论述样本的重要依据,在假设检验步骤及计算公式中T检验统计量取得所需的值,这也是假设检验的基本统计工具以及显著性指标等。
本文总结出利用假设检验处理试验数据的流程,并以实例讲解该流程的应用。在本文的研究中,首先分析了假设检验的基本思想与方法,随后结合具体的案例,分析了假设检验的具体案例,从而为假设检验的发展提供一些参考和借鉴。
2假设检验的基本思想与方法
2.1假设检验的基本思想
统计学中,假设检验是日常生活和生产过程中最常用的方法之一。这是在特定假设下从样本推测总体的统计推理方法。这可以用来判断样品和样品、样品和总体样本的不同是由于采样错误还是由于本质上的差异。在实际应用程序中,总分布函数不清楚,或者只知道总分布函数的形式,导致不知道参数的情况发生。为了取得整个人口的几个特性,人们对整个人口的分布形式进行了一些假设,并使用样本信息来判断是否能接受假说。假设鉴定的程序如下:(1)根据问题的需要,对要研究的种群做出一定的假设,称为原始假设,并记录为(2)选择适当的统计量,使统计量的分布在原始假设的条件下已成立;(3)给定显著性水平α,确定拒绝域;(4)从样本中计算检验统计量的值;(5)根据检验统计量的值是否属于拒绝域,做出拒绝或接受原始假设的统计决定。需要指出的是,利用样本信息估计总体信息的结论并不完全可靠,需要进一步检验。众所周知,正态分布是一种常见的分布,应用非常广泛。其两个参数的假设检验是实践中常见的问题。以单个正态总体N(μ,σ^2)的参数检验为例。我们知道,关于平均μ,可以提出以下常见的假设检验问题:
I双边假设检验H_0:μ=μ_0 vsH_1:μ≠μ_0;
II右边假设检验H_0:μ≤μ_0 vsH_1:μ>μ_0;
III左边假设检验H_0:μ≥μ_0 vsH_1:μ<μ_0
其中μ_0表示某个已知数。
I之所以称为双边假设检验,是因为备择假设分布在原假设的两侧,II是备择假设分布在原假设的右侧,故II称作右边假设检验;Ⅲ是备择假设分布在原假设的左侧,称作左边假设检验。在检验过程中,由于某些技术上的原因,与的地位是不平等的。客观上,受到保护,故在处理具体问题时,通常把需要着重考查的、比较稳定的、保守的假设作为原假设。我们在实际问题中会碰到如下关于均值的检验:。
此时,有两个问题值得思考:(1)这种检验是右边检验吗?(2)如果看成双边检验,结论会变化吗?下面我们从三个角度来分析(1)。假定σ^2已知,且在原假设H_0为真时,检验统计量服从标准正态分布。首先,按前面给出的双边和单边检验的定义,由于Ⅳ的备择假设分布在原假设的右边,故Ⅳ应是右边检验。其次,从直观上来说,对检验Ⅳ,如果依据拒绝域做出拒绝原假设H_(0:)𝜇=𝜇0的决定,则更应该拒绝H0:𝜇≤𝜇0。事实上,显著性水平α的确定就是在μ≤μ_0的范围内最不容易拒绝的μ_0点处计算得到的。故检验:IVH_0:=μ_0 VSH_1:𝜇>𝜇0与检验:II H_0:μ≤μ_0 VSH_1:μ>μ_0是等价的,即给定显著性水平α,在犯第一类错误的概率不超过的意义下,两者的拒绝域相同,Ⅳ应是右边检验。最后,检验问题Ⅳ与II的备择假设相同,且Ⅳ的原假设是II的原假设的其中一种假设方案,这是因为在这种情况下,对μ进行验证,得知μ是单调递增函数,同时对Ⅳ进行验证与对Ⅱ验证,两者的验证结果相同,故拒绝域也相同,Ⅳ应归结为右边检验II。对于(2),如果将Ⅳ看成双边假设检验的话,则相当于扩大了拒绝域的范围。
2.2假设检验的基本步骤
(1)在对案例或者是事务的现状进行了解和账务,然后根据目标提出问题,接着按照问题的要求,进行科学合理的假设。
(2)当我们检验我们要研究的问题的假设时,我们需要将样本统计应用到统计推断中。在实际问题中,将同一因素作为参数估计来确定选择哪一种统计量。例如,选择小样本或大样本作为测试样本,以及总体方差是否已知。应根据不同情况选择测试统计,并计算测试统计值。
(3)原始假设的正确与否,直接决定了我们对待结果的态度,当呈现出正确的时间,就认同,否则将会放弃,从而帮助我们得出科学合理的判断结果。从样本中所提取的全部信息进行提炼,可以得出假设检定,尽管如此,它也可能是错误的。有的情况下,第一个假设可能是正确的,也可能是错误的,若是错误假设的前提就需要推翻。那么可以根据检验的结果α对假设前提进行解释。这是常用的作业方式,但是在这种作业方法中也会用风险存在。
(4)首先根据检验的结果α以及统计量的结果进行解释,然后对前提进行概括说明,最后需要对样本的范围以及数据的位置进行判定。
2.3假设检验的方法
1、参数假设检验
参数假设检定法是对所有分布函数内未知参数的假设进行检定。一般的方法有4个。
(1)-检验法
假设总体服从正态分布,总体的方差是已知的。在总体中随机地抽取出容量为的子样,这样就能求出子样均值,利用对总体的均值进行假设检验,并且可以用统计量
来进行计算,所以其分布是标准正态分布。即
变量就是服从标准正态分布的统计量,把应用u统计量来进行检验的方法称为u-检验法。
(2)t-检验法
假设鉴定是对于抽样的样本进行数据采集,然后提出一个假设的条件,依据数据的判定多种数据之间的关系。所以,在假设检验开始之前,需要首先提出多个假设条件,这里记为原始假设H_0。然后,根据假设的条件对样本进行抽选,这时需要挑选的样本是科学合理的,并且需要已经知道并且掌握样本的分布状况。其次,需要把样本的数据进行统一分析,预先测试规定的H_0有效性水平是否为阳性或阴性的结果。根据假设审定的想法和小概率现象的假设(P<0.01或P<0.05),用假设审定的方法提倡假设,用统计的方法决定假设的概率。即使概率高,也需要判断数值。当测量总体遵循正态分布时,只有基于t检定得出结论,才能跟随测试下一级的自由度分布。在这个检定中,使用分布理论来预测差异的概率。应用于数据分析的假设鉴定。根据两个平均差的有意义性,假设检定是由加斯特发明的。首先,目的是观察葡萄酒的品质。结果与检定相同。
测试的原理是基于分布。这是对一个或两个样本数据的假设检定的一般方法,也是一种参数检定。测试了各回归系数的有效性。测试过程中,如果使用重回归来测试回归系数是否为零,则测试整体回归系数为零。接着,根据一变量正态分布的整体期待值,ie。测试样品是否等于平均值和2变量正态分布期望值的总和。鉴定的最终目标是,将样本平均表示的未知总体的平均值与已知总体的平均值进行比较,避免直接鉴定假设结果的多数实验。
假设总体样本遵循正态分布,则总体方差不明。因为有容量的样品是从总体随机选择的,所以可以计算样本的平均值和样本的误差,总体的平均值可以根据假设来确定,可以根据统计来计算,但是统计不是正规分布,而是根据自由度的分布。
2、非参数假设检验
非参数假设检验方法是对总体分布函数形式或类型的假设进行检验,假设母体ζ的分布函数为具有明确表达式的,我们把随机变量的值域分成个互不相容的区间。它们的长度并不一定是相同的。
设为容量的子样的一组观测值,为中落入的频数。在次实验中事件发生的频率为,其中。现在检验假设。如果在原假设成立下,母体ζ进入区间的概率为:
此时,在个观测值中,正好有个观测值进入内,个观测值进入内,…,个观测值进入内的概率应该为,这是一个多项分布。
依据大数定理,在为真时,频率与概率的差异不应该太大。按照这个思想,皮尔逊建立了一个统计量
称为皮尔逊统计量。能够看到,用表示这一统计量是有原因的。因为以为自由度的分布是它的极限值。为了能够把皮尔逊统计量用来作检验的统计量,必须知道它的抽样分布。先讨论的简单情形。在成立下
其中,这时,频数。此时考察
令
显然,由此可见,不是线性独立,
于是有
按照德莫弗-拉普拉斯极限定理,在n足够大时,随机变量的分布是接近于正态的,从而得出皮尔逊统计量在的情形下,当充分大时,是接近于自由度为1的x^(2-)分布。
3、Z检验
Z检验(ZTest),一般来说,样品尺寸超过30的大样品使用。使用正态分布理论来推测差的概率,比较两个平均差是否有效。在国内也被称为U测试。当验证标准偏差已知且一系列数值的平均值等于期望值时,用Z检验。
步骤1:建立假设两个平均值之间没有显著差异的归无假设。
步骤2:使用各种统计计算方法计算各种类型问题的统计值。
1、如果检验一个样本平均数x与一个已知的总体平均数μ的差异是否显著。其Z值计算公式为:
其中:
x是检验样本的平均数;
μ是已知总体的平均数;
S是总体的标准差;
n是样本容量。
2、如果调查两组样本的两组平均数的差异,可以判断各组所表示的整体差异是否显著。其Z值计算公式为:
其中:
X_1,X_2代表的是不同样本的平均数;
S_1,S_2代表的是不同样本的标准差;
n_1,n_2代表的不同样本的数量。
步骤3:把计算结果与预测的结果进行对比,从而能够更好的判断发生的可能性,并且根据计算的结果按照规定进行解释。
步骤4:经过上面严密的计算逻辑,需要把计算的结果和实际进行对比,得出结论。
3假设检验的案例应用
3.1案例背景介绍
公司是德国的跨国公司,主要提供风力、冶金、汽车、大型机械产业,包括挤压、硫化、注塑、车削等制造过程在内的各种密封解决方案。公司的下级工厂主要生产橡胶油封,产品的原料主要是采用丁基橡胶和氟橡胶。其中,腈橡胶产品占所有t工厂产品模型的90%以上,其面临的质量问题也是最多的。根据质量部门的统计数据,当前T工厂所面临的最主要的质量问题是旋转轴承油封的外径超差。本文以T工厂旋转轴承油封的生产流程为研究对象,应用假设检验方法科学验证问题产生的根本原因。在不同的参数条件下进行生产,并收集产品外径的数据。通过数据的对比分析,从统计学的角度找出哪些因素会显著影响产品外径。以此达到使用较少实验,并科学找到根本原因的目的。
3.2实践案例应用
1、选取典型产品并预抽样
根据T工厂质量部门的数据显示,A型号油封的外径超差不良率为6.27%,在所有型号产品中不良率最高,所以本文选取A型号油封的外径超差问题作为研究对象,涉及到的生产过程包括领料、准备配件、模压、修剪毛边和质量检测。而过程的输出,即所需要测量的对象,就是A型号油封的外径,其尺寸范围为473±0.5mm。对A型号油封进行预抽样,并测量其外径,数据如表3-1所示。根据表3-1数据可以计算出,当前A型号油封外径的平均值x=472.8mm,标准差S=0.2。

2、收集潜在因素
因为不能同时验证生产工序的全部原因,所以需要对验证的数据进行删减,当然这需要在验证开始之前作业。然后,可以运用多种搜集计量方法,对研究的对象进行因素分析。
(1)模压压力。
(2)加热温度。
(3)钢丝圈外径。
3、陈述原假设和备择假设
原假设H_0就是需要被检验的假设,是包含等式的统计假设。备择假设H_A是原假设的补充。如果这些假设之一是真的,则另一个必须是假。对于潜在因素“成形压力”,需要确认产品外径的平均值是否因高压和低压而变化。原假设H_0:在不同的模压压力下,产品外径均值不变,即𝜇1=𝜇2。备择假设𝐻𝐴:也就是当模压不同时,产品的外面直径的平均值也不相同,用公式表达为𝜇1≠𝜇2。关于潜在的“加热温度”,需要确认产品的平均外径是否在高温和低温下发生变化。原假设𝐻0:在不同的加热温度下,产品外径均值不变,即𝜇1=𝜇2。备择假设𝐻𝐴:在不同的加热温度下,产品外径均值不等,即𝜇1≠𝜇2。对潜在因素“钢丝圈外径”,需要验证不同的钢丝圈外径,产品外径的均值是否发生变化。原假设𝐻0:产品外面直径的平均值不会受到钢丝圈外径的影响,即𝜇1=𝜇2=𝜇3=⋯=𝜇𝑛。备择假设𝐻𝐴:在不同的钢丝圈外径下,产品外径均值不等,即至少有一个均值与其他均值不等。
4、选择假设检验的类型
考虑到“成形压力”和“加热温度”这两个潜在因素,本纸仅验证产品的平均外径是在高水平变化还是在低水平变化。标本尺寸在30以上时,选择双重标本Z鉴定。样品不超过30时,则选择双样本T检验。针对“钢丝圈外径”,本文需要验证在“高”、“中”和“低”的不同水平下,产品外径的均值是否发生变化。所以选择单因子方差分析ANOVA。
5、计算样本量
在开始收集数据前,需要计算收集数据所需的最小样本量。由于产品直径是连续型数据,可以使用公式(1)计算最小样本量:
(1)
其中,𝑧𝑐由置信度𝑐决定,可以由表3-2查得。本文取置信度95%,所以zc=1.96。

σ是指被测对象的标准差,本文中就是A型号油封外径的标准差。根据预抽样的数据显示,A型号油封外径的标准差S=0.2。此时,可以用样本标准差来S代替𝜎,即σ=0.2。E是误差幅度,本文中可以取E=0.1mm。根据式(1)计算,可得n=15.37。
6、安排试验及收集数据
对三个需要验证的潜在因素,制定试验计划如表3-3所示。针对双样本假设检验,考虑到提升样本的准确度,故取样本量为30。而针对钢丝圈外径的试验,考虑降低成本,减少不同情况下的试验次数至10次。

根据表3-3的试验计划,进行试验并收集数据。关于模压压力的试验数据,如表3-4所示。


7、数据分析及结论
从成形压力和加热温度测试中收集的数据中,两个样品的样品都超过三十,因此选择双样品Z测试。首先,分析模具压力的实验数据。绘制出两组数据的箱线图,如图3-1所示。从图3-1中可以看出两组数据的均值有一定的差异。模压压力从100MPa到120MPa时,产品直径有增大的趋势。

在检验的过程中,需要使用箱线图,这是用来对数据进行判定的,想要得到更加精准的结果,需要通过数据公式的测算。根据公式(2)计算标准检验统计量z。

其中和分别是在压力为100 MPa、120 MPa,对于产品的外面直径直接采用所抽取样本的平均数值。由表3-4可以得知,=472.72 mm,=472.89 mm。原假设中,所以𝜇1−𝜇2=0。而则需要根据式(3)去计算。

其中,样本分别为𝑛1和𝑛2,此处𝑛1=𝑛2=30。当压力为100MPa时,产品外围直径的方差是S_12,当压力等于120 MPa时,所检验产品最外面的直径方差是S_22。然后根据公式及表3-4可以计算出,S_12是0.02,正好和S_22完全相同,根据上述已知条件能够列出σx^1减去x^2差是0.04。然后把所有的计算公式全部并列,就能够计算出Z是小于零的,为-4.25.然后把计算的结过和范围值Z_0进行比较,判定Ζ是否符合假设条件。而范围值Z_0的大小等于α,当α等于0.05的情况下,Z_0可能是正数,也可能是负数,即为±1.96中,也就是说,当Z的取值不在-1.96和1.96之间时,假设条件不成立,需要推翻。有上述数据可以得知,产品最外面的直径和成型的压力之间有着密切的关系,还能以运用假设检验的方法对其他的情况进行测定。根据图3-2,然后参照样本数据,画出箱线图。

从图中可以看出两组样本的均值并没有明显的差异。再根据表3-5中的数据,可以计算出当温度正好为170摄氏度的情况下,产品样本的平均数据等于0.47283米,这时样本之间的方差为0.04.当温度正好为180摄氏度时,产品样本的平均数值为0.4728米,样本之间的方差则为0.05,大于170摄氏度的情况下方差。然后在根据公式,可以计算出Z就是0.55.这时Z的取值正好处于-1.96和1.96之间,那么假设条件成立。根据验证结果可以得知,温度的变化并不能影响产品最外面直径的变化。
最后,则是测算钢丝圈外面直径的数据,还是需要先画出箱线图。
根据图3-3显示,钢丝圈最外面直径的大小不一样时,产品最外面直径的数据也不一样。两者之间彼此促进。

此时,数据的测算及评估需要至少三组以上才可以,因此另个样本的假设检验无法进行,只能使用因子分析的方法。这时,测算的数据将不是Z,而是F值,见公式(4)。

其中,〖SS〗_A称为因子的离差平和,〖SS〗_e称为组内的离差平和,其计算公式分别见式(5)和式(6)。

其中,m代表的是当钢丝圈的外径不相同的情况下,实验的次数。这里,m取值10。r是因子的水平数,本文中钢丝圈外径取了3个水平值,所以r=3。式(4)中的〖df〗_A和〖df〗_e分别为因子的自由度和误差的自由度,计算公式分别见式(7)和式(8)。

上述公式中,n是指测试的次数,由于论文的研究是在三种不同的背景下展开,且每种都进行了十次的检验,所以三种那就三十次。然后可以根据上面的公式,分别算出〖df〗_A、〖df〗_B为2和27。接着再把数据代入公式5和公式6可知,〖SS〗_A等于2.05,〖SS〗_e等于0.89.再接着网上推算,就能够计算出F为31.02。根据计算的结果,把数据对比,当F减去F_1时大于零,那么说明假设条件成立。这时根据α的值计算出F的值。所以,经过全方面的分析,钢丝圈的外面直径是全部影响因素中最重要部分,而成型的压力以及制作过程中的做工方式直接影响到产品的精细程度,但是温度的变化基本不能影响产品的外径。
3.3假设检验的应用效果
根据假设鉴定的分析,发现模具压力的数据是持续不断地,和焊缝的外径是一致的,多以需要采用相关性分析,以及回归分析判定彼此之间的关系,使用数学关系来预测设定参数。为了改善状况,为了验证需要追加其他的个别要素,所以使用DOE和响应优化工具。最后,它不仅是影响产品外径与它们之间相互作用的重要因素,还确立了这些因素与产品外径之间的数学模型。最后,为了将产品外径的变动控制在最小限度,使平均值接近规格中心,提供了以下改善对策和最佳设定参数。
假设检验方法的引入,能够帮助T工厂目前所面临的生产问题得到解决,尤其是产品质量方面的问题。这次,我们分析了制造工序中品质有问题的代表性产品,并以5个轮班的程度追究了对产品质量造成影响的因素。从而能够最大程度的对产品进行优化,而且效率也得到提升,优化的方案也能够尽快确定。同时,只要合理的配置,生产线的正常生产就不会受到影响。另外,由于生产操作人员缺乏对于产品生产的标准作业的手法,以及相关的专业知识,需要进行大批量的培训。对此,采用该种方法,能够帮助提高产品的质量,同时能够降低成本和改善容量等其他问题的解决。而且,那个不限于制造,服务和XX等其他行业可以使用它来解决问题。
4结论
通过实际的案例研究,进一步理解应用程序的假设检定的原理。本文以实际生活为例,对数学模型及其解决方法进行说明,对模型进行全面说明。这些原则为将来在其他领域应用假设鉴定提供了丰富的数据。假设检定在解决问题、分析、改善中起着重要的作用。而未来科学的发展进步离不开假设鉴定的研究。
参考文献
张云雷,汤俊,王力.基于假设检验理论的雷达近邻目标距离统计分辨限[J].雷达学报,2019,8(1):213-216.
傅莺莺,田振坤,李裕梅.方差分析的回归解读与假设检验[J].统计与决策,2019(8):117-120.
戴金辉.区间估计与参数假设检验的比较[J].统计与决策,2019(9):101-105.
严慧,胡宏昌.带有Markov型误差的线性模型的假设检验(英文)[J].数学杂志,2018(4):17-23.
邵金,蒋辉.非时齐扩散过程遍历性的假设检验[J].数学进展,2019,48(4):35-39.
刁云霞,晏舒,丁洁丽.基于因变量抽样设计下线性回归模型的假设检验问题[J].数学学报,2018,61(6):54-60.
魏立力,张定强.确定假设检验拒绝域的证据原理[J].数学的实践与认识,2018,48(16):78-89.
万芳琦,胡水平,张蕾.基于假设检验的控制点异常值探测和数据诊断[J].江西测绘,2018(2):26-30.
陈学云.SPSS函数在参数估计和假设检验教学中的应用[J].山西煤炭管理干部学院学报,2018,031(001):99-102.
致谢
行文至此,意味着大学生涯即将落幕。求学岱下,筑梦淮师,始于2016初秋,终于2020盛夏。四年光阴如烟火,满眼繁华,点滴生活历历在目。
桃李不言,下自成蹊。首先我要感谢我的指导老师,得幸遇老师,从选题到设计以及多次修改后的定稿,都离不开老师的指导和帮助,本文才得以成型。饮其流时思其源,成吾学时念吾师,在此感谢所有指导过我的老师们。
岁月虽清浅,时光亦潋滟。其次我要感谢在校园里遇见的来自天南地北的朋友们,在学习上给予我鼓励与支持,在生活上给予我帮助与开导,感谢你们让我在家乡之外依然感受到了温暖,愿有前程可奔赴,亦有岁月共回首。
父母之爱子,则为之计深远。十余载求学生涯,是父母做我身后的铠甲,感谢父母的无私付出与鼎力支持
下载提示:
1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。
2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。
原创文章,作者:写文章小能手,如若转载,请注明出处:https://www.447766.cn/chachong/15488.html,