• 正文
  • 相关推荐
申请入驻 产业图谱

SMT工艺专家与你一起学习Minitab软件:方差分析

08/30 09:55
692
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

一、方差分析的引入

? 假设检验讨论了检验两个总体均值是否相等的问题,但对于多个总体的均值比较,如果仍用假设检验,就会变得非常复杂。

?方差分析(ANOVA:analysis of variance)能够解决多个均 值是否相等的检验问题。

?方差分析是要检验各个水平的均值是否相等, 采用的方法是比较各水 平的方差。

? 某汽车厂商要研究影响A品牌汽车销量的因素。该 品牌汽车有四种颜色,分别是黑色、红色、黄 色、银色,这四种颜色的配置、价格、款式等其 他可能影响销售量的因素全部相同。从市场容量 相仿的四个中等城市收集了一段时期内的销售数 据,见下表。

? 方差分析实际上是用来 辨别各水平间的差别是否 超出了水平内正常误差的程度 。

? 观察值之间的差异包括 系统性差异和随机性差异。

二、怎样得到F统计量

水平间(也称组间)方差和水平内(也称组内) 方差之比是一个统计量。实践证明这个统计 量遵从一个特定的分布,数理统计上把这个 分布称为F分布。即

三、F分布的特征

? 从F分布的式子看出,F分布的形状由分母和 分子两个变量的自由度确定,因此F分布有两个参数。

? F分布的曲线为偏态形式,它的尾端以横轴为 渐近线趋于无穷。

? 从上图可以看出,随着分子分母自由度的 增加,分布图逐渐趋向正态分布的钟型曲 线(但它的极限分布并不是正态分布),以前 接触过的t分布、χ 2分布的图像也有类似的 性质

四、方差分析的前提

? 不同组样本的方差应相等或至少很接近

五、单因素方差分析

? 例1:我们要研究一家有三个分支机构的公司 各分支机构的员工素质有无显著差异,已邀请专业的人力评测单位对每一分支机构的员工进行了评测,结果以百分制的分数给出, 每一机构抽取五位员工的结果如下表:

1. 检验方差是否一致

? 在方差分析之前,我们可利用Minitab对数据 作方差一致性检验Minitab能够读取的数据格式与上表给出的格式

不同,我们必须 把数据转化为Minitab能够理解的形式,具体做法是: 将所有变量值输入工作表的第一列,对因素进行编码,按照一定 的顺序编为1、2、3...,输入后面几列。

对本例:1) 先将素质测评的得分输入工作表列一;?2)三个分支分别编码为1、2、3,对应于变量值填入第二列;

2. 方差一致性检验

Stat→ANOVA→Test for Equal Variance

3. 给出假设

? 因素是方差分析研究的对象,在这个例子里,两个变量分别是分支机构位置和员工素 质测评分数,这里分支机构的位置就是一个 因素,因素中的内容就称为水平。该因素中 有三个水平,即机构的不同位置。学过假设检验的知识后,我们可以给出下面的假设:

4. 零假设为真

? 若零假设为真,则可以认为只有一个抽样分 布,此时三个样本均值比较接近。三个样本 均值的均值与方差可用于估计该抽样分布的 均值与方差。

? 总体均值的最优估计是三个样本均值的算术 平均数,而抽样分布的方差的估计可以由三个样本均值的方差给出,这个估计就是的组间估计。

5. 零假设为假

? 为了说明零假设为假时的情况,假定总体均值全不相同,由于三个样本分别来自不 同均值的总体,则样本均值不会很接近, 此时S2/X 将变大,使得 的组间估计 变大。

? 每个样本方差都给出sigma平方的一个估计,这 个估计只与每个样本内部方差有关,若 样本量相同,各个样本方差的算术平均 值就是组内方差的估计值。

6. 检验统计量

? 前面已经讨论过,当零假设为真时,Sigma平方的组间估计和组内估计应该很接近,即其比 值应接近于1。而当零假设不成立时,?Sigma平方的组间估计将偏大,从而两者的比值会大 于1,因此我们构造形如

的检验统计量,在一定的置信水平下,将 这个值和某个临界值作比较,就可以得出 接受还是拒绝零假设的结论。7. 深入理解F统计量? F统计量实际上是用来比较组间差异与组 内差异的大小,造成这种差别既有抽样的 随机性,也可能包含系统因素的影响。? 组间差异是用各组均值减去总均值的离差 的平方再乘以各组观察值的个数,最后加 总

? 组内差异则是各组内部观察值的离散程度

? 上述组间差异与组内差异必须消除自由度 不同的影响

? 对SSW,其自由度为n-g,因为对每一种水平,该水平下的自由度为观察值个数-1, 共有g个水平,因此拥有自由度个数为

? 对SSB,其自由度为g-1,g为水平的个数。

8. 检验方差假设

9. 检验步骤

10. 计算结果

11. 方差分析表

? 上面的计算结果可以很方便的用方差分析表来描述。下面是用Minitab软件得到的输出结 果,p值大于0.05,不能拒绝原假设.即认为三个分支机构员工素质评分无显著差异.

六、多因素方差分析

? 方差分析也可以同时分析两个或两个以上 的因素,这就是多因素方差分析。

? 有的实际问题需要我们同时考虑两个因素 对实验结果的影响,例如在例1中,除了关 心分支机构的差别外,我们还想了解不同薪酬水平是否和员工素质有关。

? 同时对这两个因素进行分析,就属于双因素方差分析,通过分析,我们可以知道究 竟哪一个因素在起作用,或者两个因素的 影响都不显著。

1. 不同配方的水泥硬化时间的分析例

2:特殊环境如水下、高温环境中,建筑材料对水泥的 硬化时间有严格的要求。现欲比较几种配方的水泥在不同 温度下的硬化时间,其他条件相同,试验结果如下表:

2. 方差一致性检验

3. 用Minitab作双因素方差分析

出现Two-way Analysis of Variance 对话框后:

4. 结果的进一步解释

? 我们将Minitab输出的方差分析表转换为下表 其中F临界值为手工加入。双因素方差分析: C2, C3

5. 多变量图分析还是以水泥硬化试验为例

6. 多变量图输出

?本例中,四种反应温度对应不同水泥配方的 反应时间差异较大,说明水泥反应温度与配 方有交互作用,与四种温度下最快的反应时 间对应的编号分别为:3,2,2,2.

?若要将因子间的交互作用和其他因子作用量 化,可以进一步采用方差分析或一般的线性 模式等方法.

七、ANOVA的Minitab实现: 单因数方差分析(One-Way)

八、均值分析(Analysis of Means)

?可用于测试各均值的互等性?Select :Stat-ANOVA-Analysis of Means

填入参数

结果输出

九、平衡数据方差分析 (Balanced ANOVA)

?Select :Stat-ANOVA- Balanced ANOVA

点击“Results”对话框,输入下图所示信息:

结果输出

十、通用线性模型 (General Linear Model)

?Select :Stat-ANOVA- General Linear Model

填入参数

十一、全嵌套数据方差分析 (Fully Nested ANOVA)

填入参数

结果输出

十一、平衡数据多响应变量方差分析 (Balanced MANOVA)

?Select :Stat-ANOVA- Balanced MANOVA

点击“Results”对话框,选中下图复选框:

结果输出

十二、通用多响应变量方差分析 (General MANOVA)

?Select :Stat-ANOVA- General MANOVA

填入参数

结果输出

本篇文章介绍了《方差分析》,下篇将介绍《相关与回归分析》,请大家持续关注。

相关推荐