本期内容主要从以下几个方面进行讲解分享:一、相关统计概念介绍二、GPOWER软件的简介与安装三、使用GPOWER进行样本量的估计一、相关统计概念介绍(一)H0与H1在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果作出一种预想的希望证实的假设这种假设叫科学假设,用统计术语表示时叫研究假设,记作H1然而在统计学中很难直接检验H1的真实性,因此需要建立与之对立的假设,称作虚无假设,或叫无差假设、零假设、原假设,记为H0在假设检验中H0 总是作为直接被检验的假设,而H1与H0对立,二者择一,因而H1有时又叫做对立假设或备择假设假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0(二)Ⅰ型错误和Ⅱ型错误当原假设H0正确时,由于样本的随机性,拒绝了H0,犯了“弃真”错误,又称为第一类错误,Ⅰ型错误概率为α(即假设检验的显著性水平),故常常成为α型错误当原假设H0不正确时,但接受了H0,犯了“取伪”错误,又称为第二类错误,Ⅱ型错误概率为β一个好的检验应该在样本容量n一定的情况下,使犯这两类错误的概率α和β都尽可能小而我们一般说研究需要多大样本量?或者研究样本量已经有了,有多大概率可以得出有统计学意义的统计结果(这个样本量值得去做研究吗)?这些问题都可以通过功效分析(Power Analysis)来解决那么要进行功效分析,先要了解一下分析中涉及4个统计量:样本量(Sample Size)、效应值(Effect Size)、显著标准(Alpha)、统计功效(Power),知其三个可推断另外一个其中 (三)统计功效(检验功效,效力,Power)统计功效指某检验能够正确地拒绝一个错误的虚无假设的能力用1-β表示统计功效的大小取决于四个条件:1.两总体差异当两总体实有差异越大,或处理效应越大,则假设检验的统计功效越大;(在α错误概率不变的情况下,1-β变大)2.显著性标准α:也称显著性水平,是一个特定的值,一个决策标准通过p与α的决策比较,作出统计决策而当假设H0是真实的时候,观察到的差异完全是由随机误差所致的概率称为观察概率p显著性标准α越大,则β错误越小,从而统计功效1-β越大;反之,α变小,1-β变小3.检验的方向:当两总体差异一定,对于同样的显著性标准α,单侧检验比双侧检验的统计功效要大4.样本容量样本容量越大,样本平均数分布的标准误越小,分布曲线越瘦削,统计功效越大(四)效应量(效应大小,Effect Size)效应量,反映处理效应大小的度量效应量表示两个总体分布的重叠程度Effect Size 越大,表示两总体重叠的程度越小,效应越明显其实,两样本平均数的差异本身就是一个效应量由计算出的Effect Size大小,可由专门的表格中查出两样本分布的重叠的百分比故效应量经常用两总体重叠的程度为指标,重叠的部分百分比越大,效应量越小或以两个样本不重叠的程度为指标,不重叠的部分百分比越大,效应量越大效应值是量化现象强度的数值,在不同的统计方法中统计量会不同对于有些小伙伴来说,上面的统计学概念可能有些抽象,下面小编为大家推荐一个网址(https://rpsychologist.com/d3/NHST/),在这个网站上,我们可以可视化的了解各个概念之间的关系这个可视化是基于一个单样本的Z检验你可以使用滑块改变样本量、功率、显著性水平和效应大小,以观察抽样分布的变化如下图(左—双尾;右-单尾):二、GPOWER软件的简介与安装Gpower软件是由德国杜塞尔多夫大学几位乐于分享知识的老师开发的,专门用于统计功效(包括样本量)计算的免费统计软件,在心理学领域有着很高的声誉和认可度在官网即可下载软件,网址为:http://www.gpower.hhu.de/(安装后图表见右图)下图为软件的主界面(红框内中可依据实验设计选择统计方法;黄框内可依据分析目的选择功效分析类型):其中,Gpower 中最常见的统计力分析(power analysis)类型包括以下几类:1.先验 (priori) 分析:根据所给的α水平,统计力水平(1-β)和效应大小(H0和H1的差异),计算样本容量;2.事后 (post-hoc) 分析:根据N,α,效应大小,得出β;3.折中 (compromise) 分析:想得到较小的α和较大的1-β,所以α和β之间的权重用q = β/α表示,所以知道 N,q和具体的效应大小,得出α和β4.标准(Criterion)分析:根据 1-β、effect size 和 N 计算a 和相关决策标准5.敏感性(Sensitivity)分析:根据α、 1-β和N计算effect size 三、使用GPOWER进行样本量的估计G.Power的功能强大,即可以计算事后统计检验力(事后分析),也可以进行事前样本量的估计(先验分析)基本步骤如下:1、选择统计方法:(Exact—Fisher\F test—方差分析\t test差异性t检验\X2test—卡方检验\Z test—非参数检验)2、进一步选择分类:(这里以t 检验为例)3、确定想得到的参数:①A Priori:研究设计时,想知道所需样本量N②Compromise:α与β固定(不常用)③Criterion:计算α(一般α为0.01、0.05不需要计算)④Post hoc:计算研究结果的检验效能(power)——1-β⑤Sensitivity:实验完成后,计算效应量一般来说,①、④、⑤比较常用4、设定各个参数:Tail:one—单尾;two—双尾一般选择后者;Effect size:效应量,t检验里,采用Cohen(1988)的计算方法,小=0.2、中=0.5、大=0.8,不知如何填时,选0.5;a err prob:一般为0.05、0.01;Power:检验效能,0.8以上可以;Allocation ratio:2组样本量n比值5、最后点击Calculate:结果里给出了所需样本量在本例中,结果显示,保证得到效应在0.5(中)的前提下,设定a=0.05并且检验效能为0.8时,需要每组至少有64个样本 以上就是本期分享的主要内容,希望可以帮助你顺利解决目前的苦恼~ 在下期内容中小编会为大家详细讲解各个统计方法下具体是如何用GPOWER进行样本量估计的 记得关注momo老师,获得更多精彩内容哦~
(图片来源网络,侵删)
0 评论