样本含量估算方法实验设计论文

时间:2022-06-02 10:24:41

样本含量估算方法实验设计论文

本文以广东省科技计划项目课题-磷酸酰肌醇-3激酶(PI3K)对小鼠气道炎症影响的实验研究为案例,介绍公式法、PASS软件Simple法和Stata软件计算法这3种样本含量估算方法的实际应用,并通过实验所得数据验证其检验效能,判断3种方法确定的样本含量是否合理有效,为医学工作者实验设计时估算样本含量提供一定实践经验借鉴。

1材料与方法

1.1材料1.1.1材料Balb/c小鼠:由广州医学院动物中心提供,4~6周龄,雄性,清洁级,体质量20~25g,无卵清蛋白(OVA)饮食。致敏液:由0.08%OVA0.1mL(美国Sigma公司)和等体积液态铝(美国Pierce公司)混合。LY294002(PI3K抑制剂):美国Sigma公司提供。1.1.2动物分组分组方法:随机数字表法。组别:OVA组、LY294002组和对照组。1.1.3实验方法OVA组:本组小鼠于第0、7、14天腹腔注射致敏液0.2mL,第15天将小鼠置于透明密闭容器中以1%OVA溶液10mL雾化吸入,每次20min,隔日一次,连续5周。LY294002组:同期同时给予注射致敏液和吸入OVA,第13天开始经尾静脉给予LY294002,用量为7.5mg/kg,连续3d每天1次,第15天于吸入OVA前30min给药。对照组:同期同时给予相同体积生理盐水腹腔注射及雾化吸入。观察指标:支气管肺泡灌洗液(BALF)中细胞分类计数、骨髓悬液和肺组织学检查。通过实验检测LY294002对OVA致敏哮喘小鼠肺组织病理、BALF和骨髓中细胞分类的影响,计数细胞总数和嗜酸性粒细胞(Eos)并进行统计学分析[3]。1.1.4实验目的运用公式法、PASS软件Simple法和Stata软件计算法求得本实验的样本含量,并通过实验所得数据验证其检验效能,判断3种方法确定的样本含量的有效性。1.2方法1.2.1公式法介绍n=[(Zα/2+Zβ)*σ/δ]2,n为所需要的样本含量,δ为总体差值,σ为总体标准差,Zα/2为标准正态分布的双侧临界值;Zβ为正态分布的单侧临界值。1.2.2PASS软件介绍PASS是样本含量估计和效能分析中常用的一款优秀的统计分析软件[4]。它界面良好、功能齐全,可以进行描述性统计、相关及回归分析、实验设计、生存及可靠性分析、统计图表绘制等操作,只需要输入相应的参数,即可实现对样本含量或检验效能的预测。常用方法有Com-poundSymmetry法、AR法、Banded法和Simple法。本实验研究选用Simple法。1.2.3Stata软件介绍Stata是一个功能强大的统计分析软件,它可以进行t检验、参数估计、协方差分析、单因素和多因素的方差分析、方差齐性检验、缺项数据的处理、正态性检验等一般分析。它采用具亲和力的窗口接口,操作灵活简便、学习方便,使用者可以通过Stata官方网站学习使用方法。该软件用于样本含量和检验效能估计的主要命令是sampsi(samplesizeandpower),命令格式为:.sampsi#1#2[,一般选择项][重复测量选择项]。#1表示处理前测量的均数,#2表示处理后测量的均数。一般选择项包括:检验效能、检验水平、n1与n2样本量的比值、sd1/sd2(sd为标准差)、单侧/双侧检验、单样本(缺省时为两样本比较)。常用方法有change法、post法和ancova法,本试验研究选用ancova法。

2结果

2.1参数设置Ⅰ类错误概率大小α越小,所需要的样本含量越大,通常情况下α取0.05,可取单侧或双侧用统计学检验。选择双侧检验的条件是研究结果高和低于效应指标的界限均有意义,所需样本量就大;选择单侧检验条件是研究结果仅高或低于效应指标的界限有意义,所需样本量就小。Ⅱ类错误概率大小β越小,检验效能1-β越大,所需样本量也越大,一般要求检验效能不低于0.80,一般只取单侧,本实验取β=0.1。n1与n2样本量的比值常用的为4∶1、2∶1、1∶1,考虑成本最低取1∶1。总体标准差σ或总

体率π,常根据预实验及前人的研究结果或统计理论进行估计,根据何胜东等[5]的研究结果和其他资料,取π=0.7,σ=7.87。容许误差δ是指研究者要求的或客观实际存在的样本统计量与总体参数间或样本统计量间的差值,本实验认为Eos百分比降低80%以上为有效,取δ=0.8σ。2.2计算结果公式计算值为12只,PASS软件Simple法计算值为8只(见图1),Stata软件计算值为10只(由于软件界面图较复杂,本文不截取界面图)。2.3实验结果本实验研究向广州医学院病理教研室咨询了实验材料的费用,根据以往的文献研究经验并考虑统计方便,最终确定样本含量为10只。但考虑样本的非正常失效(如取样失败、死亡等),笔者增加2只作为备份,将样本编号为1~12号。本实验在实验过程中未出现样本的非正常失效,12只小鼠都取到了真实有效的实验数据。实验研究结束后,笔者验证了LY294002组对OVA组的检验效能,样本数为8只取样本编号为1~8号的数据,定为A组;样本数为10只,取样本编号为1~10号的数据,定为B组;样本数为12只,取样本编号为1~12号的数据,定为C组。其计算结果:所有组别1-β>0.90(数据见表1),说明这3种方法计算的样本数都是合适有效的。

3讨论

医学试验研究设计包含专业设计和统计设计两部分内容,统计设计对于保证研究结果的可靠性、科学性、重现性,具有非常重要的意义[6]。样本含量估计与检验效能估算是统计设计中最重要的环节之一。只有科学地确定样本含量才能确保研究的可靠性和研究结果的可信性。样本含量的估计原则:在保证试验研究结果具有一定可信度(1-α),又具有一定检验效能(1-β)的前提下,估算出能够达到主要研究目标所需要的研究对象最小例数,以便通过样本研究结果来推断总体特征。其中α和β的取值大小是由试验设计人员希望达到的可信性和检验效能而确定。有时试验者会考虑到样本意外丢失(如动物的非正常生病或死亡,人员的失访等),会在估算出的最少样本例数上比例不能太大,增加10%~20%即可,因为盲目追求大样本量可能导致更多混杂因素的产生(如动物个体体质相差太大等),导致更大或更多的偏倚发生。医学工作者习惯用公式计算法、查表法、文献法和专家咨询法等方法估算样本含量,这些方法主观因素对估算结果影响大,而统计软件由于操作简单,考虑的客观因素多,计算结果相对合理。统计软件除了本文介绍的PASS软件和Stata软件外,还有nQueryAdvisor软件、SamplePower软件(SPSS公司研发)、SASA软件和SAS软件等,使用方法都大同小异。本文采取的3种方法计算结果不相同但却都是合理有效的,因为医学试验研究中样本含量不是唯一的,不同的研究方法、研究目的,研究要求和研究资料决定了不同的样本含量,从表1中可看出样本含量也并不是越大越精确。这些样本含量估算方法参考了研究个体的变异度、研究结果的精确度(抽样误差),但未考虑研究成本、可行性与伦理学要求对样本含量的影响。

总之,估算样本含量的方法有许多,统计软件具有更客观、更全面和简单方便的优势,在参数选择正确的情况下其计算结果都是合理有效的,试验研究人员要熟练掌握和运用,并以其计算结果为依据,正确分析试验研究性质,再综合考虑研究成本、可行性与伦理学要求对样本含量的影响,最终确定合适的样本数。

作者:喻宁芳喻宁芬单位:广州市第一人民医院南沙医院检验科