样本量估算是指为满足统计的准确性和可靠性(一类错误的控制和检验效能的保证)计算出所需的样本量。样本量估计是临床试验中极为重要的环节,直接关系到研究结论能否达到预期。ICH-E9指出:临床试验的样本量必须足够大,既可以可靠的回答研究假设所提出的相关问题,同时又不至于太大而造成浪费。目前,根据现行2016年发布的《医疗器械临床试验质量管理规范》中,并没给出具体的样本量参考值,有些具体分类的临床试验指导原则中,可能有涉及。
1. 影响样本量的参数
1.1设计类型:优效性试验,非劣效性试验,等效性试验,其中优效性或非劣效性试验是单侧检验,等效性试验是双侧检验。同等条件下,双侧检验的样本量大于单侧检验。
1.2检验水准和检验效能:一般情况下,检验水准α设定为双侧0.05,单侧0.025,检验效能设定为不大于0.2。
1.3界值的确定:界值即容许误差,指可从临床意义角度判定差异的最小值。一般需根据统计学推断和临床意义共同判定。界值具体确定方法参考《非劣效设计临床试验指导原则(征求意见稿)》中提到的方法。当界值难以确定时,两组率之间的比较:δ一般取10%或者最大不超过阳性对照组率的1/5(建议取15%以下的值),两组之间均值的比较:δ可以1/5-1/2个标准差或阳性对照组均数的1/10-1/5。
1.4效应量:分别反映定量和定性资料的变异程度。一般通过前期研究结果或者文献报告进行估计,当没有相关资料时,则需要采用预试验的方式获得效应量。
1.5平衡或非平衡设计:平衡设计即每组样本量相同,在同等条件下,平衡设计检验效能最优。有时出于伦理的考虑,会使用非平衡设计。
1.6样本量调整:临床试验中通过会考虑不大于20%的脱落剔除率,具体的脱落剔除率,需根据不同的研究项目而定。
2. 样本量估算工具
2.1公众号(如:临床流行病学和循证医学)及网页(如:https://www.cnstat.org/samplesize/)
2.2软件:PASS、nQuery Advisor、SAS、R及STAT软件等
2.3样本量计算公式:来源于《参考医疗器械临床试验设计指导原则》中涉及的公式或样本量计算的相关文献 2.4查表:根据研究条件进行查样本含量表
相关往期文章: