临床医学科研设计中,需要预先估算研究样本的例数,即样本含量。若样本含量过小,所得指标往往不稳定,结果重现性差,检验效能低,结论缺乏充分依据;若样本含量过大,会增加临床研究的困难,造成不必要的浪费。确定样本含量的大小就是在保证一定的研究精度条件下,确定所需的最小样本含量。
影响样本含量的因素有很多,其中最基本有四点:1、临床试验设计类型;2、总体标准差或总体率;3、容许误差或差值;4、假设检验的水准a,即犯第I类错误的概率;5、假设检验的效能(1-β),即在特定a水准下,若总体间确有差异,该次研究能发现此差异的概率。其中,β为犯II类错误的概率。
样本估计时应注意的问题:
(1)样本含量估计只有相对意义,并非绝对精确的数值。因为样本含量估计是有条件的,而这种条件在重复研究中很少一成不变;
(2)应纠正样本越大越好的不正确看法。样本含量过大会影响临床研究的质量,临床研究的方法和要求难以统一,研究者的负担也重,耗时长,受检率和复查率都难以达要求。样本过大有时还可产生稀释效应。因此单纯以增加样本来减少抽样误差往往事倍功半。因为抽样误差与样本含量的平方根成正比,而不是与样本含量本身成正比;
(3)病例和对照两组样本含量相等时,检验效能(即1-β)最高;
(4)由于估算的样本含量是最少需要量,在受试者中可能有不合作者、中途失访、意外死亡等都会减少有效观察对象,故进行试验时尚须酌情增加一定的观察例数,一般增加10%~15%;
(5)根据研究目的和研究类型严格选择估算方法。确定样本含量可能通过公式计算或直接查表。查表法受条件限制,虽方便但不完全适用。公式计算应用广泛,不同的研究类型,样本含量的计算公式各不相同。 (6)通过公式法计算的样本含量往往取自固定参数,而临床研究参数的确定往往比较困难。根据试验设计类型和所采用统计分析方法, 经Monte carlo方法的计算机模拟技术可以对参数的取不同值或范围,然后综合各种因素选定较为合理的样本量开展临床试验。该方法通过计算机对试验进行模拟,所得样本量往往比公式法的可信性高。 |