样本含量估计时需要注意以下事项:
样本量大小
样本量过小可能导致指标不稳定,检验效能低。
样本量过大可能增加研究难度,难以控制条件,并造成人力物力的浪费。
确定样本量的目的
在保证研究结论的科学性、真实性和可靠性的前提下,确定所需的最小观察例数。
样本含量估计方法
常用的方法包括计算法和查表法。
需要提前确定的参数
δ(假设检验第一类错误出现的概率,也称假阳性率或检验水准)。
α(显著性水平,通常取0.05或0.01)。
β(假设检验第二类错误出现的概率,即假阴性错误出现的概率)。
σ(总体标准差)。
π(总体比例或均值)。
检验水准(α值)
检验水准又称把握度,为1-β,即在特定的α水准下,若总体参数之间确实存在差别,实验能发现此差别的概率。
确定样本量的方法
需要考虑全国性研究、描述性研究、相关性研究等不同类型的研究设计。
对于全国性研究,样本量通常在1500-2500人之间。
描述性研究样本量应至少占总体的10%,若总体较小,则至少占20%。
相关性研究至少需要30名受试者。
成组设计的样本量
应尽可能采用例数相等的设计,尤其是多组设计时。
多指标估算
若研究有多个效应指标,应对每个效应指标分别进行样本量估计。
病例对照研究的样本量估计
样本含量估计具有相对意义,并非绝对精确的数值。
样本量的大小通常以最小的OR(效应比)和最适的p0(事件发生率)为准进行估计。
研究多种危险因素时,样本量的大小近似等于危险因素的数目乘以5~10。
样本量估计中的参数关系
当OR(或RR)越远离1时,所需样本量越小。
当P0越接近0.5时,所需样本量越大。
待估参数与样本量
待估参数并不等同于预测变量数,取决于预测变量的形式。
需要根据具体问题确定变量可能在分析中的变换、分类等情况,适当增加样本量。
样本量与事件数
基于待估参数所确定的样本数不是总样本量,而是两类事件中少的那一类的样本量。
如果某病的患病率较低,需要根据疾病的患病率和待估参数的数量适当增加样本量。
样本量估计是一个复杂的过程,需要综合考虑研究目的、设计类型、参数估计和检验效能等因素。正确估计样本量对于确保研究结果的有效性和可靠性至关重要