样本容量的计算公式可以根据不同的统计需求和抽样方法有多种形式。以下是几种常见的样本容量计算公式:
基于总体比例和置信水平的公式
公式:N = Z² × (P × (1 - P)) / E²
其中:
N 是样本容量(样本数)。
Z 是置信水平对应的标准正态分布的分位数,可以根据置信水平查找标准正态分布表获取。
P 是总体比例(例如,0.5 表示总体中成功和失败的概率相等)。
E 是允许的误差范围。
这个公式适用于大样本情况,即当总体的方差已知且样本容量较大时。
基于总体比例、置信水平和总体大小的公式
公式:n = (Z² × P × (1 - P)) / E²
其中:
n 是样本容量(样本数)。
Z 是置信水平对应的标准正态分布的分位数。
P 是总体比例。
E 是允许的误差范围。
这个公式适用于总体比例未知且样本容量较小的情况。
基于标准差和置信区间的公式
公式:N = (Z² × σ²) / d²
其中:
N 是样本容量(样本数)。
Z 是置信区间对应的标准正态分布的分位数。
σ 是总体的标准差。
d 是允许的抽样误差范围。
这个公式适用于总体标准差已知且需要精确控制抽样误差的情况。
建议
在实际应用中,选择合适的公式取决于具体的研究问题、总体特征(如大小和分布)、置信水平以及允许的误差范围。通常,如果总体的方差和样本容量都较大,可以使用第一个公式;如果总体方差未知或样本容量较小,可以使用第二个公式;如果需要精确控制抽样误差,可以使用第三个公式。此外,样本容量的最小值通常需要满足一定的统计要求,例如在普通最小二乘法中,最小样本容量为 k + 1,其中 k 是解释变量的数目。