确定样本量的大小需要考虑多个因素,包括研究目的、精度要求、置信度、总体大小、变异程度、资源限制等。以下是一些常用的方法和原则:
统计学公式
样本量 \( n \) 可以通过以下公式计算:
\[ n = \left( \frac{Z_{\alpha/2} \times \sigma}{E} \right)^2 \]
其中:
\( Z_{\alpha/2} \) 是标准正态分布的 \( \alpha/2 \) 分位数(例如,95%置信度下, \( Z_{\alpha/2} \) 约等于 1.96)。
\( \sigma \) 是总体标准差(如果未知,可以使用样本标准差作为估计)。
\( E \) 是允许的误差或置信区间的一半宽度。
经验法则
有时基于以往经验或习惯上接受的样本量大小。
根据允许的抽样误差范围确定
允许的误差越小,所需的样本量越大。
根据特定目的确定
如果样本需要分成不同组,每组样本量应保证足够大,例如每组至少100个,小组样本量在20到50个之间。
考虑其他因素
决策的重要性、调研性质、变量个数、数据分析性质、同类研究中的样本量、发生率、完成率、资源限制等。
样本的代表性
确保样本具有代表性,无论是通过随机抽样还是好的抽样框。
其他注意事项
总体越大,样本量也需相应增大,但增长呈现对数特征,而非线性关系。
分层抽样时,层内样本差异小,设计效应小于1,适当分层可减少样本量。
在实际操作中,研究者需要综合考虑上述因素,并可能需要使用统计软件或咨询统计专家来精确计算样本量