当研究涉及多个区域、多个层级或多个群组的总体结构时,简单的随机抽样样本量计算公式不再适用。分层抽样和整群抽样是两种常用的复杂抽样设计方案,它们各自对应不同的总体结构和研究需求。
分层抽样的样本量分配策略
分层抽样将总体按某个特征(如地区、收入水平、品牌使用情况)划分为若干层,再在每层中独立进行随机抽样。样本量计算方法在分层抽样中的核心问题是如何在层间分配样本。
分配策略有两种:比例分配和非比例分配。比例分配按各层在总体中的比例分配样本,实现简单但可能让小样本层的数据精度过低;非比例分配则人为增加小样本层的权重,以获得各层足够的分析精度,适用于各层重要性差异较大或层间变异差异明显的研究。
整群抽样的设计效应与样本膨胀
整群抽样以群组(如城市、学校、家庭)为抽样单位,从总体中随机抽取若干群组,再对被抽中群组内的所有个体进行调查。这种设计的优点是降低调查执行的组织和交通成本,但代价是群内个体往往存在相似性,导致估计精度下降。
整群抽样需要引入”设计效应”概念来调整样本量。设计效应(Deff)是整群抽样方差与简单随机抽样方差之比,通常大于1。样本量计算方法需要将简单随机抽样的目标样本量乘以设计效应,得到整群抽样所需的实际样本量。
两阶段抽样的样本量计算逻辑
两阶段抽样结合了分层抽样和整群抽样的特点:第一阶段从总体中抽取初级抽样单位(如城市),第二阶段从被抽中的初级单位中抽取个体样本。这种设计在大型全国性调研中最为常见。
两阶段抽样的样本量计算需要同时考虑初级单位数量和二级单位抽样比例两个变量。一般规则是:初级单位数量对估计精度的影响比二级单位比例更大,增加初级单位数量比单纯增加每个初级单位内的样本量更有效。
有限总体修正系数的应用条件
当样本量占总体比例较大时(通常超过5%),标准误差的计算需要引入有限总体修正系数(FPC)进行调整。FPC的作用是修正因抽样不放回导致的精度高估问题。
在大规模全国性消费者调研中,由于总体很大,FPC通常接近1,可以忽略不计。但在企业客户小样本调研或特定区域内的研究项目中,当样本量占总体比例较高时,应当在样本量计算方法中纳入FPC以确保精度评估的准确性。
复杂抽样设计的样本量计算涉及较多参数,建议在项目设计阶段与统计学专业人员讨论确认。使用商业统计软件(如SPSS Complex Samples模块或R的survey包)进行分析,能够获得考虑了抽样设计效应的精确标准误差和置信区间。