焦点小组研究方法的数据处理：音视频转录和主题归纳的操作流程

焦点小组数据为什么需要系统化处理

焦点小组研究方法产生的数据具有高度非结构化的特点：多小时的音视频录像、密集的互动对话、大量的即兴联想和情绪性表达。如果没有系统化的数据处理流程，这些丰富的原始素材很容易在转化为研究结论时遭遇”选择性引用”的风险——研究者无意识地选取了支持预设假设的发言片段，忽视了不支持或相反的声音。

规范的焦点小组研究方法数据处理流程，能够确保从音视频素材到主题归纳的每一步都有据可查，研究结论可以被回溯和审查。

第一步：音视频转录

音视频转录是焦点小组数据处理的基础步骤，也是最耗时的环节。转录的质量直接影响后续分析的可信度。

在转录规范上，需要注意以下几点：转录应为逐字转录（Verbatim Transcription），保留停顿、重复和语气词，而非经过修饰的整理版本，因为这些细节有时具有重要的分析意义；发言者的标识需要用统一的编码系统（通常用M1、M2等表示主持人和参与者，而非使用姓名），保护受访者隐私；非语言行为（笑声、犹豫、情绪激动等）用括号注释记录在转录文本中；如果使用AI转录工具，需要对输出结果进行质量校对，尤其是专业术语和方言词汇的准确性。

第二步：初步主题识别——开放式编码

完成转录后，进入焦点小组研究方法数据分析的核心环节——主题识别。主题分析通常采用从数据到主题的归纳逻辑（而非将预设框架强加于数据的演绎逻辑）。

开放式编码（Open Coding）是第一轮分析：研究者通读转录文本，对每一段具有分析意义的内容贴上初步标签（code），描述这段内容的核心含义。这一阶段应尽量保持开放，不过早限定标签的类别，避免用理论预设替代数据本身的声音。一个标准的焦点小组转录文本（90分钟，8-10人）初步编码通常可以产生50-150个不等的原始标签。

第三步：主题聚合——从代码到主题

在开放式编码完成后，进行主题聚合：将语义相近或逻辑相关的初步标签归并为更高层次的分析主题。主题聚合需要在忠实于数据内容的前提下提升抽象层次，使最终的焦点小组研究方法分析结论具有清晰的解释力。

聚合过程中需要注意：一个主题应该在多个受访者或多个发言片段中均有体现，避免将个别受访者的独特观点误认为普遍主题；不同小组之间（如本次项目访谈了3场焦点小组）的主题一致性需要单独标注，形成跨小组的主题强度评估。

第四步：主题归纳报告与引语选取

最终的焦点小组分析报告通常以主题为结构框架，每个主题下包含：主题描述（以研究者的分析语言呈现）、支持性引语（直接引用1-3条代表性受访者原话）、以及跨小组和受访者群体的主题普遍性说明。

引语的选取需要遵循代表性原则——选取最清晰表达主题含义的发言，而非最戏剧化或最极端的片段。引语应附带受访者基本特征标注（如”女性，28岁，一线城市，高频用户”），帮助报告阅读者理解引语的受访者背景。北京市场调研中心在焦点小组研究方法的数据处理和分析报告方面具有严格的质量标准，欢迎了解我们的定性研究服务。

北京市朝阳区建国路93号院11号楼10层

010-86399425

13910732521

焦点小组数据为什么需要系统化处理

第一步：音视频转录

第二步：初步主题识别——开放式编码

第三步：主题聚合——从代码到主题

第四步：主题归纳报告与引语选取