
Labvanced 中的文本转录
概述
文本转录涉及将口语转换为书面文本。通过转录文本,口头内容可被搜索、阅读和分析。转录的主要目标是使口头响应的内容便于回顾、分析和记录。
Labvanced 中的文本转录示例
1. 口头响应转录
此用例将转录作为数据收集的一种核心方法。当实验要求参与者提供口头答案时,音频录音对象会捕捉他们的口头响应。通过整合相关的转录事件,口语随后自动转换为书面文本。这些结果文本可以与实验中的其他定量数据一起保存,准备进行详细的会后分析。
有用的演示: https://www.labvanced.com/page/library/75503
在此演示中,参与者被要求口头回应一系列问题,同时可以选择在提交前预览他们的回答。提交后,答案会在屏幕上转录,以预览文本转录功能。
2. 用声音控制实验
转录还可以用于通过允许参与者 用声音控制实验 来创建更具互动性和可访问性的实验环境。在此设置中,可以指定特定的口语单词或短语作为命令。当参与者说话时,音频实时转录为文本。Labvanced 随后将这段文本识别为触发特定动作的命令。例如,在一个任务中,参与者必须对刺激进行分类,他们可以简单地说“正确”或“错误”,或“左”和“右”,而不是按下一个键。
3. 实时分析和动态任务分配
此用例将前面应用中的理念更进一步,利用转录作为实时自适应实验设计的基础。参与者的口头响应被转录并立即输入到 AI 模型,如 ChatGPT,以便进行即时分析。这种分析可以执行复杂的任务,例如确定响应的情感倾向,计算某些词类的频率,或将参与者的陈述归类为几个预定义的心理学类别之一。根据此 AI 分析的输出,实验可以 动态分配下一个任务,使体验更贴合个体的推测状态。例如,如果 AI 检测到响应中存在高水平的焦虑,系统可以接下来呈现一个使人放松的任务,从而创建一个高度个性化和响应式的研究协议。
转录技术
支持集成 - Whisper
通过有用的 Whisper 集成,转录在 Labvanced 中自动进行。Whisper 是一个用于自动语音识别 (ASR) 的预训练模型,已在 680K 小时的标注数据上进行了训练。
客户端隐私
由于此集成,所有处理和转录都仅在参与者的设备上进行。客户端处理确保没有个人数据,如语音数据,会传输到第三方服务器。