实验设计的 6 个关键概念
实验研究设计是新学生需要理解并最终掌握的一项关键技能。良好的实验设计对于从研究中得出客观结论是绝对必要的。在这里,我们讨论每个学生应该牢记的主要概念。
1. 明确界定你的实验变量
变量必须从一开始就明确界定。大多数研究希望考察一个(或多个)变量之间的关系:
- 自变量: 你正在操控和控制的刺激、条件或干预。
- 因变量: 自变量变化所带来的后续效果。
考虑研究问题“观察情绪是否会影响参与者对书面语言的感知?”如果你在研究感知,并对情感的启发对书面语言解读的影响感兴趣,你可能会问这个问题。
例如,想象一下参与者在感知到一个快乐的人之后,阅读各种文本提示,如“不要与陌生人交谈”,然后参与者需要报告他们对文本提示的感知。
在这个例子中,你的自变量和因变量可以是任何数量的东西,作为研究者,你的职责是将它们操作化并定义清楚。
- 对于自变量: 不同情绪的图像或表达不同情绪的声音录音
- 对于因变量: 评估文本提示不同维度的李克特量表,甚至是测量可能性的一个问题,“你认为你感知到的人说这个命令的可能性有多大?”
自变量和因变量是所有研究的核心,但良好的实验设计也考虑其他变量,例如:
- 控制变量
- 混杂变量
- 外部变量
如果你在规划阶段概念化并严格考虑所有变量,那么设计基于网络的实验和在 Labvanced 的编辑器中设置变量 便只是学习几个点击的事。
你还可以上传各种刺激,从视觉到音频,通过诸如眼动追踪等功能测试参与者的行为。查看这个播放列表,了解在 Labvanced 中如何创建各种刺激并将其视为构建实验的对象!
2. 理解实验设计的构建模块
为了在实验设计上做得好,并建立支持你的研究问题的设计,孤立你的变量,你必须了如指掌地了解实验设计的构建模块。
即这些模块:
- 试次: 特定任务或对刺激呈现的提示反应的单次实例,比如完成一次迷宫运行或查看一串字母。
- 试次块: 一个块由多个试次组成,通常一个实验将有多个块。
- 会话: 与纵向设计相关,实验会话可以跨越多个天(甚至几岁),参与者在不同的时间点再次执行试次。
试次
试次 是实验的基本单位,当它们捆绑在一起时,形成块,并组成会话。试次通常是刺激的单次实例。
观看这个视频,了解如何使用 Labvanced 构建多个试次,展示宠物(狗和猫)和花的图像,提示参与者在每次试次中选择宠物:
块
一组试次形成一个块。研究人员出于多种原因使用这些块,包括随机化他们的研究。块的另一个常见方法是使它们与研究问题相关或与进行实验所需的不同学习阶段相关。
研究中块的示例:
- 主题问题: 试次块可以遵循特定的研究主题。例如,块可以遵循某个认知主题,如工作记忆的各个方面,甚至是 表现者的形式,在此展示的运动按方向和速度特征分组(Cook, Pan, & Bianchi-Berthouze, 2013)。
- 时间元素: 块可以涉及“练习”、“训练”到“实验”的过程,通常在被试内设计的研究中可以看到。例如,使用 Labvanced 评估儿童在语言实验中的序列反应时间任务表现的研究,使用了块并测量参与者在 第一次训练块 与最终块之间的表现差异(Marimon et al., 2021)。
会话
会话指的是参与者在研究中提供响应的不同时间点。
考虑 Polonen, Lappi, & Tervanieni (2019) 在《心理学前沿》中进行的此项研究,目的是评估运动对气功实践者的情感状态和流畅感的影响,其中 第一次会话 是反思与运动块的混合。
后续会话通常在不同的天(甚至几个月)进行,可以是之前使用的相同试次和块、不同的块,或新旧块的混合。
在 Chládková 等人最近的研究中,研究人员招募了 会话 1,测试了 161 名参与者,而 会话 2 则有 202 名不同的参与者。目标是研究为期一个月的戴口罩规定对言语感知的影响。为此,研究人员在规定之前进行了 会话 1,在为期一个月的规定之后进行了 会话 2。对于两个会话,刺激完全相同,即一组持续大约 10 分钟完成的 48 个试次,评估 McGurk 效应的强度。
3. 被试间设计和被试内设计
在上面的例子中,讨论 Chládková 等人的 McGurk 效应实验,采用了被试间设计(会话 1 相较于会话 2)!
有时,研究人员希望研究不同的条件或处理。在这种情况下,应选择被试间设计或被试内设计。
被试间设计
亦称 ANOVA 或独立测量设计,在被试间设计中,参与者只能在实验中研究的众多条件或处理中的一个条件或处理中。
通常,这是一种经典实验设计,参与者要么被指定为对照组(有时可能会观察到安慰剂效应),要么为实验组。
表面上看,通常使用被试间设计的用例是:
- 社会心理学
- 人格心理学
- 决策研究
重复测量/被试间设计的一些优点包括:
- 会话较短: 因为不期望参与者经历多个条件或处理(如被试内设计的情况),所以会话较短。
- 减少干扰效应: 由于一个单独的参与者不期望完成多个条件或处理,因此在一个条件后跟随另一个条件的效应较小。因此,研究人员不必担心像学习效应或疲劳效应等问题,这在被试内设计中是常见的。
被试内设计
亦称 重复测量 设计,在被试内设计中,参与者先参加一个条件或处理,然后再参加另一个条件或处理。所有跟踪参与者的纵向研究都遵循被试内设计,因为它们一再关注相同的参与者。
这种设计在研究累积效应时非常流行,这种效应是预期会随着时间推移而显现的。因此,通过多次测量同一参与者,可以记录随着时间的推移所呈现的期望结果。
平衡 是研究人员用来确保接收处理的 顺序 不会影响可观测结果的一种方式。例如,在一个平衡的重复测量研究中,莎莉在条件 A 之前经历了条件 B,但劳拉在条件 A 之前经历了条件 B。
重复测量/被试内设计的一些优点包括:
- 所需参与者较少: 由于来自单个参与者的更多数据,可以使用小样本检测相关性甚至因果关系。
- 减少噪声: 由于数据来自于同一参与者,个体差异(即噪声)被最小化,因为像记忆或智力这样的因素在不同条件之间不会改变。
表面上看,通常使用被试内设计的研究例子包括/专注于(Keren & Lewis, 2014):
- 认知与神经心理学
- 感知
- 记忆
- 学习
- 心理物理学
- 反应时间
4. 随机化与平衡

随机化是将参与者随机分配到不同实验条件中的过程,是实验设计的核心,因为它有助于消除偏倚以及未知变量的影响,后者可能会统计性地解释任何显著结果。(Suresh, 2011)。
另一方面,平衡是一种确保不同实验组之间分配的参与者人数相等(或尽可能相似)的方法。例如,考虑到你的“对照组”有 5 名参与者,而“实验组”有 95 名参与者。这听起来很糟糕,对吧?一个更平衡的设计应该是“对照组”和“实验组”各有 50 个受试者。
虽然心理学的所有领域都受益于随机化,但临床和健康心理学家对此特别关注,因为他们常常处理干预和治疗。
使用 Labvanced,你的实验可以具有 随机化试次、任务、块和组,这取决于你研究的性质。你可以随意随机化任何东西,并可以确保组之间的平衡,确保组间分配受试者数量相等。
以下是使用 Labvanced 平衡和随机化研究的一些方法:
- 随机因素: 实现刺激的简单、嵌套或被试间平衡
- 随机试次顺序: 为每个对象上传预定义的试次顺序或使用事件创建自适应/动态试次顺序
- 事件逻辑: 创建高度个性化的平衡机制,例如动态分配文件给对象
具有平衡和随机化的研究是必须的,因为它有助于确保你的统计分析和结果的完整性。
5. 复制

复制是心理学领域最古老的问题之一,可以追溯到 19 世纪和 20 世纪初领先心理学家的观察(Laws, 2016)。
至今,复制(指一项研究可重复的程度,通常用于确定原始研究的发现是否能在其他情境和参与者中观察到)在实验研究中依旧是一个问题。
复制很重要,因为其他研究人员要确认或测试一项研究的发现,必须能够复制该研究。这在心理学中是困难的,因为行为通常非常复杂且难以预测。
研究在网络上进行的一个优势是你可以 分享研究模板,其他研究人员可以利用实验或任务测试其他群体,并尝试复制你的结果。
6. 证据的力量
一项研究的定义与设置越严格,随之得出的任何结论背后的证据就越强。因此,如果你想通过你的研究确立某件事情,你需要相应的证据来支持它。
有很多不同的系统来分类证据(这可能因国家和组织而异)。作为一般规则,你可以将证据视为从“不是特别严格或令人信服”到“经过检验的”一个光谱。
想象一下某人的姑姑根据她养育三个孩子的经验告诉你关于护理对婴儿感知影响的看法。虽然这可能是一场有趣的对话,但这些见解并不可靠,因为通过将数千名被分配到特定育儿风格的护理者的随机研究所得出的结论是经过测量的(同时控制混杂变量)!
通过理解证据的力量,你可以设计一项实验,其中随之得出的结论是合理、可靠的,不受混杂和/或偏见的影响。
结论
没有什么比设计你作为新兴研究者的第一个实验更令人兴奋的了。牢记这些关键概念,你可以开始得更强,建立理解更高级概念(如互动)的基础。而使用 Labvanced 在线构建实验可以帮助你继续作为研究者成长,快速收集数据,设计有效的实验并增加出版量!
而且,请记住,你在处理本文所概述的 6 个组成部分时的方式决定了你结论的强度,甚至是你发现的结果。此外,保持在线进行实验时,实验控制在实验如何在在线环境中处理方面扮演重要角色。了解更多关于 Labvanced 如何确保 实验控制的信息。
参考文献
Chládková, K., Podlipský, V. J., Nudga, N., & Šimáčková, Š. (2021). The McGurk effect in the time of pandemic: age-dependent adaptation to an environmental loss of visual speech cues Psychonomic Bulletin & Review, 28(3), 992-1002.
Cook, J., Swapp, D., Pan, X., Bianchi-Berthouze, N., & Blakemore, S. J. (2014). Atypical interference effect of action observation in autism spectrum conditions. Psychological medicine, 44(4), 731-740.
Keren, G., & Lewis, C. (2014). A Handbook for Data Analysis in the Behaviorial Sciences: Volume 1: Methodological Issues Volume 2: Statistical Issues. Psychology Press.
Laws, K. R. (2016). Psychology, replication & beyond. BMC psychology, 4(1), 1-8.
Marimon, M., Hofmann, A., Veríssimo, J., Männel, C., Friederici, A. D., Höhle, B., & Wartenburger, I. (2021). Children’s Learning of Non-adjacent Dependencies Using a Web-Based Computer Game Setting. Frontiers in psychology, 12.
Pölönen, P., Lappi, O., & Tervaniemi, M. (2019). Effect of meditative movement on affect and flow in Qigong practitioners. Frontiers in psychology, 2375.
Suresh, K. P. (2011). An overview of randomization techniques: an unbiased assessment of outcome in clinical research. Journal of human reproductive sciences, 4(1), 8.