- 妙趣横生的统计学:培养大数据时代的统计思维(第四版)
- (美)杰弗里·班尼特 威廉·L.布里格斯 马里奥·F.崔奥拉
- 5073字
- 2021-03-29 03:13:06
1.3.3 实验研究
因为实验研究需要积极的参与,如提供实验处理,我们必须特别仔细地设计实验来确保它可以提供我们想要了解的信息。下面我们分析一些设计实验时可能发生的问题。
1.控制的必要性
考虑维生素C对感冒影响程度的实验。假如那些每天摄入维生素C的人,在三个月中平均有1.5次感冒。调查者怎样确定不摄入维生素C的人群更容易感冒?要回答这个问题,调查者首先要把主体分为两组(或更多):一组成员每天摄入大量维生素C;另一组不摄入。在大部分案例中,将参与者随机分配到两个组群中很重要。
对照组控制变量不变来帮助我们解释结果,它因此而得名。
摄入维生素C的一组被称作实验组,因为该组成员将会摄入维生素C来进行实验。不摄入维生素C的成员组称为对照组。调查者认为维生素C是一个有影响的变量,摄入维生素C的人群会明显比对照组人群患感冒的次数少。
实验组和对照组
实验组:在实验中得到处理的群体。
对照组:在实验中没有得到处理的群体。
例4 实验组和对照组
继续讨论索尔克脊髓灰质炎疫苗案例。实验处理是什么?哪一组儿童构成了实验组?哪一组儿童构成了对照组?
答案 实验处理为索尔克疫苗。实验组是接种了索尔克疫苗的儿童,而对照组是没有接种索尔克疫苗而注射生理盐水的儿童。
例5 莫扎特实验
在一项研究中将大学生分为两组:一组学生在被分配特定任务前聆听莫扎特或其他古典音乐;另一组不听任何音乐。调查者发现,听古典音乐的学生更好地完成了任务,但只在刚开始的几分钟表现出来(两个组在之后的任务完成情况基本相同)。识别实验组和对照组。
答案 实验处理是古典音乐。实验组是聆听古典音乐的大学生,对照组是没有听音乐的大学生。
莫扎特效应是指听莫扎特音乐会使婴儿更聪明。这个效应催生了大量的有关莫扎特的儿童读物。美国佐治亚州甚至向新妈妈分发了莫扎特音乐CD。然而近期许多研究表明,莫扎特效应并不能实现上述的影响。
2.混杂变量
使用对照组能帮助我们解释已知变量如何影响研究的结果。然而调查者可能意识不到或者不能解释其他重要的变量。分析以下实验,一位统计老师想知道合作学习的学生(和别的同学一组进行学习)是否比单独学习的学生成绩高。老师选取五位合作学习的学生(实验组)和五位单独学习的学生(对照组),为保证这些学生都有相同的学习能力并会刻苦学习,老师仅从平均成绩高的同学中进行挑选。在学期末,老师发现合作学习学生们的期末成绩更高。
本案例中的目标变量是合作学习(是否进行合作学习)和期末考试成绩。但是假设在老师不知道的情况下合作学习的学生都住在同一个宿舍,晚上宿舍会准时熄灯以保证他们充足的睡眠时间。这个因素又引出了一个新的变量——可称作睡眠时间——该变量可能在一定程度上影响结果。换句话说,实验结果似乎能说明合作学习有益,但结果不公平,因为老师没有考虑到学生的睡眠情况。
在统计术语中,以上研究涉及混杂变量。获得高的分数可能是由于目标变量(合作学习)的影响,也可能是由于适量的睡眠,或者两者都有。由于老师没有考虑不同睡眠时间的影响,我们把它叫作研究的混杂变量。你也可以考虑其他影响该案例的潜在混杂变量。
如果不同变量间存在混合影响,则说明研究存在混杂性。因此我们不能确定特定变量的影响程度。导致混乱的变量被称作混杂变量。
案例研究 混杂药物结果
最近,联邦药物监管局的顾问小组建议撤销对晚期乳腺癌治疗药物阿瓦斯丁的批准,这种药是目前世界上最畅销的癌症治疗药物。在早期的试验中发现,与单独使用化学疗法相比,该药物与其他化学疗法相结合使用时,阿瓦斯丁推迟肿瘤生长的时间大约为五个月。然而,附加试验表明,肿瘤生长没有明显的延迟迹象,服用阿瓦斯丁的患者的生活质量没有明显提高,生命也没有明显延长。不同试验的结果不同,表明没有对混杂变量做出合理的解释。一个可能的混杂变量是化学疗法的选择。事实上,欧洲关于阿瓦斯丁的研究表明它是有成效的,但是基于将它与另一种化学治疗方法结合使用,这与美国所使用的方法不同。结果,欧洲官方批准了阿瓦斯丁的扩大生产及使用,而同时美国却建议取消它。这表明,尽管几千条生命、几百万美元投入试验,混杂变量仍可能很难排除。这与医生和病人(或者政府)想要的结果相比有很大的不确定性。
3.分配实验组和对照组
如同合作学习实验所阐明的,如果实验组和对照组在某些重要方面有所不同(除了接受和不接受处理之外的其他因素),那么大多数情况下其结果都会受到混杂变量的影响。调查者通常采取两种策略来避免或缩小这个差别,以确保实验组和对照组可以公平对比。第一,把参与者随机分成实验组和对照组,其意义是使用科学的方法保证每个参与者被分配到两个组中的机会均等。当参与者被随机分配后,通常认为实验组和对照组的成员在各方面没有太大的不同,不会对结果造成影响。第二,努力确保实验组和对照组的成员足够多。例如,在合作学习实验中,每组50个学生要比每组5个学生更少出现一个学习小组在同一个宿舍的情况。
选择实验组和对照组的策略
随机分组:确保实验主体被随机分为实验组和对照组,其意义是各主体被分在各组的机会均等。
使用充分的大样本:确保实验组和对照组都是充分的大样本,这样在某些方面就没有明显的差异(除了一个组得到处理而另一个没有这个事实之外)。
例6 索尔克研究的分组
简要说明在索尔克脊髓灰质炎疫苗研究中,选择实验组和对照组时两种策略的应用。
答案 共计40万名儿童参与的研究中,一半接种了索尔克疫苗(实验组),另一半只注射了生理盐水(对照组)。第一步,从所有儿童中随机选择两组成员;第二步,确保有大量的参与者(每个组有20万名儿童)。这样两个组基本没有差异。
4.安慰剂效应
当有人参与实验时,会产生一些影响,因为他们知道自己是实验的一部分。假设你要检验一种新的抗抑郁药物的效果。你找到500名抑郁症患者,并将他们随机分成两组。一组为实验组,接受新药物的治疗;另一组为对照组,不接受治疗。几周后,与患者谈话的结果表明,实验组患者的情况比对照组的好得多。你能得出新药物有效的结论吗?
其实很可能是接受治疗的患者的情绪对结果产生了影响,比如他们很开心能接受治疗,这意味着你并不能确定新药物是否真的有效。患者的情况有所改善是因为他们相信自己得到了有效的治疗,这被称为安慰剂效应(安慰剂的英文“placebo”来源于拉丁语“to please”)。
药物对了解其越少的人越有效。
——蒙塔捏·米格尔(Michel de Montaigne,1533—1592年),法国哲学家
为了区分结果是由安慰剂效应导致的还是来自于实际治疗效果,调查者尝试不让患者知道他们是在实验组还是在对照组。因此,调查者给对照组服用安慰剂:一些看起来和被检验药物相同的东西,但缺少主要成分。例如,在一个丸药实验中,安慰剂也做成形状和大小一样的药丸,只不过其中的成分是糖而不是真正的药物。在接种疫苗的案例中,安慰剂是含盐溶液(生理盐水)而不是真正的疫苗。在对针刺疗法的效果进行检验时,安慰剂是与针刺疗法同样用针扎,只不过针刺的部位不是特定的重要穴位。
只要参与者不知道他们接受的是真正的治疗还是安慰剂,安慰剂效应对实验组和对照组的影响就是相同的。如果两组的结果差异很大,其原因就是治疗有效。例如,在抗抑郁药物的案例中,仅当对照组接受安慰剂,而实验组成员病情比对照组有显著好转时,证明药物有效。为了更好地控制实验,可用使用三个组:实验组、安慰剂组和对照组。安慰剂组给予安慰剂,而对照组什么都不给。
安慰剂效应是非常显著的。在一些研究中,75%以上的安慰剂接收者觉得确实有效。然而,不同的调查者对安慰剂效应的强度有不同看法,一些人甚至质疑安慰剂是否真有成效。
安慰剂缺乏实验中治疗的有效成分,但看起来就像是治疗药物,所以参与者不能区分他们是被给予了安慰剂还是真的在治疗。
安慰剂效应是指患者的情况有所好转,仅仅是因为他们相信自己得到了有效的治疗。
注:尽管参与者不应该知道他们是在实验组还是对照组中,但由于道德原因,参与者应该被告知他们会得到安慰剂而不是真正的治疗。
例7 疫苗安慰剂
在索尔克脊髓灰质炎疫苗研究中,安慰剂是什么?为什么调查者在实验中要使用安慰剂?
答案 安慰剂是向对照组儿童注射的生理盐水。为了理解为什么调查者要对对照组使用安慰剂,假设不使用安慰剂。当观察到实验组有明显改善时,并不能确切地知道改善是因为疫苗还是因为安慰剂效应。为了辨别混杂因素,所有参与者必须相信他们被同等对待,这就确保安慰剂效应将会平等地出现在两个组中,因此调查者可以将剩余的差异归结为疫苗作用。
5.实验者效应
即使研究对象不知道他们是接受了真正的治疗还是仅仅使用了安慰剂,实验者也会对结果产生影响。例如,在一个抗抑郁药品的实验中,实验者会询问患者是否感觉好些。然而,如果实验者知道谁接受的是真正的药品,谁接受的只是安慰剂,那么他们可能会无意识地对实验组成员有更多的笑脸。他们的微笑可能使患者心情愉悦,这让患者看起来好像是药物治疗起了作用,而实际上这个好转是由于实验者造成的。这种类型的混杂,是由于实验者影响了结果,叫作实验者效应(或罗森塔尔效应)。避免实验者效应的唯一途径是确保实验者不知道研究对象在哪个组中。
实验者效应是指调查者或实验者通过某些因素影响研究对象,如通过面部表情、声调或态度。
外界流传,许多幼儿在托儿所或学前班很可能被虐待。目前正在重新调查这些案例,以排除实验者效应导致误判的可能性。类似的声明表示,使用实验者效应是防止涉及记忆被抑制的情况,而咨询很可能帮助人们重新获得失去的有关创伤性事件的记忆。
例8 虐待儿童了吗
在一个著名的案例中,来自加利福尼亚州贝克尔斯菲尔德的两对夫妻被宣告有罪,因为他们日托中心虐待学前儿童。其证据主要来自对孩子们的采访。然而,当该男子已在监狱服刑14年后,罪证被推翻。检察官重新审判采访结果,认为孩子们只是给出了实验者想要得到的答案。如果把采访者当作实验者,这就是一个存在实验者效应的案例,采访者通过语调和提问的方式对孩子的回答结果产生影响。
6.盲法
在实验中确保人们不知道谁在实验组,谁在对照组的方法叫做盲法。单盲实验是参与者不知道他们属于哪个组,而实验者知道的实验方式。参与者和实验者都不知道他们属于哪个组的研究称为双盲实验。当然,一些人需要跟踪这两组的人,以便评估最后的结果。所以在双盲实验中,调查者设计实验时,通常选择有代表性的实验者与参与者建立重要联系。调查者要避免和参与者接触,确保不会以任何方式影响参与者。索尔克脊髓灰质炎疫苗研究就是一项双盲实验,因为参与者(儿童)和实验者(接种疫苗的护工和诊断小儿麻痹症的医生)都不知道谁接种了疫苗,谁注射了安慰剂。
实验中的盲法
参与者不知道他们是实验组成员还是对照组成员,而实验者知道的实验,称为单盲实验。
参与者和实验者都不知道参与者是属于实验组还是对照组的实验,称为双盲实验。
例9 实验有什么问题
从以下所描述的实验中,找出问题,并说明如何避免这些问题。
a.一种治疗注意力缺乏症的新药品被认为可能使患儿更有耐心。随机选择患有注意力缺乏症的儿童,把他们分为实验组和对照组。该实验为单盲实验。实验者通过一对一访谈来评估这些儿童的耐心程度。
b.调查者想知道考试前喝咖啡是否能提高成绩。50个爱喝咖啡的人被要求考试前4小时内不要喝咖啡。而50个不喝咖啡的人被要求在考试前4小时内至少喝两杯咖啡。两组在考试中有相同的表现。
c.调查者想知道通过运动是否能减缓罕见变异疾病的发展。他们找到6名患者,随机将3名分到实验组,每天运动;另外3名作为对照组,不进行运动。六个月后,对每组患者病变的严重程度进行比较。
d.脊椎按摩师对25名背部疼痛的患者进行调节治疗。之后,18名患者说他们感觉好转了。他便得出结论,调节治疗是一个很有效的治疗方法。
答案 a.实验者通过访谈评估耐心程度。由于他知道哪些孩子得到了真正的药物治疗,他对这些孩子的谈话内容可能有区别,或者对孩子们的行为有不同的解释。实验者效应能混淆实验结果,所以应该选择双盲实验。
b.两组都是在不符合自己日常习惯的情况下考试:爱喝咖啡的人不能喝咖啡,而那些不爱喝咖啡的人却被迫喝了咖啡。这个案例说明了不能解释如何影响结果的混杂变量。事实上,这个实验很难设计得完美。
c.这个研究的结果很难解释,因为样本容量没有足够大。而且,如果之前患者保持运动,研究中却不让他去运动,可能会导致其他健康问题来混淆结果。
d.25名得到调节治疗的患者代表实验组,而这个研究缺少对照组,患者觉得好转可能是安慰剂效应而不是真的调节治疗的影响。脊椎按摩师可以请一个演员假装对对照组进行调节治疗(一种感觉类似,但实际上和脊椎按摩师的治疗并不相同的方法),这样他就可以对照两组的结果看是否存在安慰剂效应。