改变心理学的40项研究(改变心理学的40项研究pdf)-考研培训网

改变心理学的40项研究，改变心理学的40项研究pdf

改变心理学的40项研究

作者：（美）罗杰·R·霍克

目录
CONTENTS

译者序

第一章生物学与人类行为

研究1 一个脑还是两个脑

研究2 丰富的经历是否等于更大的大脑

研究3 人的本性是“天生的”吗

研究4 小心视崖

第二章知觉与意识

研究5 注视偏好

研究6 睡眠，毫无疑问就会做梦

研究7 类别天成

研究8 行动，如同被催眠了一样

第三章学习和条件反射

研究9 不只限于分泌唾液的狗

研究10 情绪化的小艾尔伯特

研究11 敲敲木头

研究12 观察到攻击行为……做出攻击行为

第四章智力、认知和记忆

研究13 期望导致结果

研究14 你在哪方面更聪明

研究15 心中的地图

研究16 感谢记忆

第五章人的发展

研究17 爱的发现

研究18 眼不见，不一定心不烦

研究19 你的品德如何

研究20 让你愉快的控制力

第六章情绪和动机

研究21 性动机

研究22 我能读懂你的面部表情

研究23 观察你的情绪了吗

研究24 认知失调

第七章人格

研究25 你能主宰自己的命运吗

研究26 男性化、女性化……还是双性化

研究27 和心脏赛跑

研究28 个人与集体

第八章心理病理学

研究29 究竟谁是疯子

研究30 你将再次获得防御

研究31 习得性抑郁

研究32 拥挤导致行为失常

第九章心理治疗

研究33 为自己挑选心理治疗师

研究34 缓解你的恐惧心理

研究35 投射出真正的你

研究36 编个故事吧

第十章社会心理学

研究37 斯坦福监狱实验

研究38 从众的力量

研究39 你会伸出援手吗

研究40 无条件服从

第六章情绪和动机

本章所关注的话题是我们内心的动机和情绪体验。很多非心理学家对用科学的方法探索这些问题感到困难重重。人们普遍认为，情绪和动机只是偶尔发生的，我们不能对其进行完全的控制，而且它们是与生俱来的一种本能。然而，心理学家们一直对情绪的产生以及人的行为动机怀有浓厚的兴趣。情绪和动机对行为的产生具有强有力的影响，而且在这一领域已有大量的研究成果，它们帮助我们更深刻地理解情绪和动机这两种心理现象。

本章的第一项研究也许会令人感到惊讶，这是马斯特斯（Masters）和约翰逊（Johnson）在20世纪60年代开展的有关人类性反应的研究。该研究之所以被收录在此，是因为人类的性感受和性行为受到情绪的强烈影响，而且它们本身也被视为是强有力的动机力量；第二项研究极负盛名且引人注目，它考察情绪的外部表达——面部表情，并得出了人类所拥有的基本面部表情具有跨文化的一致性结论；第三项研究探讨了极端情绪或所谓的“应激状态”对人体健康的影响；第四项研究使我们有机会领略动机研究领域最著名的实验之一，它首次证明了一个被称为“认知失调”的心理现象的存在。

研究21 性动机

Masters, W.H., & Johnson, V.E.(1966).Human sexual response.Boston: Little, Brown.

你或许并不认同人类的性行为和心理有密切关系的说法。很多人可能从逻辑上把性行为的研究划入生物学或生理学的学科范畴。这些学科的确在很多方面与性行为研究有关，并且主要是研究动物的性行为。然而，就人类而言，性毫无疑问是一种心理事件。仔细想想，性吸引、性欲以及性功能等都主要取决于人的心理。如果你对此存有疑义，请考虑一下以下几个显而易见的事实：你知道大多数人发生性行为的原因不仅仅是为了繁衍后代，更多的是心理方面的。此外，人类是地球上唯一受性问题困扰的物种，这些问题有性欲的压抑、性高潮缺乏、阳痿、早泄、阴道痉挛等。它们通常都涉及心理方面的原因。

但是，在讨论该项研究之前，我们应该知道，行为带来的欢愉以及对性问题的成功治疗离不开我们对性行为运作方式的清晰而完整的认识，即与人类性反应有关的生理学知识。这正是马斯特斯和约翰逊准备研究的问题。

在20世纪60年代以前，对人类性行为最具权威的研究工作当数20世纪40年代末、50年代初由阿尔弗雷德·金西（Alfred Kinsey）对美国人所做的大规模调查。著名的《金西性学报告》（Kinsey Reports），包括《男性性行为》（Sexual Behavcior in the Human Male）（1948）及《女性性行为》（Sexual Behavior in the Human Female）（1953），向数千名美国男性和女性询问了他们的性行为和性态度，内容涉及性交频率、手淫习惯以及同性恋经历，等等。随着这些调查报告的陆续发表，我们忽然有了一种衡量自己性生活方式的标准。金西的研究报告为我们提供了一个探索人类性行为的独特视角，直至今天，这些数据仍作为性行为的统计信息而为人们广泛引用。然而，虽然金西的研究是具有重大意义的，但是他的研究仅仅提供了人类性行为的内容，而在性行为的过程细节以及性困扰的处理方面留下了很大的空白。

于是，马斯特斯和约翰逊这两个名字已经成为人类性行为研究的同义词，并且为世界上数以万计的人们所熟知。20世纪60年代初，美国发生了一场现在被称为“性解放”的革命运动。剧烈的社会变革使人们能公开、坦率地对以前讳莫如深的性行为进行科学探索。直到20世纪60年代，根深蒂固的维多利亚式的价值观使人们对性遮遮掩掩，它成了不宜公开讨论的隐秘话题，更不用说加以研究了。所有这些都会使马斯特斯和约翰逊研究计划失去所有的社会支持和经济支持。但随着人们开始公开承认自己是具有性感受和性欲望的个体，社会不仅认可马斯特斯和约翰逊对此问题的研究，而且也需要这种研究。因此，原有的统计资料已不能满足人们的需要。人们开始乐于了解自己面对性刺激时的生理反应。

正是在这样的社会背景下，马斯特斯和约翰逊始研究人类的性反应。他们的早期研究正是本文讨论的主题。尽管他们的研究工作是在30年前进行的，但它现在仍然是有关人类性反应的生理学知识的基础。

理论假设

马斯特斯和约翰逊研究的最重要假设是：为了理解人类的性活动，我们必须研究人们对性刺激做出的真实反应，而不仅仅是人们自己报告或以为的性体验。

他们指出，该理论的目的之一是为了心理治疗，即帮助人们克服他们可能正在经历的性问题。马斯特斯和约翰逊对他们的这一目标做了如下描述：

有关人类性行为的理论基础，只有在解答了下面两个问题之后，才能真正建立起来。这两个问题是：当男性和女性对有效的性刺激作出反应时，他们的身体发生了什么样的反应？当男性和女性对有效的性刺激作出反应时，为什么他们会作出这样的反应？如果医学工作者要对性功能缺陷者进行治疗的话，他们必须对这些基本问题做出令人满意的解答（P.4）。

在这一研究目的的基础上，马斯特斯和约翰逊还指出，能够获得上述问题答案的唯一方法便是对男性和女性性反应的各个阶段进行直接、系统的观察和生理测量。

方法被试

正如你想象的，这样一个研究课题所遇到的第一个困难就是寻找被试。该研究要求被试愿意在实验室里从事性活动，同时接受严密的观察和监控。研究者担心这样的要求会导致根本找不到愿意参加研究的被试，而且很难保证所找到的被试在统计学上能够代表人类这一总体。研究者担心的另一点是，陌生的实验室环境可能使自愿参加该研究的被试不能以他们通常的方式作出反应。

在他们研究的早期阶段，马斯特斯和约翰逊雇用卖淫者作为被试。做出这一决定的原因是由于他们推测来自于一般的和典型的生活方式的个体会拒绝参加该项研究。8名女性和3名男性卖淫者接受了近两年的全面研究。研究者们认为，从这最初的11名被试身上所获得的研究数据，对完善整个研究的研究方法和技术起了关键性的作用。

但是，这些被试对人类性反应的整体研究而言并不适宜。这是因为他们的生活方式和性经历与普通人还是相去甚远的。所以，研究者们深知，从这些被试身上所获得的任何结果不能确定无疑地推论到一般人群上去。因此，有必要获得一个更具代表性的研究样本。和他们最初的预测相反，研究者发现，寻找具有代表性的被试并不像他们先前想象的那么难。

通过与某大城市一个地区的一些学术、医疗机构的联系，马斯特斯和约翰逊找到了大量具有不同社会经济地位和教育水平的志愿者来参加这项研究。表6—1概括了最终被选为被试的志愿者在年龄、性别以及受教育水平等的人口学特征上的分布情况。所有的志愿者都接受了详细的访谈，以确定他们参加该研究的动机以及在性反应问题上与研究者沟通的能力。这些候选被试也都同意参加一次体检，以确定他们生殖能力的常态指标。

表6—1 被试的年龄、性别和文化程度等特征的分布情况

程序

为了仔细地研究人类性活动和性刺激过程中的生理反应，研究人员有必要设计出极为精密的观察测量方法，其中包括对脉搏、血压、呼吸频率等生理反应的标准化测量。此外，还要观察和记录特定的性反应。为此，“被试在各个时段的性活动将包括各种人工操纵和机械操纵，男性被试与其女伴以仰卧、跪式或最习惯的姿势进行自然的性交，女性被试则以仰卧或跪着的姿势进行人工操纵的性交”（P.21）。这就意味着，研究者不仅观察和测量被试以各种姿势进行的自然性交，而且还要观察和测量在人工或机械装置的帮助下所进行的手淫活动，这些机械装置是为对被试的反应进行清晰的记录而专门设计的。

这些由物理学家设计的特殊装置主要是由塑料制成的透明人造阴茎，这些人造阴茎可以帮助研究者进行真切的内部观察。人造阴茎可以根据女性感觉舒适与否来调整大小，而且在整个反应周期内完全由女性被试控制其在阴道中插入的深度和活动频率。

被试的适应和舒适感

不难想象，所有这些期望、观察和装置都可能会使很多被试产生实际的情绪困扰。马斯特斯和约翰逊也的确意识到了这一点。为了帮助被试在整个研究过程中始终处于舒适的状态，他们保证：

在研究开始之前，研究者先在私下里积极鼓励被试的性活动，然后被试的性活动在调查组成员在场的情况下继续进行，直到被试在实验环境中泰然处之。……只有当被试在他们的环境中感到很安全，而且相信自己能够完成研究任务的时候，研究人员才对他们的反应进行记录。这一训练阶段是为让被试对研究的单纯性和研究承诺的匿名方式建立信任感（P.22—23）。

有些被试只参与了一段时间的研究便退出了实验，而另一些被试则积极参加了长达数年的研究。在这项研究中，马斯特斯和约翰逊估计他们共观测了约10000个完整的性反应周期，其中女性和男性的数量之比是3∶1。换言之，“至少有7500个完整的性反应周期是由女性被试在各种研究程序中完成的。相反，男性被试的性高潮（射精）经历的研究数据至多仅为2500个”（P.15）。

结果

马斯特斯和约翰逊从该研究中发现了与人类性反应有关的极为有价值的信息。稍后我们将对这些发现的精华部分进行概括。不过，另一个值得人们牢记的方面是，他们从被试那里所得到的研究数据几乎适用于每一个人。当然，在人类整体中总会存在一些罕见的例外、异常或变态反应，但除了这些极个别的现象外，每个人对性刺激的生理反应都是极为相似的。这一事实致使马斯特斯和约翰逊的这一研究的价值无法估量。它为改善每个人的性生活提供了可能。当你读到他们早期的发现时，不应忘记，他们并未研究与人类性活动有关的态度、情绪、价值观、道德、偏好、适应性或喜恶。很明显，这些都是因人而异的，而且这种个体差异造就了人类性行为的极大的、甚至是不可思议的多样性。那就让我们见识一下马斯特斯和约翰逊的这些最具影响力的研究发现吧！

性反应周期

在研究了大约10000个性行为案例后，马斯特斯和约翰逊发现，人类的性反应可以分为四个阶段，并将其命名为“人类性反应周期”。这些阶段依次为兴奋期、持续期、高潮期和消退期（参见表6—2）。虽然两位心理学家在自己的著作中承认这些阶段是人为划分的，但这种划分使得对性反应的讨论变得更加容易和清晰。如今，学术界或专业领域在对人类性反应进行讨论时，无不参考这四个反应阶段。尽管男性和女性在性反应上存在一些差异（这一点我们将稍后加以讨论），但男性和女性在性行为中都要经历相同的四个阶段。

表6—2 性反应周期的四个阶段

性解剖学

马斯特斯和约翰逊对该项研究的伟大贡献之一便是揭开了人类性行为的神秘面纱。研究者试图纠正在性的解剖学知识方面存在的普遍误解，特别是对阴茎和阴道的分析。有史以来，男性最常见的性担忧便是阴茎的大小问题。马斯特斯和约翰逊研究了很多阴茎，且最终找到了该问题的科学答案。他们称这种困扰为“性器误解”（phallic fallacies）。男性通常为这两个问题而苦恼：（1）阴茎越大才越能满足女性的需求；（2）他们怀疑自己的阴茎太小。马斯特斯和约翰逊对他们在研究中测量到的阴茎平均大小进行了讨论，并表明上述想法是被误导的结果，而且解释了阴茎和阴道在两性性交过程中的机能。

研究者发现，在80名男性被试中，松弛状态下，阴茎长度的正常范围是从2.8英寸到4.3英寸，其平均长度大约为3英寸。在勃起状态下，阴茎长度的正常范围是从5.5英寸到近7英寸，其平均长度大约为6英寸。这些数字明显小于人们传统观念中所认为的大阴茎和小阴茎的长度。但更令人惊奇的是，当研究者测量勃起阴茎的长度时，他们发现松弛状态下较大的阴茎并不预示着它在勃起时也更大些。事实上，总体而言，他们发现松弛状态下较小的阴茎在性兴奋时比松弛状态下较大的阴茎有更大的变化幅度。看一看下面的平均数值，松弛状态下3英寸长的阴茎可以增加到6英寸，而松弛状态下4英寸长的阴茎只增加了大约2.5英寸并最终达到6.5英寸。为了进一步说明这一发现，马斯特斯和约翰逊报告了所观察到的在松弛状态和勃起状态下变化幅度最大和最小的阴茎。一位被试的阴茎在松弛状态下长度是2.8英寸，其勃起状态下的阴茎长度增加了3.3英寸，总长度达到了6.1英寸。另一名被试的阴茎在松弛状态下是4英寸，勃起时仅增加了2.1英寸，其最终长度同样也是6.1英寸。

比以上这些阴茎的测量更重要的是女性的性快感和性满足取决于阴茎大小的观念。正像他们书中的“对阴道的误解”一节所说明的那样，研究发现，以上这种观念是毫无根据的。在使用上述人造阴茎技术所做的观察中，他们得出结论，阴道是一种足以容纳大小不同阴茎的极富弹性的器官。“不管阴茎的大小如何，阴道总能在阴茎最初的几次抽动中使阴茎充满阴道”（P.194）。此外，他们发现，在性反应周期的持续阶段（见表6—2），阴道口的内壁膨胀起来，足以紧紧缠绕住任何大小的阴茎。因此，作者的结论是“显而易见，阴茎的大小在对女性的性刺激上通常只是个无足轻重的因素”（P.195）。

性反应上的两性差异

尽管男性和女性在性反应周期上存在很多相似之处，但马斯特斯和约翰逊也发现了一些重要的差异。他们发现的最著名且最具革新意义的差异涉及性反应周期的高潮阶段和消退阶段。高潮阶段过后，男性和女性都进入消退阶段，此时性紧张迅速降低，性器官还原为以前未唤醒的状态（这就是所谓的消肿）。马斯特斯和约翰逊发现，此时男性存在一个不应期，即在此期间，不管他所受到的性刺激的类型或数量如何，他在身体上都不能经历另一次性高潮。这一不应期可以持续几分钟，几个小时，或者甚至是一天，而且随着年龄的增长，不应期所持续的时间有不断延长的趋势。

马斯特斯和约翰逊发现女性并没有明显的不应期，而且在有效的刺激下，女性能够在第一次性高潮后紧接着经历一次或多次性高潮，且不失去任何性唤醒的能力。和男性的情况不同，在性交过程中女性“能够使自己的性高潮体验持续相对更长的一段时间”（P.131）。

尽管对很多女性而言，这种多次性高潮的能力已不是什么新闻，但这并不广为人知。在马斯特斯和约翰逊的研究以前，人们普遍相信男性有更强的性高潮能力。因此，这一发现与马斯特斯和约翰逊的其他很多发现对人们所持有的男女性行为方面的文化和社会态度产生了深远的影响。值得注意的是，尽管女性在生理上能够体验多次性高潮，但并非所有的女性都会去寻求或甚至渴望多次性高潮。事实上，很多女性从未体验过多次性高潮，但也非常满意自己的性生活。此外，很多体验过多次性高潮的女性称，一次性高潮就能使她们感到满足。就性行为的生理和情绪方面的满意度而言，个体之间的差异是相当大的。马斯特斯和约翰逊试图继续探讨性行为的生理反应的全部可能性。

批评

对马斯特斯和约翰逊早期研究的大部分批评主要是：（1）他们对性反应四个阶段的划分过于武断；（2）他们几乎没有讨论性行为的认知和情绪方面的内容。马斯特斯和约翰逊在他们的早期著作中对这些批判也都有过回应。

如前所述，两位作者已充分意识到他们对反应周期的划分纯粹是人为的，但这些划分有助于人们研究和解释人类性反应的复杂过程。多年来，其他的研究者提出了不同的阶段理论。例如，海伦·辛格·卡普兰（Helen Singer Kaplan，1974）提出了一个包括欲望、血管充血（生殖器的饥渴状态）和肌肉收缩（性高潮）的三阶段模型。这些阶段反映了卡普兰的信念，即在任何性刺激开始之前，对性反应的分析应该始于性欲的产生，而且她认为在兴奋期和持续期之间没有必要做明确的区分。她对性欲的强调引发了对马斯特斯和约翰逊早期研究的另一种主要批评意见，即他们的研究缺乏对性反应的心理因素的关注。

然而，马斯特斯和约翰逊再次明确指出，检测性行为的心理因素并不是他们此项研究的目标。不过他们相信，全面了解与性行为有关的生理知识对完满的性生活而言，绝对是一个先决条件。而且，他们后来还出版了涉及人类性行为的心理和情绪方面的著作，并在其中对这个问题作出了令人信服的论述。

最后，自马斯特斯和约翰逊的第一部著作问世以来的三十多年间，一直有研究者对他们把这些研究发现推论到所有人身上的可行性持有怀疑。例如，有研究发现一小部分女性也有不应期，在此期间，她们不能体验性高潮，此外也有一小部分男性能够体验多次性高潮，其间几乎不存在不应期。此外，虽然射精一向被认为是男性的专利，但最近研究发现，在某些情况下，一些女性性高潮时也会射精（参见Zaviacic于2002年对该研究的讨论）。

近期应用

在此，要想从每年参考马斯特斯和约翰逊早期研究的出版物中寻找具代表性的一部分，并将其罗列出来，这似乎是不可能的。这些出版物涉及的范围很广，从有关性的核心教科书（参见Hock，2007；McAnulty & Burnette，2004）到在心理学和性行为杂志中处于前沿的文章。

此外，如你所料，马斯特斯和约翰逊的模型过去和现在都饱受争议。目前，主要的争论点仍然围绕着性反应四阶段模型是否如研究者所认为的那样，适用于所有男性和女性。

有一项研究结合了基马斯特斯和约翰逊的开创性研究，针对女性性生活满意度，在全国范围内实施了问卷调查，被调查者为近1000名年龄在20~65岁之间的异性恋女性（Bancroft等，2003）。该研究的目的是调查女性性问题是否被视为与男性的相似，以及什么药物治疗能对女性有效。在这一方面，一些治疗勃起障碍的药物（例如伟哥、艾力达、西力士）已经对男性有明显疗效。该研究发现性反应的生理表现（唤起、阴道润滑、高潮）与被调查者的性烦恼之间并没有较高的相关：“总体上讲，与女性性生理反应障碍相比，在性交过程中缺乏幸福感和负性情绪体验会对女性的性困扰起到更加决定性的作用。虽然我们没有男性在此方面的直接对应数据，但我们可以预测该模式会有不同，对男性而言，生殖器的反应会更加重要。”（Bancroft et al.，2003，P.202）换言之，女性最普遍的性问题的解决方法远比一粒“粉色药片”复杂得多。

实际上，在2000年，由12名女科学家、研究人员和临床医生组成的研究队伍采用新的研究方法来探讨女性的性问题。她们认为男性和女性之间在性问题上不同之处多于相似之处，同时认为马斯特斯和约翰逊的四阶段模型在描述、解释和治疗女性的性问题上是无效的（参考Tiefer，2001）。这种关于女性性问题的新观点声称：“女性的阶段数并不恰好等同于马斯特斯和约翰逊模型。比如女性通常不能区分欲望和刺激，女性对生理刺激的关注比对主观唤醒要少。”（Tiefer，2001，P.93）研究人员指出马斯特斯和约翰逊的模型在很多方面将男性和女性的性反应等同看待，从而忽略了理解女性的性问题必需的重要因素。这其中包括性反应发生时间和女性的性反应模式的个体差异之间的关系。更独特的是，他们认为女性面临的性困扰需要建立一个分类系统，这个系统应包含文化、政治和经济背景（比如性教育或避孕措施的缺乏）、女性的伴侣和关系问题（如对虐待的恐惧、力量失衡和整体的不协调）、心理因素（比如以往的性创伤经历、抑郁和焦虑）以及医学因素（如激素失衡、性传播疾病和药物的副作用）等。

感谢马斯特斯和约翰逊所做的大量工作，使我们对包括人类性愉悦和性反应在内的生理过程的理解与前半个世纪相比，前进了一大步，但是仍有大量问题有待研究。毋庸置疑，在以马斯特斯和约翰逊开创性的工作为背景下，相关研究会继续进行，我们关于人类性反应的视野也会逐渐变宽。

结论

马斯特斯和约翰逊于1971年步入结婚殿堂。在接下来的二十多年里，他们作为一个小组，继续进行相关工作和发表文章。在1992年，由于在研究方向的分歧日趋增加及退休的原因，这对夫妇离婚了，约翰逊也随之退休了。马斯特斯一直担任着圣路易马斯特斯和约翰逊研究院的院长直到1994年退休。他于2001年2月16日死于帕金森症，享年85岁。

让我们回到本讨论的开头部分，马斯特斯和约翰逊研究的主要目的是要探讨性功能不全的问题，以便帮助人们解决它们。毫无疑问，他们达到了这一研究目的。几乎所有的性治疗，从勃起问题、性高潮缺乏到早泄、性唤醒困难等，都是建立在马斯特斯和约翰逊的研究的基础上的。马斯特斯和约翰逊为我们理解和研究人类性行为作出了难以估量的贡献。最近，人们对有关性知识的教科书进行调查后发现，和其他的研究者相比，马斯特斯和约翰逊的研究被引用的次数更多，所占篇幅也更多。除此之外，在《人类的性反应》（Human Scxual Response）一书出版后的数十年间，马斯特斯和约翰逊继续着他们的研究工作，并将其研究发现应用到帮助人们实现性生活和谐的实践当中。在他们的处女作问世4年后，他们又出版了《人类的性机能障碍》（Human Sexual Inadequacy）一书（1970），该书包括他们的早期研究，且直接将其成果应用于解决性问题上。我们可以从他们随后出版的一系列著作中发现他们不断前进的脚印，这些著作包括：《快乐的结合》（The Pleasure Bond，1970）、《同性恋观》（Homosexuality in Perspective，1979）、《人类的性行为》（Human Sexuality, 5/e，1995）、《危机：艾滋病时代的异性性行为》（Crisis: Heterosexual Behavior in the Age of AIDS,1988）、《马斯特斯和约翰逊论性与人类的爱情》（Masters and Johnson on Sex and Human Loving，1986）、《异性恋》（Heterosexuality，1998）。

研究22 我能读懂你的面部表情

Ekman, P., & Friesen, W.V.(1971).Constants across cultures in the face and emotion.Journal of Personality and Social Psychology，17，124-129.

如果你想到一些有趣的事，你的脸上会浮现出什么表情？再回想一下过去的伤感经历。你的面部表情会发生变化吗？答案是肯定的。毫无疑问，你能意识到特定的面部表情是与特定的情绪相对应的，而且在大多数情况下，你能通过某人的面部表情识别出他此时此刻的情绪情感。现在设想一下，如果一个人来自另一种文化背景，如罗马尼亚、苏门答腊，抑或蒙古，你还能借助他们的面部表情成功地识别他们的情绪状态吗？换句话说，你是否相信表现情绪的面部表情具有普遍性？大多数人相信他们能够辨认来自异域文化的人们的面部表情，但当他们考虑到异域文化与他们自身的文化差异悬殊时，又会变得犹豫不决起来。试想，不同文化在动作手势、个人空间、礼仪规范、宗教信仰以及态度等方面是多么不同。所有这些差异都会影响人的行为，因此，如果有任何人类特征（包括面部表情）在所有文化中是完全一样的话，那该是多么不可思议啊！

在面部表情研究领域，保罗·埃克曼（Paul Ekman）是站在最前沿的卓越研究者。他的这篇早期论文详细描述了他的研究工作，该研究旨在证明面部表情具有普遍性。尽管作者在论文的引言部分承认，先前的研究者已经发现了一些证据支持人的面部表情受到文化差异的影响，但他们认为这些证据是不充分的，不足以推翻他们的论断，即表达基本情绪的面部表情具有跨文化的一致性。

在开展该项研究的几年前，埃克曼和弗里森已经着手研究这方面的问题，他们向具有大学文化程度的阿根廷、巴西、智利、日本和美国被试呈现人脸部的照片。结果来自所有国家的被试都成功地识别出对应于某种情绪的面部表情。研究者把这一发现作为面部表情具有普遍性的证据。然而，正如埃克曼和弗里森他们自己所指出的，由于参加上述研究的被试都能够接触到像电影、杂志、电视等国际性的大众传媒，而这些传媒又充斥着面部表情，因此，他们欢迎各方面的人对他们的研究提出批评意见。只有找到一种从未接触过上述大众传媒的文化群体，才有可能证明面部表情具有跨文化的一致性。试想，在当今世界要想找到这样一种文化是多么困难（也许就根本不可能），即使在当时的1971年，要做到这点也很不容易。

埃克曼和弗里森来到了位于新几内亚东南部的高原为他们的研究寻找被试，在那里生活的弗尔族（Fore）人与世隔绝，其社会状态仍处于石器时代。很多当地居民几乎没有接触过西方或东方的现代文化。因此，除了自己的面部表情外，他们还没有接触过来自其他文化的表现情绪的面部表情。

理论假设

埃克曼和弗里森的研究所依据的理论假设是，对应于基本情绪的特定面部表情具有跨文化的一致性。埃克曼和弗里森用极为简洁的话对此进行陈述：

本文的目的是考察处于前文明时期的人们，尽管他们没有接触过任何的异域文明，他们依然能和来自西方文明和东方文明的人们一样，从相同的面部表情中识别出相同的情绪概念（P.125）。

方法

南弗尔族（the South Fore）是当地最与世隔绝的弗尔族分支。研究者从中选择的被试从未看过电影，不会说英语或洋泾浜英语（一种掺杂了当地语言的英语），从未为西方人工作过，并且也不住在西方人在当地的居住地内。共有189名成人和130名儿童被选为被试，他们都来自总人口为11000人的南弗尔族。对照组则选取了通过看电影、上教会学校等方式接触过西方文化的23名成人。

经反复尝试，研究者发现，让被试最有效地识别情绪的方法是给他们呈现三张印有不同面部表情的照片，同时读一段简短描述该情绪产生的情景或故事情节给被试听。每一段描述对应于其中一张照片。听完故事后，要求被试指出与某一故事情节最为匹配的面部表情。在故事的选择上，主试非常谨慎小心以确保每种情境只与一种情绪有关，而且它必须能为南弗尔族人所辨认。表6—3列出了由埃克曼和弗里森编制的六个故事。作者解释说，与恐惧有关的故事必须编得长些，以避免被试将它与惊奇或愤怒相混淆。

研究者用男人、女人、男孩、女孩共24人的40张照片，作为六种情绪表现的样片。这些照片经此前来自其他文化背景的被试使用已被证明是有效的。每张照片在被作为某种情绪的代表之前，至少须经来自东西方两种文明的被试中70%的人的判定。

表6—3 埃克曼和弗里森的对应于六种情绪的故事

在正式的实验中，由一名研究人员和一名充当翻译的当地人组成一个主试小组，由充当翻译的当地人向被试解释任务，并把故事翻译成当地的语言讲给他们听。主试向每一位成人被试出示三张照片（其中一张是正确答案，其他两张是错误答案），然后告诉被试与正确的那张照片相匹配的故事情节，最后要求被试挑出那张印有与故事相匹配的表情的照片。儿童被试的实验程序与成人被试的完全一样，有所不同的是，主试只要求他们从两张照片中挑出正确的答案。给每个被试提供的照片多组，并且确保每张照片不会在比较中重复出现。

充当翻译的当地人都经过严格的训练，以使他们不会对被试施加任何影响。主试告诉他们没有绝对正确的反应，要求他们不要催促被试回答。此外，还教他们如何每次以同样的方式翻译同一个故事，如何使自己不对故事进行扩充或润饰。为了避免无意识的偏见，研究小组的西方研究人员不能观察被试，只负责对被试的回答进行录音。

请记住，所提供的照片中有西方人的面部表情。那么，弗尔族人是否能在甚至没见过西方人的情况下正确识别照片中的表情所传达的情绪呢？

结果

首先，埃克曼和弗里森分析被试的回答，看是否存在性别差异以及成人和儿童间的差异。结果发现：成年妇女对参加实验表现得更加迟疑，她们比成年男子更缺少与西方人的接触机会。但不管怎样，在正确识别照片所代表的情绪的能力上既不存在性别差异，也不存在成人与儿童之间的差异。

表6—4和表6—5分别显示了成人和儿童在识别六种情绪时正确反应的百分比。需要指出的是，研究者并未要求所有的被试识别所有的情绪照片，而且有些被试可能会被要求重复识别同一种情绪照片。因此，表中被试的数目并不等于参加实验的被试总数。被试除了在辨别恐惧和惊奇时的正确率稍低外，其他正确反应的百分比都达到了统计学上的显著水平。在辨别恐惧和惊奇时，出现了较多错误，甚至还有一组被试当故事情节描述的是恐惧情绪时，他们选择惊奇的次数竟占到了总次数的67%。

表6—4 成人正确识别照片所表现的情绪的百分比

表6—5 儿童正确识别照片所表现的情绪的百分比

将受西方文化影响的被试（即对照组被试）与未受西方文化影响的成人被试比较，他们在正确匹配照片与故事的比例上不存在显著差异。年龄稍大的儿童与年幼儿童之间也不存在显著差异。正如你在表6—5中所看到的，儿童的成绩似乎比成人要好，但埃克曼和弗里森把这一现象归因于儿童完成的是二选一的任务，而成人完成的则是三择一的任务。

讨论

根据所获数据，埃克曼和弗里森便毫不犹豫且非常自信地下结论说：“成人和儿童的研究结果都明确地支持了我们的假设，即特定的面部行为与特定的情绪之间存在普遍的联系。”（P.128）这一结论的基础是南弗尔族人没有机会掌握任何与西方人面部表情有关的知识，这样，除非面部表情具有普遍性，否则他们是无法进行正确识别的。

为了对埃克曼的研究结果进行复核（double-checking），研究者用录像机录下了当地人演示的同样六种面部表情。后来，他们把这些录像带放给美国大学生看，并要求他们对表情进行识别，他们都正确地识别了对应于每种情绪的面部表情。

上述两项研究的研究结果都否定了“与情绪相关的面部表情具有文化特异性”的观点，这种观点认为面部表情是一种与文化紧密相联的独特传统习俗体系，它对另一种文化的成员而言是不可理解的（P.128）。

和上述发现不一致的一个例外是，被试在识别恐惧和惊奇这两种面部表情时出现了混淆现象。埃克曼和弗里森在解释这一例外时承认，情绪的面部表现确实存在某种文化差异，但这并不足以否认几乎其他所有的面部表情都能被来自不同文化的人们正确识别。研究者推测恐惧和惊奇的混淆“也许是因为在该文化中，恐惧的事件几乎总是令人惊奇的，例如，邻村的一名充满敌意的成员突然出现；一场意想不到的招魂术或者巫师的表演，等等”（P.129）。

研究影响

埃克曼和弗里森的研究科学地证实了人们对面部表情具有普遍性的猜测，然而，你或许仍会产生这样的疑问：“这一研究的意义何在？”关于这一问题的答案，我们也许可以在心理学有关人类行为的先天—后天争论（人类行为究竟是先天性的还是后天习得的）中找到。由于该研究中所涉及的六种情绪的面部表情几乎不受文化差异的影响，我们也许可以下结论说这些情绪应该是先天性的。也就是说，人在出生时这些情绪就已在生物学意义上形成了。

行为学家对于表情具有普遍性的观点颇感兴趣的另一个原因在于它已涉足了人类的进化问题。1872年，达尔文出版了他的经典著作《人类和动物的表情》（The Expression of Emotion in Man and Animals）。他认为，面部表情是一种适应机制，它有助于动物适应它们的环境进而提高其生存能力。从这一观点可以作进一步的推论，如果某些特定的信息能通过面部表情在动物的某个种系中或种系之间进行交流，那么，这将增加物种的生存概率。例如，恐惧的表情是一种无声的警告，它预示着食肉动物的出现将会带来的危险；愤怒的表情可对地位低下的同类成员发出警告，要求它们从自己的身边走开；厌恶的表情所传递的信息是：“你做什么都行，就是千万不要吃它！”从而避免了一次潜在的食物中毒。然而，如果这些表情在所有的个体间不存在普遍性，那么它们对动物将毫无作用。虽然这些面部表情对提高人类的生存能力已不那么重要，但这些表情具有普遍性的事实却表明，我们是从处于进化进程中的祖先那里继承了这些表情的，它们帮助我们达到了现在所处的进化高度。

另一项引人注目的研究证明了人类面部表情曾经具有的生存价值。研究者（Hansen & Hansen，1988）推测，如果某些诸如愤怒等的面部表情能够对迫近的危险起报警作用，那么它们相对于其他不具威胁性的面部表情（如愉快等）应更易被人们所辨别。为了检验这一假设，他们向被试出示一些照片，这些照片上的人们具有各不相同的面部表情。在某些照片中，除了一人的表情是愤怒的以外，其余人的表情都是愉快的；而另一些照片则相反，即只有一人表情是愉快的，其余人的表情都是愤怒的。被试的任务是找出照片中那个具有不同表情的人。被试从很多愤怒表情中寻找愉快表情所需的平均时间，显著长于从很多愉快表情中寻找愤怒表情。此外，随着照片中的人数的增加，被试寻找表情愉快的人所花费的时间也相应增加，但寻找愤怒表情的人的时间却没有显著增加。这一发现以及其他类似的研究发现都表明，人类也许天生就对这类能提供生存信息的表情比较敏感，因为这种表情所传递的信息与存活息息相关。

近期应用

来自其他领域的许多研究也借助埃克曼的早期发现，努力加深我们对存在发育或学习缺陷的儿童和成人的了解。其中一项研究发现，被诊断为自闭症（一种广泛性发育障碍，特征为语言缺陷、社会退缩和重复自我刺激的行为）的儿童对基本情绪的面孔识别存在困难（Bolte & Poustka，2003）。这种困难在不只有一个自闭症儿童的家庭中更明显，这也许可以解释为什么自闭症个体对其他人的情绪反应的解释存在困难。

然而，埃克曼研究的影响不仅限于对人类。他1971年的这项研究被一篇关于农场动物情绪的文章（Desire，Boissy，& Veissier，2002）引用。这些研究者认为，农场动物所产生的效益在一定程度上取决于它们对周围环境的情绪反应。当某一动物与周围环境和谐相处时，效益实现最大化；但是“如果个体感觉到任何显著的不和谐，都会导致由于负性情绪体验带来的效益降低”（P.165）。

另外一项引用了埃克曼1971年文章的研究致力于探讨特殊面部特征——眉毛——对面孔再认的影响（Sadr，Jarudi，& Sinha，2003）。先前的研究更多是对眼睛、嘴进行的，而这些研究者发现，眉毛可能比眼睛的作用更重要。作者提到“在熟悉面孔中缺少眉毛会导致显著的再认障碍”。实际上，缺少眉毛比缺少眼睛更能显著地引起面孔再认的困难（P.285）。所以，如果你需要有效的伪装，一定要把你的眉毛遮起来！

结论

自埃克曼完成表情的跨文化早期实验研究的三十年以来，埃克曼或独自，或与弗里森等其他研究者合作，继续进行他的研究工作。在这一系列的研究中，有很多引人注目的研究发现。埃克曼后来涉足的“表情的反馈理论”（facial feedback theory）便是一个例子。这一理论主张，你的面部表情实际上又把所有的表情信息反馈到大脑，以帮助你解释正在经历的情绪体验。埃克曼通过鉴别与上述六种基本情绪有关的面部肌肉活动来检验他的观点。他指导被试控制不同的面部肌肉来模仿各种情绪，在此过程中，埃克曼便能据此测量与特定情绪相对应的生理反应指标，这种特定情绪仅是由特定的面部表情所导致，而不是测量真正的情绪本身（Ekman，Levensen，& Friesen，1983）。

埃克曼还把自己的研究领域扩展到对欺骗的研究，他还探索面部表情与形体表情如何泄露说话者本人是否在撒谎的信息。他的发现表明，仅观察说话人的面部表情时，人们正确判断说话人在说谎的水平大约略微高于随机水平；然而，在主试允许被试观察某人的整个身体时，被试的正确判断率将大大提高。这表明，人的整个身体或许比单独的面部表情更能提供与某种心理状态相关的线索（参见1985年埃克曼对此问题所做的详细讨论）。近期，埃克曼将他宽泛的研究内容整合到名为《情感揭示：通过识别面部表情和情绪来提高沟通技巧与改善情感生活》（Emotions Revealed: Recognizing Faces & Feelings Improve Communication and Emotional Life）的著作中，该书可以使读者应用作者的成果来解读面部表情所表达的意思，从而帮助我们提高与的伴侣、孩子、同事甚至是陌生人的交流与互动（Ekman，2007）。

埃克曼和他的合作者已经在用面部表情进行的非言语交流的研究方面为我们提供了大量文献，并且他们在这方面的研究仍在继续。毋庸置疑，该领域的研究将持续到我们能够最终实现我们的研究目标，这一目标正如埃克曼和弗里森在1975年出版的一本书《摘下你的情绪面具》（Unmasking the Face）的书名所描绘的那样。

研究23 观察你的情绪了吗

Ross, P.(2003, August 11).Mind readers.Scientific American, 289(3), 74-77.

这篇研究报告与本书中的其他研究相比不尽相同，但将之收录进来似乎很合适。如你所知，本书涉及那些意义非凡、改变心理学的传统研究。本节的研究也不例外，然而，或许你已注意到，该研究完成于近期。目前，有一类研究正以一种极具说服力的方式改变着心理学，这项研究正是它们的代表。这类研究涉及新兴的、具有高度技术性的方法，该方法可以通过无创的方式真正窥视你的大脑，“看见”大脑中正发生什么，以及大脑如何执行诸如情绪、思考和感受等功能。好吧，这也许并非货真价实的“读心术”，但如今心理学与神经科学的研究技术，其令人震惊的程度并不亚于“读心术”。

大多数人都听说过核磁共振成像（MRI），很多人也许还接受过扫描。与X光和CT扫描相比，MRI是一项重大进步，它不发出放射线，因此对人体无害，并且它能比CT扫描更清楚地显示软组织异常（它的图像通常是三维的，这对大脑结构的可视化尤其关键）。因此，如果你膝盖受伤，CT扫描未见任何明显损伤时，下一步就极有可能进行MRI扫描，以便确切查看是否发生了软骨或其他组织损伤，从而对症治疗。

从20世纪70年代开始，MRI就已经被运用于医疗领域，然而在过去40年间，这项技术发生了极大的演变。开发MRI成像技术的先驱是伊利诺伊大学的保罗·劳特布尔（Paul Lauterbur）和英国诺丁汉大学的彼得·曼斯菲尔德（Peter Mansfield）（Lauterbur，1973；Mansfield，2007）。鉴于在这项技术上的杰出工作，他们共同获得了2003年的诺贝尔医学奖。

图6—1 fMRI扫描舱（Juan Manuel Silva/Glow Images，Inc）

在此展示菲利普·罗斯（Philip Ross）的一篇早期研究报告，该报告探索了如何将MRI用于医学用途以外，比如，探测涉及人类思维、情绪、动机和行为的大脑结构。具体来说，罗斯进行了一项研究，探索MRI是否能判断人在说谎——它是否有可能成为一台高科技测谎仪！

运用MRI“读取”大脑的基础是，在扫描过程中的某一时刻，它能显示大脑的哪些部分正在运转。MRI的这一探测大脑功能运转而非仅作诊断工具的用途，被称为fMRI（功能性核磁共振成像，如图6—1所示）。换言之，当某人的大脑被MRI扫描时，研究者可以让他进行诸如回答问题、观看图片、阅读文段等活动。随后，研究者能准确地了解大脑中的哪些部分参与了上述活动。这是如何做到的呢？其实，MRI是通过探测大脑激活区周围血流中的氧含量和葡萄糖消耗量的变化，来了解大脑是如何工作的。研究者通过扫描仪的监视器，观察大脑中某些部分的活动变化，他们能大致看出大脑中哪些部分在完成任务时被激活了。从某种程度上说，这些脑区被“点亮”了。

理论假设

试着回答一下，当人讲真话或撒谎时（人人都会撒谎；有些人撒谎比别人多），真话和谎言是否“来自”大脑中不同的部分？个人感受显然不能帮助我们回答这一问题。你的大脑并未感到任何不同。但如果我们能观察大脑在讲真话和撒谎时的运转情况，看看针对每一项活动，哪些区域激活了，我们就能回答这个问题。

fMRI能做到这点，并且它比多导生理记录仪（即测谎仪）更胜一筹，因为多导生理记录仪主要测量除大脑以外的且由焦虑引起的身体反应，而人们产生焦虑可能出于各种各样的原因，不仅是由于撒谎。因此，科学上并不认为多导生理记录仪是有效的，法庭上也不允许其作为呈堂证据。fMRI脑成像并不从研究焦虑出发，而是揭示思考过程。

这篇文章的基本观点是，在扫描仪中对大脑进行观察，如果被试说了真话，其大脑的一个部分将“点亮”：这个部分负责真实内容的陈述。然而，如果此人撒谎，大脑中的两个部分将显现出来：一部分制造谎言，另一部分抑制被谎言所掩盖的真话。换句话说，谎言是掩盖真话的，否则它就无法存在，这两个过程处于大脑中的不同部分（见Langleben et al.，2002）。使用fMRI应当可以探测这些脑区。

方法

文中描述的这项关于说真话和撒谎的研究，是在被试和研究者都清楚哪些是真话、哪些是谎话的情况下进行的。换言之，这并非用fMRI来检查某个人——如被控犯罪或被质疑失德和行为不端者——是否撒谎的测试。这其实是一项用以检验理论的探索性研究（Langleben et al.，2002）。

方法非常简单。要求被试从三只信封中选择一个信封，每只信封内都装有梅花5扑克牌和20美元钞票（被试并不知道信封中的物品都是一样的）。随后，要求被试记住牌，并将牌和钱放回信封，将信封藏在他们的衣袋里。他们被告知，有一台“电脑”能分析人的想法，如果被试能在电脑前成功隐瞒自己所持有的牌，就能获得信封里的20美元（实际上，除了fMRI设备以外，并未使用所谓的电脑）。另一些被试拿到了红心2，他们被指示要说真话，不要隐瞒他们持有的牌。

随后，每名被试都被置于fMRI扫描仪中，可使用是/否按键。他们被问道：“你有这张牌吗？”被试并不知道研究者清楚他们持有哪一张牌（这一点无关紧要，因为被试“欺骗”研究者不是本研究的重点）。

结果

fMRI扫描的发现是清楚的。如你所见，在图6—2中，讲真话的被试只运用了一个脑区（前扣带回）。然而，在撒谎条件下，两个区域（前扣带回和背侧前额叶皮层）活动了起来。

研究意义

这些发现之所以意义重大，主要是基于两个原因。

图6—2 讲真话和撒谎被试的fMRI扫描结果

注：上图：讲真话（红心2）被试的脑扫描；下图：撒谎被试的脑扫描（梅花5）。

资料来源：见Langleben et al., 2002。

第一，它们证实了MRI扫描可能具有医学诊断之外的重要用途（它确实如此，很快会讨论到），并且也许能成为一架“傻瓜式”测谎仪，其结果最终可能被法庭承认，正如DNA证据在证明或证伪某些犯罪方面，已经变为一个可被接受的方法。

第二，这项研究扩宽了我们对于人类大脑那不可思议的特异性的认识。如果你直视一个人的大脑，它看起来不外乎是一团又软又稠的细胞和组织。但事实上，你的大脑高度特异化，它为具体的任务备有具体的区域。你的大脑拥有为数众多的特异性脑区，它们被“分派”了从面孔识别到说话、计划和问题解决等具体工作。在这项研究中，你看见了一个致力于讲真话的脑区和另一个致力于撒谎的脑区。

近期应用

自21世纪初这篇文章发表以来，心理学在“读脑”方面有何进展？我们如今能把fMRI用作测谎仪吗？fMRI还能让我们做别的什么事？就第二个问题而言，答案似乎是“可能”。一项研究发现，fMRI测谎比传统的生理多导测试显然更加可靠。不过，反对者指出，法律允许窥视大脑可能引起严肃的伦理学问题（Simpson，2008）。

另一项值得注意的重要研究，运用了和在此讨论过的玩牌研究相同的方法，但使用了数组真实的人类面孔（Bhatt等，2008）。向被试呈现数组面孔照片，随后在fMRI的扫描下，从他们刚才所看过的面孔照片中选出一些来呈现，要求他们或如实报告此前曾见过这些照片，或撒谎。结果与扑克牌实验基本相同。两个脑区在他们撒谎时被激活，但仅一个脑区在讲真话时被激活。

fMRI在“测谎仪”之外用途的一个例子和心因性疾病有关。在神经心理医学中，fMRI已经成为强大助力，它为精神分裂症患者脑中可能导致理性思维特征性缺失的脑区进行定位（Libby & Ragland, 2011）。这类定位信息或许能帮助研究者开发新疗法，以期应对精神分裂症这一最具毁灭性的疾病。神经心理学通过运用fMRI取得的另一项重大进步在于对自闭症谱系障碍个体脑功能认识的提升（Philipa et al., 2012）。这类障碍通常被清楚地标记为社交缺陷，即不能或难以与他人恰当地建立关系。一项针对自闭症患者的fMRI研究显示，负责社会化的脑区有异常活动，这一结果提示自闭症患者可能并非对社会化无能，而是对社交回避有一种偏好。该研究还揭示了当常规任务发生变化时，大脑如何进行反应调节，这也许能解释为什么与自闭症有关障碍患者在他们所遵循的习惯被改变后，会显得心烦意乱。

2012年，一项也许是最令人惊讶的fMRI结果出现了，它来自加州大学伯克利分校的加兰特fMRI实验室（Gallant fMRI Laboratory at U.C.Berkeley, California）。在fMRI扫描室中，给被试呈现电影片段。运用新的电脑软件，研究者得以重建扫描过程中被试所观看过画面的图片，图片虽然模糊却具有极为典型的特征。如图6—3所示，对照电影截图，你会发现这项技术和真正的读心术有多么接近。

图6—3 电影截图及其fMRI扫描下的重制图

注：左上和左下：AF archive/Alamy; 右上和右下：Vadym Drobot/Shutterstock。

结论

fMRI的效用——比如帮助我们明白大脑是如何工作的：它是否与测谎、心因性脑功能失调和脑损伤相联系，或者它是否能揭示个体或群体（例如男人和女人）的大脑是如何以不同方式进行连接的——在很大程度上尚未实现。但无论如何，在诸如MRI这类无创扫描技术之前，我们直接研究大脑的方法还局限于外科手术和尸体解剖。现在，神经学家可以运用fMRI和其他无创工具，比以往更加有效地研究、诊断、治愈脑部相关疾病，甚至还可能记录你的思想。这项技术究竟会被用于善意还是“邪恶”的用途，将取决于操控者的伦理观和价值观。

研究24 认知失调

Festinger, L., & Carlsmith, J.M.(1959).Cognitive consequences of forced compliance.Journal of Abnormal and Social Psychology, 58, 203-210.

你是否有过必须说或做与自己意愿相反的事情的尴尬境遇？很有可能！每个人都会碰到这种情况。当你不得不这么做时，你真正的态度或观点会发生什么变化？还是没有什么变化？也许它的确没有发生变化。然而，研究发现，当你的行为和你的态度发生矛盾时，你的态度将有所改变，以与行为保持一致。例如，如果因实验要求而强迫一个人发表讲话，并支持一种与他原来的观点相悖的意见，那么他的真实态度也将渐渐转向他在讲话中所支持的观点。

20世纪50年代初，许多研究把这种观点的改变归结为：（a）该次演讲的心理演练复述（mentally rehearsing）；（b）从相反立场寻找论据的结果。这些早期的理论认为，在完成上述心理任务的过程中，被试让他们自己相信了他们在讲话中所持的观点和立场。为了做进一步的推论，对做出与自身所持观点相悖却令人信服的讲演的被试，研究者给予了金钱奖励。人们预测被试所得到的奖励越多，他自己的观点就越容易改变。这似乎很符合逻辑，不是吗？然而，这又一次证明常识不能很好地预测人类行为。这些研究发现，事实与人们预期的相反，即给被试的奖励越多，他们的态度改变得越少。从当时盛行的学习理论（操作性条件反射，强化理论等等）角度看，研究者很难对上述发现作出合理的解释。

不久之后，斯坦福大学的心理学家莱昂·费斯廷格（Leon Festinger）提出了颇具影响力且至今闻名于世的认知失调理论（cognitive dissonance），用该理论便可解释上述看似矛盾的研究发现。“认知”一词指的是一种心理过程，如思想、观念、知识单元、态度或信念等；“失调”的意思就是不协调（out of tune）。基于此，费斯廷格主张，同时经历两种或多种彼此间不协调的心理过程，就是认知失调。一旦出现了这种情况，它将导致不同程度的不适感和紧张感，其程度取决于该认知失调对你的重要程度。进而，这种不适感会促使你做出某种改变，以使它减弱。既然你不能改变你的行为（因为你已经这么做了，或是因为环境的压力太大），你只得改变你的态度。

费斯廷格创立这一理论的灵感来源于1934年印度发生的一场大地震。在这场地震后，可怕的谣言传遍整个印度。其内容是在此次地震灾区以外的地区将会有范围更广、震级更大的地震发生。这些谣传没有任何科学证据，但令费斯廷格不解的是，人们为什么会散布这种灾难性的、令人焦虑的谣传呢？不久，他恍然大悟：谣传不是用来增加焦虑的，而是用来为焦虑辩护的。也就是说，即便他们住在灾区外，这些人还是感到非常害怕。这就产生了认知失调，即虽然缺乏科学证据，但他们的这种害怕却无法调适。因此，他们散布这种谣传以证明他们的害怕是事出有因的，进而也就降低了他们的认知失调。他们使自己对世界的看法与自身的感受和行动相一致。

理论假设

费斯廷格的理论观点是：通常情况下，在我们的社会里，个人所公开表达的看法与其私下里的观点或信仰是相一致的。因此，如果你相信X，但你却公开主张非X，那么你将会体验到这种由认知失调引起的不适感。不过，如果你识别到自己之所以公开主张非X是由于某种不得已的原因，如压力、奖励或者惩罚，那么你的认知失调将大大降低或者消失。因此，关键在于你越将不一致的行为归因于自己的选择，你的认知失调就会越严重。

对你而言，降低这种令人不快的认知失调的方法之一是改变自己原有的观点，使之与自己的行为（即某种新主张）相一致。费斯廷格认为，当个体的认知失调很严重时，其态度和观点的改变幅度将是最大的。设想一下，假如某人给你一大笔钱，让你公开支持某种你原本反对的观点，而且你也同意这么做。再假设另外一个人向你提出同样的请求，但只给你一小笔钱，虽然这看起来完全不值得一做，但不管怎样，你还是答应了。那么，在哪种情况下，你的认知失调会更大呢？从逻辑上讲，在钱较少的情况下，你将经历更大的认知失调，这是因为你没有充足的理由为你那违背自己意愿的言行辩护。因此，根据费斯廷格的理论，在钱较少的情况下，你真正的观点将会有更大的改变。现在，让我们来看看费斯廷格和他的助手詹姆斯·卡尔史密斯（James Carlsmith）是如何设计实验来验证自己的认知失调理论的。

方法

假设你是一名大学生，正在学习一门心理学导论课。该课程的要求之一是你必须在这一学期中以被试身份参加三个小时的心理学实验。你查看了布告栏，那里贴着许多心理学教授和研究生正在进行的心理学研究，随后你在一个耗时两个小时的一项行为测量（measures of performance）的研究上签了名。这一研究由费斯廷格和卡尔史密斯主持，如许多心理学实验一样，该研究的真正目的对被试保密，因为如果被试知道了研究的真正目的，其反应将会出现偏差，进而使研究结果失效。实际的被试由71名正在学习心理学的低年级男生组成。

你在规定的时间来到实验室（这里的实验室就是一间有些椅子的空房间）。工作人员告诉你这个实验需要花费一个多小时的时间，因此必须做两个小时的打算。既然还有一些剩余时间，实验者会告诉你，一些心理系的人正在就作为被试的感受这一话题，访谈曾做过被试的大学生，而且让你参加完这项实验后也去接受访谈。随后实验者便给你布置了第一项任务。

你的面前放着一个装有12个线轴的托盘，主试要求你从托盘里拿出线轴放在桌上，然后再将线轴放回原处，并且如此循环往复。你要用一只手以你自己的速度完成任务。与此同时，实验者拿着秒表在旁观看并做记录。就这样，你必须反反复复做30分钟。然后，主试拿走托盘，又给了你一块钉有48个方栓的板，你的任务是按顺时针方向将每个方栓旋转90度，循环往复再做30分钟！如果你觉得这种活动太过枯燥，那这正是该研究所欲达到的效果。按费斯廷格和卡史密斯的话说：“该实验阶段的目的就是要使所有被试产生一种一致的消极体验。”（P.205）毫无疑问，你会承认这一目的已经达到了。完成了这些任务后，真正的实验才刚刚开始。

主试将被试随机分配到三种实验条件下。在控制条件下的被试完成上述任务后即被带进另一个房间，就自己对刚刚完成的实验任务的反应接受访谈。其余的被试接着进行下一步实验程序。完成了上述任务后，实验者与实验组的被试进行谈话，好像是要向他们解释该研究的目的。实验者对每位被试都说，他是A组的被试，他们这组在实验前没有得到与实验有关的任何信息。还有一个B组，对B组的被试，实验者会在实验前向他们传达这样的信息——这些实验任务是非常有趣的，而这一信息是由另一名大学生来传递的，他伪装成已完成了实验任务的被试。请记住，上述一切都是刻意布置的，为的是确保随后实验的关键部分真实可信。换句话说，这些解释仅仅是一种托辞。

然后实验者离开房间几分钟。而当他返回时，表情略显迟疑和困惑，并继续对被试说，那名向B组被试传递信息的大学生打电话来说他病了，但现在还有一名B组被试在外面等待，而他们这会儿又很难再找一个人填补这一空缺。然后，实验者很有礼貌地问被试是否愿意顶替这名大学生去向正在等候的B组被试传递信息。

实验者会给那些愿意提供这一帮助的一些被试，每人1美元作为酬谢，而给另一些愿意提供帮助的被试，每人20美元。被试同意参加下一步实验后，实验者便交给他一张纸，上面标有“B组”几个字，并写着这样一段话：“这项实验任务非常有趣，我从中获得了快乐，我很高兴，这是激动人心的，令人兴奋的。”然后实验者付给被试1美元或20美元，并将他带入一间房间和新来的“被试”在一起单独呆上两分钟。两分钟后，实验者回到这间房间，对被试说了些表示感谢的话，然后把被试带入访谈室，让他们谈谈对实验任务的真正看法。这一访谈与先前对控制组进行的访谈完全一样。

整个实验程序是否略显复杂？其实一点也不。说得简洁明了一些就是，共有三组被试，每组各有20人：一组被试因其就实验任务向后来的“被试”撒谎而得到1美元，另一组被试因此而得到20美元；控制组被试没有撒谎。

结果

研究结果以每名被试在最后访谈阶段所表达的对实验任务的真实感受作为测量指标。要求他们对该实验做如下评定：

1.这些实验任务是有趣且令人愉快的吗？以11点量表的形式进行评定：–5代表非常枯燥以及使人厌烦；+5代表非常有趣且令人愉快；0代表这些任务是中性的，即不枯燥也不有趣。

2.你对自己完成这些实验任务的能力了解了多少？以11点量表的形式进行评定：0代表毫无收获；10代表收获非常大。

3.你相信该实验及你所完成的实验任务是在测量某些重要的东西吗？以11点量表的形式进行评定：0代表没有什么科学价值；10代表科学价值非常大。

4.你是否还愿意参加另外一项与之类似的实验？以11点量表的形式进行评定：–5代表肯定不想参加；+5代表非常想参加；0代表中立的看法。

表6—6中列出了所有被试对每个问题所作回答的平均值。问题1和问题4是用以说明费斯廷格的认知失调理论的，其结果表明组间差异非常显著。相对于那些得到20美元及没有撒谎的被试而言，得到1美元的被试更喜欢这些实验任务；这与此前该领域的一些研究结论相反，而且也和我们大多数人用常识对结果所进行的预料相反。这一研究发现既反映在对第一题（直接问题）的回答上，也反映在获得1美元的被试身上，他们表示更愿意参加另一项类似的实验上（即对问题4的回答）。

表6—6 每种实验条件下的被试对访谈问题回答的平均评定值

*与费斯廷格和卡史密斯的研究假设有关的问题（引自P.207）

讨论

用费斯廷格的话说，认知失调理论主张如下。

1.如果一个人被别人劝说做了某种和他原来的观点相反的事或说了某些与他的真实观点的话，他将会产生一种改变原有观点的倾向以使之与刚刚做过的事或说过的话相一致。

2.引起撒谎行为的压力越大，则改变原有观点的倾向将越弱（P.209—210）。

费斯廷格和卡尔史密斯的研究发现显然支持了这一理论。费斯廷格对此的解释是：当人们从事某种与态度不符的行为（撒谎）时，如果他们有这样做的充分理由（20美元），他们将体验到较少的认知失调，因此他们改变观点的动机并不强烈。相反，如果他们的理由并不充分（1美元），他们的认知失调将比较严重。因此，为了减少认知失调所引起的不适感，他们对原有的观点将作出较大的调整。

该理论可以用图解的形式表述如下：

与态度不符的行为→解释该行为的理由充足→轻微认知失调→态度改变较小

与态度不符的行为→解释该行为的理由不充足→严重认知失调→态度改变较大

质疑与批评

费斯廷格预料到，许多早期理论会受到这一新观点的威胁，它们的支持者会试图批评这一新的研究结论，并提出他们自己对这一研究结果的解释（诸如我们在本章开头所提到的心理演练及寻找论据等）。为了反击这些批评意见，该研究对实验组被试撒谎的实验片段进行了录音，并且由两个并不知情的评定者各自单独进行评定。统计结果显示，两组被试（1美元组和20美元组）在撒谎的内容或说服力方面不存在显著差异。因此，唯一剩下的对该研究结果的明确解释，便是费斯廷格的认知失调。

自从费斯廷格和卡尔史密斯提出认知失调理论以来，许多其他研究者对该理论进行了修正，但并不否定该理论。库珀和法齐奥对各种修改意见进行了总结（Cooper & Fazio，1984），他们还提出了由认知失调所引起的态度改变必须经过4个必要的步骤。

第一步，这种与态度不符的行为必须导致你不乐于接受的消极结果。在费斯廷格和卡尔史密斯的实验中，被试不得不向“新来的被试”撒谎，以说服他们参加一个令人厌烦的实验，这就导致了所需的消极结果。这也就是为什么当你恭维某人的穿着，而实际上你根本无法忍受他的穿着时，你对他的穿着的态度没有改变的原因。

第二步，个人必须对消极结果承担责任。这通常涉及是否有选择权的问题。如果与态度不符的行为是你自己的选择，且导致了消极结果，那么你将体验到认知失调。但如果有人强迫你这样做，你将不会感到自己对此有责任，因而也就不会产生认知失调。尽管费斯廷格和卡尔史密斯在论文的标题中使用了“强迫服从”（forced compliance）一词，但实际上被试仍相信其行为是自愿的。

第三步，研究表明，生理唤起（physiological arousal）也是认知失调过程中必不可少的组成部分。费斯廷格认为，失调是一种促使我们改变态度的令人不适的紧张状态。的确，有研究已经证明，当被试通过与态度不符的方式自主行事时，他们体验到了生理上的唤起。尽管费斯廷格和卡尔史密斯没有测量被试的生理唤起，但可以肯定地说，生理唤醒是存在的。

第四步，个体必须意识到自己所体验到的唤醒是由自己所做的与态度不符的行为引起的。在费斯廷格和卡尔史密斯的研究中，被试可以轻易体验到的不适感可以明确地归结为他们向新来的被试撒谎所引起的。

费斯廷格和卡尔史密斯的认知失调理论已经成为被人广泛接受且经得起检验的心理学研究成果。大多数心理学家都认为，有两个基本过程足可以使我们改变自己原有的观点和态度：其一是劝说，即其他人不遗余力地说服你改变自己的观点；其二就是认知失调。

近期应用

费斯汀格和卡尔史密斯的研究理论和结果不断得到社会科学研究领域的支持和肯定。一项有趣的研究发现，仅仅是由于观察到你喜欢或是尊敬的人做出与你的态度不一致的行为，你就会体验到认知失调，并改变你自己的态度，完全不需要亲身参与（Norton et al., 2003）。作者把这个过程称为替代性失调（vicarious dissonance）。在这项研究中，大学生在一个有争议的问题上听到一些与他们态度相反的演讲（关于增加大学学费的问题）。其中一些大学生，听到的关于支持增加大学学费的言论是来自于他们自己学校（“内群体”），另外一些人听到的言论是来自于其他大学中的学生（“外群体”）。当内群体成员提出此言论时，被试感到认知失调，而在增加学费的问题上的相反态度有所减弱。另一个研究结果更有力地显示出替代性失调，研究者发现被试根本不必亲耳听到某些言论，只简单地了解到内群体成员同意发表支持学费增加的演讲，就会产生失调，进而引起态度改变。

颇具吸引力的另一项研究在另一个完全不同的领域使用了认知失调理论，它解释了为什么吸烟者在明知吸烟有害健康（几乎每个人都知道）的情况下仍不能戒烟的原因（Peretti-Watel等人，2007）。如果你吸烟，并且知道吸烟的危害，但却感觉无法戒掉，那你一定有过认知失调的经历。因为这不是一个令人愉快的状态，因此，你会制定一个减轻你不适感的策略。在2007年的研究中，研究人员发现吸烟者经常沿着这样的思路来表达一种“自我豁免”的信念，比如“吸烟有害健康，但我除外，因为我不经常吸烟”或者“我吸烟是为了保护自己远离疾病”。研究人员建议：“未来的控烟信息上，应该有专门针对那些降低吸烟者的认知失调和抑制他们戒烟意愿的自我免疫信念的干预措施。”（P.307）。

加州大学圣克鲁兹分校的心理学家艾略特·阿伦森（Elliot Aronson）完成了一项以费斯廷格的认知失调理论为基础的重要研究，该研究的目的是改变学生的危险性行为（Shea，1997）。研究者要求热衷于性行为的学生就“使用避孕套能减少感染艾滋病的概率”为主题，做一段宣传录像。做完录像后，其中一半的学生被分为多个小组，研究者鼓励他们就“为什么大学生不必使用避孕套”的问题展开讨论，并透露他们自己不使用避孕套的经历。换言之，这些被试不得不承认他们并不总是坚持刚刚自己在录像中所宣扬的立场。这样，他们便不得不面对自己的言行不一。参与录像制作的另一半学生没有参与后面的讨论。当研究者给所有学生一个购买避孕套的机会时，与未参与讨论的学生相比，自相矛盾组的学生购买避孕套的人数更多。更重要的是，3个月后，当被试就他们的性生活接受访谈时，92%的自相矛盾组的学生声称他们在性交时一直使用避孕套；而在未参与讨论组，只有55%的学生声称自己一直使用避孕套。这是一个认知失调起作用的典型例子。

结论

当你不得不面对自己的言行不一的情况时，通常都会体验到认知失调，这将促使你改变自己的行为或观念来使自己的言行保持协调一致。阿伦森坚信：认知失调在改变现实行为方面具有重要作用。他解释说：“我们大多数人经常会有言行不一的时候，这是因为我们会对这样的行为熟视无睹。但是如果有人站出来，而且迫使你正视它，你可能就不会再对其置之不理了。”

第七章人格

当你问自己“我是谁”的时候，你恰好问了一个人格心理学家提出的基本问题。人格心理学家们力图揭示那些使每个人独一无二的人格特征，并确定这些人格特征的起源。当行为科学家谈到人格的时候，他们通常指的是那些相对稳定的、具有跨情境和跨时间一致性的品质。也就是说，你是一个什么样的人，不会每天、每周发生改变，而且常常是每年甚至数十年都不会改变。相反，你的某些基本的人格特征是恒定且可预测的。在心理学历史上，心理学家已经提出几百种人格理论。其中绝大多数理论模型都引发了很多讨论和争论，人们并不清楚这些模型是否真正测量了个体之间的重要差异。当然，经反复验证，有一些因素能够可靠地预测某些特定行为。这些因素就是本章所要讨论的重点。

第一篇文章讨论的是朱立安·罗特（Julian Rotter）的著名研究，它主要关注的是人们对生活中控制点的看法。一些人相信他们的生活是被外部因素所左右的，比如命运或运气，而另一些人则认为他们的生活是被内部因素所操控的，即他们是自己生活的主宰。一个人关于外部或内部控制的信念品质已被证明是反映个人人格特征的一种具有一致性和重要性的因素。接下来的文章是关于桑德拉·贝姆（Sandra Bem）在20世纪70年代的研究，该研究颠覆了我们对于性别这一人格同一性的基本成分的看法。第三篇文章所介绍的研究影响广泛：该研究率先确定了所谓的“A型”与“B型”人格，以及这两种类型的人有什么根本差别。有很多原因能说明这些差别的重要性，其中一个原因就是“A型”个体可能更容易患冠心病。你还会读到一篇在心理学各领域颇具影响力的研究。该研究提醒我们必须把人类行为放在某种文化背景下加以考虑。这篇研究探讨了哈里·川迪斯（Harry Triandis）的工作，他在过去三十年间，经仔细探索构建了令人信服的理论，即认为我们可以将大多数人类社会划分为集体主义文化和个人主义文化两种。这种看似单一（尽管肯定不简单）的维度可以在很大程度上解释了文化背景对于个体的人格特质所造成的深远影响。

研究25 你能主宰自己的命运吗

Rotter, J.B.(1966).Generalized expectancies for internal versus external control of reinforcement.Psychological Monographs, 80，1-28.

你的行为后果是由你本人控制，还是由外在力量所左右？请你思考一下下面这些问题：当某种好事发生在你身上时，你认为这是实至名归的呢还是运气所致？而当某种不好的事情发生时，你会觉得这是由于自己的行为所导致的呢还是把它归结于命运？这一问题可以用更正式的心理学术语表述如下：你相信在你的行为选择及其后果之间存在某种因果关系吗？

作为心理学历史上最有影响力的行为主义者之一，朱利安·罗特认为个体在某些事件原因的归因方面存在很大的差异。当人们把自己的行为后果归结为运气、命运或是他人力量的影响时，表明他们持有罗特所说的外控点（external locus of control）的信念；与之相反，如果人们把行为后果归因于自己的选择和人格，则他们就具有一种内控点（internal locus of control）的信念。在他这篇于1966年完成并被频繁引用的论文中，罗特解释说：“一个人看待事件的内外倾向是决定我们是怎样的人的基本因素，而且这可以用社会学习理论加以解释。”

在社会学习理论看来，一个人在从婴儿成长为儿童的这段时间内，会受到某种形式的奖赏或强化而习得一些特定情境中的行为。这种强化增加了儿童的预期，认为某种特定行为将产生某些他们想要的奖赏。这种预期形成之后，取消强化将导致预期渐渐消退。因此，有时人们认为强化与行为是相关联的，有时却不是这样（参见研究11中斯金纳对关联性问题的讨论）。随着儿童的成长，一些儿童经常感受到其行为与强化的直接联系，而对其他儿童而言，结果似乎并非由其自身的行为所导致。罗特称，个体所有的具体学习经历使其对强化是内控还是外控而形成了一种总体预期。

罗特写道：“随着在文化上将情境类分为社会决定型情境和技能决定型情境，这些总体预期将导致行为的特征差异，并进而在特定条件下，演变为个体差异。”（P.2）换言之，你已经习惯于对自己的行为后果做内控或外控的解释，这将影响到将来你在几乎所有情境中的行为。罗特坚信，不论是外控还是内控，你对控制点的解释始终是你个性特征的重要组成部分，也是你人格的一部分。

现在，让我们回过头来再看本文开头所提出的问题。你认为自己是内控的还是外控的？罗特试图研究人们在这一维度上的差异，当然他不只是简单地对被试进行询问，而是编制了一套用以测量个体的控制点的测验。一旦测量出人们的这种特征，就能进而研究该人格特征对个体行为的影响了。

理论假设

罗特打算在他的研究中证明两个要点：首先，他预言可以研发一个测验，可靠地测量出个体在生活中归因的内控或外控倾向的程度；其次，他假设人们在同一情境中对强化原因的解释将呈现出稳定的个体差异。罗特计划通过比较“内控者”和“外控者”在各种情境中的行为来验证他的假设。

方法

罗特设计了一个包括一系列成对陈述句的量表。每对句子中包括一句反映内控点的陈述句和一句反映外控点的陈述句。给被试的指导语是：“从每一对陈述句中挑选出一个句子，它所描述的情况必须是你认为自己在身临其境时更有可能发生的情况，即你一定要选择那个对你来说更真实的陈述句，而不要选择你认为应当选择或希望它成为事实的陈述句。”这是一种对个人信念的测量，回答显然没有对或错之分（P.26）。该测验采用迫选的回答方式，即迫使被试在每对陈述句中选择其中一句，既不能不选，也不能两个都选。

罗特的这一测量工具几经修订和改进。早期的量表包括60对陈述句，但经过各种信度和效度的检验后，量表的条目被精简到23项。为了掩盖该测验的真正目的，后又加入了6个补充项目。因为如果被试能够猜到测验想要测量的内容，他们可能在某种程度上改变自己的回答以求“表现得更好”，所以在心理学测验中常常用到类似的补充项目。

罗特称他的测验为I-E量表（“I”指的是Internal，内控；“E”指的是External，外控），这也是如今该测验广为人知的名称。表7—1列出了一些取自I-E量表的样题，以及补充项目的样题。如果你仔细看一下这些项目，就会相当清楚哪些陈述句反映内控倾向，哪些陈述句反映外控倾向。罗特声称他的测验所测量的是一个人的人格特征中内控或外控的程度。

罗特接下来要做的，也是最为重要的一步就是证明他可以用内—外控人格特征准确预测人们在特定情境中的行为。为此，罗特报告了几项研究（由他本人和其他人共同完成）来考查被试在I-E量表的得分与他们在各种生活事件中的个体行为之间的关系。这些研究表明，I-E得分与人们在很多不同情境中的行为都存在显著相关，例如赌博、政治活动、劝说、吸烟、成就动机以及从众倾向等。

表7—1 罗特I-E量表的样题和填充项目

结果

下面我们对罗特在该领域研究中的早期发现做一简要总结（完整讨论以及参考文献参见原文第19-24页的）。

赌博

罗特研究了赌博行为与控制点的关系。研究发现，经I-E量表测得的内控型个体倾向于对“有把握的事情”下赌注，且相对于小概率事件而言，他们更喜欢中等概率；相反，外控型个体更愿意在风险较大的赌博中下更多的注。此外，外控型个体在下注时更倾向于采用被人们称为“赌徒谬论”的异常方式（例如，即使实际发生的概率不变，但还是认为某个很久没有出现的数字“应该”会出现，从而在这个数字上下更多的赌注）。

劝说

罗特引用了一项有趣的研究，该研究用I-E量表选取了两组学生，一组为高度内控者，另一组为高度外控者。两组被试对校园里的男生联谊会和女生联谊会大体上持相似的态度。主试要求两组被试劝说其他的学生改变对上述组织的看法。结果发现，内控组被试比外控组被试做得更为成功。相反地，另外一些研究发现内控型被试更不愿在态度方面受他人的影响。

吸烟

内控倾向似乎与自律存在相关。罗特提及的两项研究均发现：（a）吸烟者比不吸烟者更倾向于外控；（b）那些在1966年烟盒上出现有关吸烟危害健康的警示之后，成功戒烟的个体更多地倾向于内控，尽管不论是内控型个体，还是外控型个体，他们都相信这种警示是正确的。

成就动机

如果你相信自己的行动决定着自己的成就，那么从逻辑上讲，你应该比那些认为成功更多取决于命运的人有更强的成就动机。罗特对1000名高中生所做的研究表明，I-E量表中的内控得分与成就动机存在正相关。这些成就动机的指标包括上大学的计划、用于做家庭作业的时间、父母对子女的在校表现的感兴趣程度，等等。这些与成就动机有关的因素更可能从具有内控倾向的学生身上发现。

从众

罗特引用所罗门·阿希（Solomon Asch）所做的从众实验来证明自己的观点。在该实验中，主试让被试处于一个大多数人都认可同一个不正确答案的情况下，以判断被试的从众行为（参见研究38中阿希的从众实验）。主试允许被试对他们判断的正确性下赌注（钱由实验者提供）。在这样的条件下，与外控倾向的被试相比，那些具有内控倾向的被试更少服从大多数人的意见，而且当他们的判断与大多数人相反时，他们下的赌注更多。

讨论

罗特在论文的讨论部分提出了人们在内外控维度上存在个体差异的可能原因。他引用了多项研究指出，内、外控倾向的形成可能有三种潜在来源：文化差异、社会经济水平的差异以及父母养育方式的差异。

有一项研究发现，在不同的文化间，个体的控制点倾向存在一些差异。在美国的一个相对封闭的社区中，主试比较了三个不同的群体，即印第安人后裔、墨西哥裔美国人和白种人。结果发现，一般而言，那些具有印第安血统的个体最具外控倾向，而白种人最具内控倾向，墨西哥裔美国人在I-E量表上的得分介于二者之间。以上结果与被试的社会经济水平无关，表明在控制点方面具有种族差异。

罗特还引用了一些早期实验的研究结果，这些结果表明，即便在某一特定的文化中，控制点的倾向也与个体的社会经济水平有关。社会经济水平较低的个体具有更大程度的外控倾向。

父母的养育方式被罗特视为是个体习得内、外控倾向的一个显而易见的原因。虽然他当时并没有拿出用以支持该论断的研究证据，但他认为父母在教养孩子时所采取的奖励和惩罚的方式若常与孩子的表现不一致，或是让人难以捉摸，那么这将会导致孩子形成外控的倾向（稍后我们将对此问题进行更详细的讨论）。

罗特总结了他的研究结果后指出，研究结果的一致性可以让我们得出如下结论：控制点是一种在各种情境中一贯发挥作用的可界定的个体特征。而且，个体的内外控维度对行为的影响是使不同的人在面对同一情境时采取不同的行动。此外，罗特声称控制点可以进行测量，而且I-E量表正是测量这一指标的有效工具。

罗特作出了如下假设，那些具有内控倾向的个体（如那些坚信自己能掌握自己命运的人）较那些具有外控倾向的个体更可能会：（a）为了改进自己将来在一些类似情境中的行为而尽力从该情境中获取更多信息；（b）更主动地改变和改善他们的生活状况；（c）更加看重成就和内在技能；（d）更能抵御他人的影响。

后续研究

自罗特编制了I-E量表以来，已有数百项研究检验了控制点与各种行为之间的关系。以下便是我们对这些涉及林林总总的人类行为的研究所作的简要介绍。

在1966年的论文中，罗特谈到了控制点与人体健康的关系。从那时起，许多其他的研究也做了相同的检验。在一篇对控制点研究的综述论文中，斯特里克兰（Strickland，1978）发现，内控型个体一般对自己的健康更加负责，且更可能采取健康的行为方式（如不吸烟以及养成更合理的营养搭配习惯等），而且在实际生活中更关心如何避免意外事故。顺便提及的是，研究已经发现内控型个体一般应激水平较低，而且很少患有与压力相关的疾病。

罗特关于教养方式与控制点存在相关的假设已经得到了部分验证。有研究表明，那些具有内控倾向的孩子的父母更有爱心，对孩子采取前后一致的、更加公正的奖惩约束，且更加注意教导孩子对自己的行为负责。具有外控倾向的孩子的父母，则更加专制和严厉，且不给孩子更多的自律空间（对这些发现的讨论参见Davis & Phares，1969）。

一项颇具吸引力的研究证明，控制点的概念有可能预示着社会性问题或灾难性问题。西姆斯和鲍曼（Sims & Baumann，1972）运用罗特的理论解释了为什么在亚拉巴马州死于龙卷风的人数会大大多于伊利诺伊州。这些研究者注意到：美国南部由龙卷风造成的死亡人数是中西部的5倍，进而他们着手追根溯源。他们一一排除了与物理因素有关的解释，如龙卷风的强度及严重程度（事实上，发生在伊利诺伊州的龙卷风更为严重），龙卷风发生的时段（在这两个地区夜间发生的龙卷风次数相等）、商用和民用房屋的建筑类型（这两个地区都采用了相似的建筑技术）以及安全警报系统的质量（即使是在两个地区都没有安装警报系统之前，亚拉巴马州的死亡率也更高）。

排除了所有明显的环境因素之后，西姆斯和鲍曼认为差别可能源于心理变量，并提出把控制点概念列为一种可能的影响因素。他们采用I-E量表的修订版测试了伊利诺伊州和亚拉巴马州四个县的居民，这四个县经历过类似由龙卷风引起的死亡事件。他们发现，亚拉巴马州人的回答比伊利诺伊州人的回答具有更加明显的外控倾向。循着这一发现，并结合当地居民面临龙卷风时的行为及对他们对问卷中有关项目回答的分析，研究者得出了如下结论：内控倾向使个体在面临龙卷风时能存活下来（如内控者关注新闻广播或者会提醒其他人注意危险）。这是由于他们坚信自己的行为在改变事件的后果上能发挥作用。在该研究中，亚拉巴马人被视为“更缺乏自信，更缺乏采取有效行动的信心。……这些资料……为我们提供了颇具启发性的证据，那就是人格特征在决定人与自然相互作用的质量中发挥着多么积极的作用”（Sims & Baumann，1972年，P.1391）。

近期应用

自从该篇论文在1966年发表以来，如果说已有几百项研究借鉴了罗特的“控制点”理论，那么这一数字也可能大大低估了实际情况。事实上，可能有几千项这样的研究！罗特的理论受到了广泛的信赖，这就清楚地表明了人们对内、外控人格维度的影响及效度的广泛认可。下面是曾引用过罗特开创性工作的大量新近研究中的一部分代表。

通常，当我们讨论罗特对控制点的研究时，一个随之而来的话题便是被试的宗教信仰问题。很多有宗教信仰的人相信，有时将自己的命运交给上帝，不仅符合他们的心愿，而且是合适之举。然而，根据罗特的理论，此举将预示着一种具有消极意义的外控倾向。不久前，有人在《心理学与宗教》（Journal of Psychology and Religion）杂志上发表了一篇引人入胜的文章阐述这一论题（Welton，et al.，1996）。研究者使用多种控制点量表和分量表分别评估了被试的内控点水平、知觉到的受有影响力的其他人控制的水平、受运气和上帝控制的信念等。结果发现，在“受上帝控制”维度上得分较高的个体身上也发现了与内控型有关的一些优点。作者认为，如果一个人经罗特量表测量具有外控倾向，但这种外部力量被认为是一种对至高无上的神灵（如上帝）的强烈信仰，那么他也就不太可能陷入由外控倾向带来的一些典型问题（如无助感、抑郁、低水平的成就动机、缺少谋求改变现状的动机等）。

控制点的概念与个体对自己是否有选择权的感知有很大关联。事实上，“有选择”会增加人们（尤其是内控型个体）的控制感。有一项研究综合了多种手段，包括动物研究、人类临床研究、神经成像（例如fMRI研究，见研究23）。该项研究的结果表明，人类对控制感的渴望不是后天习得的，而是一种进化得来的生存机制，是通过基因传递下来的（Leotti et al.，2010）。作者指出，如果没有“能做选择”（可产生最好结果的选择）的信念，我们将不会有任何动力去面对生活中的挑战，包括有助于使我们保持健康和远离危险的选择。这也就是为什么当你自由选择的权利（控制事情的能力）被剥夺时，常会产生一些病理性的结果，从明显的绝望到极端的生气和攻击。

另一方面，大量重要的跨文化研究在很大程度上基于罗特关于控制点这一人格维度的概念。例如，一项俄罗斯的研究考察了俄罗斯和美国大学生的控制点倾向以及他们对右翼独裁主义的态度（D’yakonova & Yurtaikin，2000）。结果显示，在美国学生中，较高水平的内控倾向与独裁主义有正相关，但在俄罗斯大学生中却并不存在这种关系。另一项借助罗特的I-E量表所进行的跨文化研究测查了在高度迷信的集体主义文化中癌症病人的心理调适状况（Sun & Stewar，2000）。有趣的是，该研究的结果表明，“即便是在一种具有超自然信仰的文化中，病人的内控倾向于与其进行的调适也有正相关，而外控倾向则与调适有负相关”（P.177）。引证罗特研究的领域除了上面已讨论过的这些之外，还包括创伤后应激障碍、控制与衰老问题、分娩方法、预期应激的应对方式、环境中噪音的影响、学术成就、白领犯罪、成年和儿童的酗酒问题、对儿童的性骚扰、自然灾害后的心理健康、避孕药的使用、人类免疫缺陷病毒（HIV）以及艾滋病的预防研究，等等。

结论

内、外控制点维度已作为人格的一个相对稳定的组成部分被人们广泛接受，它对预测众多情境中的行为起到了有价值的启示作用。之所以称之为“相对稳定”，是因为一个人的控制点在特定的环境中可以改变。那些具有外控倾向的人，由于在工作中被赋予了更大的权力和责任而常常向内控转变。而那些具有内控倾向的人在面对巨大压力和不确定性时，也可能会转向外控。而且，如果有机会，个体能够通过学习来提高内控水平。

隐含在罗特的控制点概念中的一个假设是，内控水平高的人们可以更好地自我调控并适应生活。尽管大多数研究都证明了这一假设，但罗特在其后期的著作中告诫我们说（参见罗特，1975），每个人特别是内控水平高的人，必须更加关注周围的环境。如果一个人打算改变一种不可能改变的情境的话，那么挫折、沮丧和抑郁很可能随之而来。当存在于个体以外的力量确实控制着行为的后果时，最现实也是最健康的行为方式是采取外控制点的态度。

研究26 男性化、女性化……还是双性化

Bem, S.L.(1974).The measurement of psychological androgyny.Journal of Consulting and Clinical Psychology, 42，155-162.

你的性别是男是女？你是男人还是女人？你是男性化的还是女性化的？这是三个看似差不多的问题，答案却可能让你大吃一惊。对于第一个问题，答案一般是很明确的，因为这是基于染色体、荷尔蒙、生殖结构等做出的生物学回答。大多数人在回答第二个问题时也鲜有犹豫。实际上，你们从差不多四岁开始就都非常肯定自己的性别了。很可能你根本不用停下来花任何时间思考就知道自己是男人还是女人。

然而，第三个问题好像就没那么容易回答了。不同个体所拥有的“雄性”和“雌性”，或者说男性化和女性化特征的程度是不同的。想一下你认识的人，你可能会把他们中的某些人划到极度男性化一边（这些人应该都是男人），而某些人会属于极度女性化一边（这些人应该都是女人），但还有一些人的性别特征好像处于二者之间，他们既有男性化特征，又有女性化特征（这些人有男有女）。这些“分类”不带有任何的评判性，而仅仅是为了说明人类一个重要特征的差异性。这种男性化—女性化维度构成了心理学家通常提到的“性别”，而你对自己男性化程度和女性化程度的看法就是你的“性别认同”（gender identity）。性别认同是人格最重要的构成要素之一，它包括你自己以及他人关于“你是谁”的感知。

20世纪70年代以前，行为主义科学家（以及大多数非科学家）都持有一种两极化的性别观点：即人们的性别认同要么是彻底的男性化，要么是彻底的女性化，它们被看作是单一性别维度的两极。如果你基于这种观点进行性别认同测试的话，你的测验结果将处在单一维度上的某个位置，要么更接近男性化，要么更接近女性化。此外，当时的研究者和临床医师认为在一定程度上，心理调适与个人同其基于生物学性别的性别类型的契合度有关。换句话说，当时的观点是，为了达到心理健康的最佳状态，男人就应该尽可能男性化，女人就应该尽可能女性化。

然而，20世纪70年代早期，这种单维性别观点受到了挑战。安妮（Anne Constantinople，1973）在其发表的文章中指出：男性化和女性化并不是同一个维度的两极，相反地，它们应该成为衡量人类性别的两个独立的维度。也就是说，一个人拥有某种程度男性化特征的同时，也可能拥有某种程度的女性化特征。图7—1阐明了单维和二维性别观念的对比。

图7—1 传统单维性别模式与新近二维性别模式的对比

这一观点在你看来可能没什么值得大惊小怪，但在它最初提出的时候却可谓是一场革命。支持这种二维性别模式的代表人物是斯坦福大学的桑德拉·贝姆（Sandra Bem）。她向当时盛行的性别观念发起了挑战，当时人们认为健康的性别认同应该表现为一个人的行为符合其生物学性别的社会期望。而贝姆提出，一个更协调的人可以有效融合男性化和女性化两种行为，实际上比那些性别类型极度男性化或极度女性化的人更快乐、适应性更好。贝姆进一步发展了这项研究并开始研发一种基于二维性别模式的测量方法。在作为本文基础的这篇论文中，贝姆创造了“双性化”（androgynous）一词（“andro”意为男性，“gyn”意为女性），用来描述那些同时具有男性化和女性化特征的人，他们可以根据特定情境表现出最适宜的行为特征。此外，贝姆不仅认为某些人具有双性化的特征，而且当一个人从一种生活环境转移到另一种生活环境时，双性化的人格特征可以为更好的行为适应性提供有利条件。贝姆这样解释：

性别类型分明的人总想使自己的行为与已经内化的性别角色标准保持一致，并可能压抑任何与其性别不相符的行为来达成自己的目标。因此，一个自我概念中性别认同为男性化的人可能会抑制某些女性化行为，一个自我概念中性别认同为女性化的人也可能会抑制某些男性化的行为。而一个混合型的，或者说是双性化的人，就可以自由地做出男性化或女性化的行为了。（P.155）

举个例子，你可能认识一位优雅、敏感、轻声细语的女士（传统女性化特征），但她同时也是个野心勃勃、独立自主、身强体健的人（传统男性化特征）。另一种情况，你的一位男性朋友可能好胜、统治欲强、敢于冒险（男性化特征），但他有时也会表现出一些典型的女性化特征，如富有情感、有同情心、充满喜悦等。贝姆将这些人描述为“双性化”。本文解释了贝姆开发测量性别特征量表，即贝姆性别角色量表（BSRI）的理论基础和设计过程。

理论假设

每当科学家提出一种挑战传统观点的新理论时，他们也就必须承担起证明这种革命性观点正确性的责任。如果贝姆想要研究双性化的人与那些具有极端男性化或女性化特征的人之间的差异，她就需要找到一种方法证明双性化特征的存在。换句话说，她必须测量出它。

贝姆认为要测量双性化特征，就需要有一种新的测量标准，它应该从根本上区别于先前所用的男性化—女性化量表。出于对这个目标的考虑，她所设计的量表有以下几方面的创新。

1.贝姆首先考虑的是所设计的性别量表应该抛开认为男性化和女性化是同一维度的两极的那种单维性别模式。她将两个独立的维度引入她的测验，分别用于测量男性化和女性化（见表7—2）。

2.她所设计量表的基础是男人和女人各自知觉到的社会期许的男性化和女性化特征。而先前那种测量方法是以在男人和女人身上可以普遍观察到的行为为基础，并非以美国社会期许作为判断标准。

如果一种特征对于男人来说更值得期许，就定义其为男性化特征；而一种性格对于女人来说更值得期许，那么就定义其为女性化特征。（P.155-156）

3.BSRI是为区分男性化、女性化和双性化而设计的。它主要是通过计算被试男性化和女性化得分之差来进行区分的。也就是用被试女性化得分减去其男性化得分，所得的差数就可以用来判断其男性化、女性化或双性化的程度了。

贝姆设计的测量标准是由一系列人格特征或特质组成的。为了得到一个性别分数，每种人格特征都在7点量表上进行评定，1到7点分别代表回答者所觉知到自身某种特质的程度。让我们看看这一量表是如何设计的。

方法测试项目的选择

记住，贝姆要使用的是符合社会期许的性别特征。为了完成她的最终量表，她罗列出一长串她和她的心理学专业学生都认为有价值的特征。这些特征有代表男性化的，有代表女性化的，也有中性化的。三种特征列表均包括200个项目。她从斯坦福大学请了100名大学生（男、女生各一半），要求对于判断这些特征是否符合美国社会对于一个男人或者女人的期许，并在从1（完全不符合）至7（非常符合）的7点量表上进行评定。

按照学生们给出的分数，贝姆分别选取了两性评分最高的前20项性格特征作为男性化量表和女性化量表的测试项。同时，她也选择了20项可以忽略性别而每个人都期待拥有的性格（这些并不是双性化的测试项，仅仅用来反映中性性别特征），其中积极和消极的中性性格特征各10项。在量表中加入这些测试项是为了保证不会由于测验题目全部是男性化和女性化的描述或者全部是社会期许的项目而过分影响被试的反应。最终的量表包含了这60个项目。表7—2呈现了最终选为BSRI项目的特质的范例。需要说明的是，在实际测量中，测试项不是按性别类型分开呈现的，而是按随机混合排列。

表7—2 修改后的性别角色量表

按照如下标准为所有测试项评分：

1=完全或几乎不符合

2=大多数情况下不符合

3=有时但很少符合

4=偶尔符合

5=常常符合

6=大多数情况下符合

7=完全或几乎符合

评分

女性化得分：女性化测试项分数总和÷10=____

男性化得分：男性化测试项分数总和÷10=____

双性化得分：女性化得分减去男性化得分=____

说明：

女性化=1.00或更高

接近女性化=0.50至0.99

双性化=-0.50至+0.49

接近男性化=-1.00至-0.49

男性化=-1.00或更低

评分

正如前面所提到的，一个人进行BSRI测量，只需要用7点量表来衡量所有测试项与其自身的相符程度。相应的标准如下：1=完全或几乎不符合；2=大多数情况下不符合；3=有时但很少符合；4=偶尔符合；5=常常符合；6=大多数情况下符合；7=完全或几乎符合。测试完成后，被试会得到三个分数：男性化分数、女性化分数和对本文而言最为重要的双性化分数。男性化分数是把所有男性化测试项得分相加再除以10得到的平均数，女性化分数也是按这种方法得到的，因此得分均在1.0至7.0之间。那么，你想到如何利用这两个分数算出双性化得分了吗？记住，这个量表可以分别测量男性化和女性化，但却不包含双性化的测试项。如果你想到双性化分数可以用女性化分数与男性化分数的差来表示，那么你就是正确的，因为贝姆正是这么做的。一个人的双性化分数就是用其女性化分数减去其男性化分数而得到的，其范围从-6至＋6。真的很简单。这里有三个典型的例子，他们分别代表了男性化、女性化和双性化性别类型的人。

詹妮弗的男性化分数是1.5，女性化分数是6.4。用6.4减去1.5得出她的双性化分数是4.9。理查德的男性化分数是5.8，女性化分数是2.1，因此他的双性化分数是-3.7。黛娜的男性化和女性化的分数分别为3.9和4.3，其双性化分数为0.4。

看一下这些数据，我们所举的三个例子中，哪个人双性化程度最高呢？答案是黛娜。因为黛娜的男性化分数与女性化分数基本相同（双性化分数接近为0），并没有像詹妮弗和理查德那样显示出明显的性别取向。因此，黛娜的测量结果反映了其在自我觉知中缺乏明显的性别定型，更多的是一种男性化与女性化特征的平衡，这也恰恰是“双性化”一词的含义。

BSRI的测量结果可以这样解释：分数越接近于0（无论正负），表示双性化程度越高；在正方向上距0越远，表示女性化程度越高；在负方向上距0越远，表示男性化程度越高。

你也许想为自己测量一下。当然，就现在来说，你并不会得到一个理想的结果，因为你对这个量表的工作原理了解得太多了！你会把男性化、女性化和中性特质分开评分，而不是像在实际测量中那样混合在一起。不过，记住了这些告诫，你大可以试着测量一下。表7—2提供了简化的评分和解释说明。

结果

任何测量根据都必须具有信度和效度。“信度”是指测量的一致性，也就是各测试项对被试同一种特性反映的一致程度，以及经过重复测量得出一致结果的能力。“效度”是指实际测量的内容与想要测量内容的相符程度——就BSRI来说，我们想要测量的内容是男性化特征和女性化特征。

BSRI的信度

对学生样本测量结果的统计表明，BSRI对男性化和女性化测量的一致性信度非常高。这就意味着男性化的20个测试项测量的都是同一种特质（假定为男性特征），女性化的20个测试项测量的也都是同一种特性（假定为女性特征）。为了确定测量的一致性信度不受时间影响，贝姆四周后又对最初测量过的60人实施了第二次测量。两次测量的结果相关程度很高，因此具有很高的“重测”信度。

BSRI的效度

为了证明BSRI的效度，必须首先对男性化与女性化测试项进行分析，以确保不是对同一特质的测量，这一点是非常重要的。因为贝姆所做研究的理论基础正是男性化和女性化是两个相对独立的维度，并且这两个独立的维度可以分开测量。贝姆证明这一点的方法是考查BSRI中男性化分量表和女性化分量表得分的相关系数，结果显示这两个分量表的得分无显著相关，功能各自独立。

接下来，贝姆需要证明这个量表测量的确实是男性化和女性化的性别特征。为了确认这一点，她分别分析了男人和女人在男性化和女性化分量表上的平均分。你可以预期，结果应该是男人在男性化项目上的得分更高，女人在女性化项目上的得分更高。这正是贝姆在大学生被试身上发现的，而且这一差异达到了很高的统计显著性。

最后，贝姆把被试按照前面讨论过的形式进行了性别归类，即男性化、女性化和双性化。她发现大多数人的女性化得分和男性化得分的差异都很小。换句话说，大多数被试是双性化的。表7—3呈现了在贝姆的研究中，男性化、女性化和双性化被试所占的百分比。

表7—3 被试中男性化、女性化和双性化的百分比

注：被试数量=917。

资料来源：改编自表7，P.161（合并了样本）。

讨论

贝姆文章中的讨论部分短小简洁，具有很强的说服力。转述它的最好方法恐怕就是直接完整地从原文中引用：

希望BSRI的出现和发展，能够鼓励性别差异和性别角色领域的研究者们去质疑那种只有性别角色典型化的人们才心理健康的传统观点，并转而关注这种更为灵活的性别角色观念对人类行为以及社会所产生的影响。当性别角色的硬性划分已经不再适用于这个社会时，也许双性化人这一概念会为心理健康建立一条更为人性化的标准。（P.162）

这段话说明了贝姆的研究是如何改变心理学的。在其文章发表几十年后，西方文化逐渐开始认同“有些人是双性化的”，而且同时拥有男性化特征和女性化特征不仅不被人排斥，反而被认为是一种优势。更多的男人和女人开始从事或参加那些在传统观念中被视为“仅限于”异性的职业、业余爱好、体育活动和家庭活动。从女CEO到“家庭主夫”，从女消防员、女军人到男护士、男教师，从女性掌管权力到男性展现其敏感的一面，你会看到，性别角色和性别期望的转变在社会中无处不在。

然而，这绝不是说文化已经对性别差异“视而不见”了。相反，对性别角色的种种期望仍会使我们对行为和态度的选择产生很大影响，而且性别歧视也依然是一个严重的社会问题。总的来说，男性还是被认为处事果断，而女性则常常被认为感情用事；绝大多数飞行员都是男性（96%），而几乎所有牙齿口腔保健医生都是女性（98%）。但是我们应该注意到，这种伴随性别分界的文化差异在不断减小，并将持续下去。

在贝姆这一新的性别观念的影响下，大量研究开展了起来。正如先前讨论过的，20世纪70年代以前，人们普遍认为，只有“社会性别与生物性别相匹配”才能最好地适应生活。也就是说，男孩和男人应该表现出男性化的态度和行为，女孩和女人应该表现出女性化的态度和行为。然而，双性化的发现改变了这一观点，研究者们也开始探索男性化、女性化和双性化个体之间的差异。

批评与后续研究

一项研究显示，双性化的儿童和成人趋于拥有更高水平的自尊，而且在多样化的情境下适应性更强（Taylor & Hall，1982）。另一项研究指出，双性化人群更易与异性建立亲密关系，可能是由于他们能更好地理解、接受彼此间的差异（Coleman & Ganong，1985）。更多近期研究揭示，具有积极的双性化特征的人在心理上更健康、更快乐（Woodhill & Samuels, 2003）。然而，随着时间的推移，贝姆等人发展的双性化理论也经历了许多改进和完善。

许多研究者指出：那些双性化程度高的人之所以体验到心理上有优势，可能更多的是因为他们表现出的是男性化特征，而非两种性别特征的平衡（Whitley，1983）。仔细想想，这是有道理的。很明显，许多传统的女性化特质，如依赖、自我批判、感情用事等都不符合社会期望。这就说明了为什么那些具有更多男性化特质的人会受到更好的对待，从而逐渐比别人的自信和自尊水平更高。但是，并不是所有男性化特质都是积极的，所有女性化特质都是消极的。每种性别所具有的特质都包括积极和消极两方面。

研究者们在此基础上进一步提出了更为精准的双性化概念，它包括四个维度：受赞许的女性化；不受赞许的女性化；受赞许的男性化；不受赞许的男性化（见Ricciardelli & Williams，1995）。像坚定、自信、坚强被看作是受赞许的男性化性格特征，而专横、吵闹、苛刻都是不受赞许的男性化性格特征。就女性化来讲，有耐心、敏感、责任感强都是受赞许的性格特征，反之像神经质、羞怯、软弱等都是不受赞许的性格特征。所以，通过一个人在上述各种特质的分布，就可以推断他所属的性别类型：积极男性化、消极男性化、积极女性化、消极女性化、积极双性化或消极双性化。

当性别特征根据积极和消极的性质进行更为细致的定义后，积极的双性化性格优势开始被推崇（例如Woodhill & Samuels，2003）。同时拥有最好的男性化和女性化品质的人，比那些仅拥有一种性别特征或结合了两种性别特征消极方面的人更全面、更快乐、更受欢迎、更招人喜爱、更灵活多变、也更爱自己。想象一下，把一个耐心、敏感、负责、坚定、自信、坚强（积极双性化性格）的人（男性或者女性）和一个神经质、羞怯、软弱、专横、吵闹、苛刻（消极双性化性格）的人进行对比，你就会更加清楚地理解这种对贝姆理论的修订。

贝姆在性别角色这一领域的研究一直处于领先地位。她应用其理论和研究对性别不平等问题进行辩论，并在其1994年出版的著作《性别透镜》（The Lense of Gender）中对此进行了详细的讨论。近期，她又开始关注婚姻、家庭以及儿童抚养的复杂问题，并出版了《一个不寻常的家庭》（An Unconventional Family，1998）一书。在书中，贝姆用自己和前夫康奈尔大学著名心理学家达里·贝姆（Daryl Bem）生活的经验，来探究一对夫妻如何避免形成传统的性别行为预期，如何真正平等地对待彼此，如何把孩子抚养成为“性别观念解放”且具有积极双性化性格的人。

近期应用

你在阅读本文时，可能会提出这样一个问题：用来测试男性化和女性化的那些测试项目是否一直有效呢？也就是它们是否可以一直用于区分男性化人群和女性化人群呢？事实上，你可能已经并不赞同其中的一些测试项。毕竟这项研究是在几十年前进行的，而社会价值观对性别行为的期许也会随着时间而改变，对吗？这个问题的答案是“有可能！”20世纪90年代末开展的一项研究选取美国南部一所中等规模的大学的学生作为被试，对BSRI的所有项目进行重新评定。结果显示，除了其中两项，其他测试项仍能在很大程度上区分男性化和女性化（Holt & Ellis，1998）。那两项特例——“孩子气”和“忠诚”——在BSRI中都是对女性化的描述，但在1998年的研究中，它们并没有被评定为对于女性（而非男性）更受期许的特征。

然而另一项研究却得出了截然不同的结果。当选用美国东北部城市的一所大学的学生作为被试，对BSRI的测试项目进行验证时，结果出现了很大的差异（Konrad & Harris，2002）。研究发现：（1）女性被试认为，20个男性化测试项中仅一项（“阳刚”）对于男性来说更受赞许；（2）男性被试则认为，20个男性化项目中有13项受赞许的男性化性格特征；（3）女性被试只评出女性化项目中的2项（娇柔和轻声细语）对于女性来说更受赞许；（4）男性被试觉得有7项女性化项目对于女性来说更受赞许。

我们如何解释这两种研究结果之间的差异呢？一种可能是人们对性别的认同与地理区域有关。霍尔特和艾利斯的数据来自美国南部（还是一个相对较小的城镇），而康拉德和哈里斯的测试者则来自于美国东北部（而且是一个大型城市）。作者认为的另一种可能是：研究中的被试可能已经“猜到了”研究目的，从而使他们的答案带有了一定的倾向性：

明确地说，尽管要求被试对一种性别特征评分，但事实上仅仅指定性别作为测试目标这一点，就可能暗示被试该研究目的。既然有这种可能性，被试很可能会提供比真实情况更为平等的性别认同来表现积极的自我形象。（Konrad & Ellis，2002，P.270）

贝姆的工作对性征与性别的研究产生了巨大的影响，她的工作为与性别有关的研究奠定了基础。例如，有一项研究考察性别特征如何影响人们对处在领导地位的男女的看法（Ayman & Korabik，2010）。在诸多的影响因素中，研究者发现性别（部分地）决定了一个人是否能成为领导者。领导者大部分是男性，这是为什么呢？因为传统印象里，在成为领导的人身上，我们更多地看到男性化和社会主导性人格特征。另外，以任务为导向、更少表达情感的个体更有可能成为领导，而这些特质在男人身上更常见。然而，近期的研究表明，如果把群体的性别构成和特定的领导任务考虑在内，那么表现出双性化人格特征的个体更有可能成为领导者。这可能是由于双性化程度高的个体能更轻易地将任务导向和情感表达结合起来，而这正是使得许多领导工作更高效的关键。

结论

桑德拉·贝姆的这项研究之所以改变了心理学，是因为它改变了心理学家、个体以及整个社会对人类一项最基本特征——性别认同的看法。贝姆的研究对开拓我们的视野具有重要的作用，使我们真正意识到什么是男人和女人，什么是男性化和女性化。也正是因为如此，我们每个人才有机会去拓展自己的行为模式、选择范围和生活目标。

研究27 和心脏赛跑

Friedman, M., & Rosenman, R.H.(1959).Association of specific overt behaviorpattern with blood and cardiovascular findings.Journal of the American Medical Association，169，1286-1296.

你是怎样的一个人？如果有人向你提出这一问题，你很可能会把自己较为明显的主导特征作为对该问题的回答。这些人格特征通常被称为“特质”，它们在使你成为一个独一无二的人这一方面起着重要的作用。人格特质具有跨情境和跨时间的一致性。支持人格特质理论的心理学家（并不是所有人都支持）认为，我们身上有很多种人格特质，例如双性化人格和控制点，这些特质在我们每个人身上的数量又有所不同。所有心理学家都感兴趣的是，人格特质使我们能够较稳定地预测出某人在某一特定情境中的所作所为。换句话说，人格特质理论家认为，对人格特质的剖面图进行分析，可以预测个体现在或将来的行为结果。因此，如果某种人格特质经研究能够预测你的健康状况，甚至能预测你死于某种心脏病的概率，那么人格心理学家对这种特质的兴趣急骤增加也就不足为奇了。

你也许知道有一种与健康有关的人格特征，它被人们称为A型人格。简单地说，A型人格是指一种特定的行为模式而不是个体的整个人格面貌。这种行为模式最早于20世纪50年代末期，由迈耶·弗里德曼（Meyer Friedman，1911~2001）和瑞·罗森曼（Ray Rosenman）两位心脏病学家首次提出。他们的理论和研究发现把心理学和健康联系在一起，并且对我们如何看待人格何以能导致或避免严重疾病产生了重大的影响。

理论假设

这两位医生研究构想的产生过程表明，对细微之处的仔细观察可能会引发科学上的重大突破。一次，弗里德曼医生请人为他候诊室里的家具重做皮套。做皮套的人说，沙发和椅子的皮套磨损方式很奇怪。具体说来，椅子的前沿比其余部分磨损得更快。这让弗里德曼医生想起似乎他的心脏病人常坐在椅子的边缘，这种现象促使他想知道他的病人（心脏病人）是否与其他科室的病人在某些重要人格特质上有所不同。

通过对公司高层和内科医生的调查，弗里德曼和罗森曼发现，人们普遍认为长时间处于疲劳驾车、面临最后期限、竞争性环境以及经济受挫等慢性应激状态下的人，更可能患上心脏病。于是，他们决定对这些想法进行科学验证。

方法

利用他们的早期研究和临床观察，两位心脏病学家提出了一套反映一种特定的外显（可观察的）行为模式的模型，或者说特质组合。他们相信这一特定的行为模式与胆固醇水平的升高密切相关，并最终导致冠心病（CHD）。这种被称为A型行为的模式包括如下特征：（1）一种要达到个人目的的强烈而持久的内驱力；（2）在所有情况下都有一种热衷于竞争的倾向；（3）一种想得到别人的承认和不断超越自我的持久的欲望；（4）不断卷入有最后期限的事务之中；（5）习惯于风风火火地完成各种活动；（6）心理和生理上的过分敏感（P.1286）。

研究者紧接着提出了第二种被称为B型行为的外显行为模型，其特点与A型行为完全相反。这些行为的典型表现于不具备以下这些特征：内驱力、进取心、时间紧迫感、对竞争的渴望以及最后期限的压力。

弗里德曼和罗森曼接下来要做的就是寻找符合A型行为模式和B型行为模式的被试。为此，他们联系了各种各样的大公司大企业的经理和主管，并向他们解释这两种行为模式，请求经理和主管从自己的同事中挑选那些最符合该行为模式的人。最终选定的两组被试由各个级别的经理主管和普通职员组成，全部为男性。每组83人，其中A组的平均年龄为45岁，B组的平均年龄为43岁。所有被试都完成了与该研究的目的有关的一些测验。

首先，研究者用访谈的形式来了解被试父母的冠心病（CHD）的既往病史，被试自己心脏问题的既往病史，每周的工作、睡眠和锻炼的时间以及吸烟、喝酒和饮食习惯。在访谈过程中，研究者还要基于被试的肢体动作、谈话语气、紧咬牙关、体态、急躁神态以及被试关于内驱力、好胜心和时间紧迫感的自我报告等指标，确定被试是否具有其所在组（A型行为或B型行为）行为模式的全部特征。研究者最终确定A组的83名被试中有69人充分表现出A型行为模式，而B组的83名被试中有58人被判定为完全符合B型行为模式。

其次，要求所有的被试用日记方式记录自己在一周时间内的饮食情况。给每名被试分配一个编号，以便让他们在如实报告饮酒情况时不会感到为难。接下来，被试的饮食情况由医院中的一名营养学家进行归类和分析，该营养学家不了解被试的身份，也不知道被试属于哪个组。

再次，对每名被试进行抽血以测量他们的胆固醇水平和血凝时间。通过详细询问被试以往的冠状动脉健康状况以及标准的心电图数据来确定其冠心病的状况。这些心电图数据由罗森曼和另一名不参与该研究的心脏病学家分别进行独立解释和判断。除一例之外，他们的解释完全一致。研究者还检查被试的眼睛确定患有角膜弓的被试数量。角膜弓又称老年环，指的是由血液里的脂肪堆积而导致的在眼角膜周围形成的一个不透明环状物。

现在，让我们概括一下弗里德曼和罗森曼的研究数据，看看他们究竟发现了什么。

结果

由访谈结果来看，两组被试的行为好像与研究人员所勾勒的两种行为模式的轮廓非常吻合。A组被试长期为承诺、抱负和内驱力所牵制。而且，他们显然渴望在所有活动中都力争上游，不管是专业活动还是娱乐活动。此外，他们也承认有强烈的获胜欲望。B组被试与A组被试相比有非常显著的不同，尤其表现在缺乏时间紧迫感上。B组被试似乎满足于他们的生活现状，而且不愿追求多个目标，并避免竞争性的情境。他们很少关心升迁的问题，而且往往将更多的时间用于与家人在一起以及参加非竞争性的娱乐活动。

表7—4概括了两组被试在测验和调查中最具可比性的特征。表7—5概括了有关血液水平和疾病情况的测量结果。正如表7—4所示，两组被试在几乎所有被测量的特征上都较为接近。尽管A组被试在多数测量指标上略高于B组，但在两者仅在每天吸烟的数量以及其父母患冠心病的概率方面存在显著性差异。

表7—4 A组和B组被试的个体特征的比较（平均值）

表7—5A组和B组被试的血液和疾病的比较

然而，如果你浏览一下表7—5中两组被试的胆固醇情况和疾病情况，两组之间的确存在非常有说服力的差异。首先，尽管从表中的全部结果来看，两组被试的血凝时间似乎并不存在有意义的差别。血凝速度与心脏病及其他脉管疾病有关。血凝时间越慢，患病的危险性便越小。为了更严密地进行统计检验，弗里德曼和罗森曼比较了那些表现出典型A型行为模式的被试的血凝时间（6.8分钟）和那些表现出典型B型行为模式的被试的血凝时间（7.2分钟）。结果发现，二者在血凝时间上的差异具有统计显著性。

表7—5中所示的其他发现是非常明确的。A组被试的胆固醇水平明显高于B组。如果将典型的A型被试和B型被试进行比较，这一差异则会更大。A型被试角膜弓的发生率是B型被试的三倍，而典型A型被试的角膜弓发生率则是典型B型被试的五倍。

使本研究得以载入史册的最重要的发现是两组被试在临床冠心病的发病率上存在极其显著的差异。A组中有23名被试（28%）出现了明显的冠心病发病迹象，而B组中只有3名被试（4%）有明显的迹象。当研究者对典型A型被试和典型B型被试进行进一步检验时，研究所得到的证据变得更为可靠。A组中有发病迹象的这23名被试全部具有典型的A型行为模式，而B组中的这3名有发病迹象的被试则是其中非典型B型行为模式的人。

对研究发现的讨论

作者隐含的结论是，A型行为模式是冠心病以及与此相关的血液异常的主要原因。不过，如果你仔细检查表中的数据，你会注意到对那些结果可以有其他的解释：一是A组的人报告其父母患有心脏病的人数更多。因此，或许是遗传而不是行为模式造成了两组之间存在的显著差异；另一引人注目的差异是A组被试每天的吸烟量更大。今天，一个众所周知的事实是吸烟可以引起冠心病。也许不是A型行为模式导致了这些结果，而是大量的吸烟引起了冠心病。

弗里德曼和罗森曼在他们对研究结果进行讨论时回答了上述两种潜在的质疑。首先，他们发现A组中吸烟少的被试（每天10支或更少）和吸烟多的被试（每天多于10支）患冠心病的人数一样多。其次，B组中吸烟多的被试多达46人，却只有两人有冠心病症状。作者根据这些发现认为，吸烟可能是A型行为模式的一个特征，但不是冠心病发病的一个直接原因。需要特别注意的是，该研究完成于40年前，当时人们对吸烟与冠心病之间的密切关系还没有达到像今天这样的认识。

关于父母的既往病史导致了这一差异的可能性，“研究数据显示，A组有心脏病家族史的30名被试中，只有8人（27%）患有心脏病，而其余没有心脏病家族史的53人中，却有15人（28%）患有心脏病；B组中有心脏病家族史的被试有23名，但其均未表现出临床的心脏病症状。”（P.1293）需注意的是，现在更多的对该因素进行严格控制的研究已经证明冠心病与家族因素有关。不过，我们还不清楚遗传的究竟是心脏病，还是某种行为模式（例如A型行为）。

研究发现的意义和后续发现

弗里德曼和罗森曼的研究对心理学研究的历史具有极其深远的影响。之所以这样说，主要是基于以下三个原因。

首先，该研究是最早系统探讨并提出个体的某些特殊行为模式能大大地增加某些严重生理疾病患病概率的研究之一。这一发现提醒医生，对成功的诊断、治疗、干预和预防而言，仅仅考虑到疾病的生理方面或许是远远不够的。

其次，该研究开创了探索行为与冠心病关系的一个新的研究方向，并且已产生了很多研究文章。A型人格及其与冠心病的关系已被提炼为如下要点：人们能够对心脏病高危人群的初次发病进行预防。

弗里德曼和罗森曼研究的第三个具有深远意义的影响是，它对于开创和发展健康心理学这一行为科学分支功不可没。健康心理学家从心理因素在健康的促进和维持、疾病的预防和治疗、致病原因及其在医疗保健系统中所处的地位来研究健康和医学的方方面面。

一项特别重要的后续研究值得在此作一介绍。1976年，罗森曼和弗里德曼发表了一项历时8年的研究结果。研究中的三千多名男性被试在该研究开始时被诊断为没有心脏病，且具有A型行为模式。这些人患心脏病的概率是B型行为模式被试的两倍，更易遭受心脏病的威胁，其报告的冠状动脉问题是B型被试的五倍。然而，更为重要的可能是，A型行为模式能够在独立于其他诸如年龄、胆固醇水平、血压或吸烟习惯等预测源的情况下，预测人们是否会患冠心病（Rosenman et al.，1976）。

现在你可能会问自己这样一个问题：“为什么A型行为模式会引起冠心病？”最为人们接受的一种理论回答是，A型行为者面对应激事件时，比非A型行为者的生理唤醒强度更高。这种极端唤醒状态致使身体产生过多的肾上腺素等激素，同时也提高了心率和血压。久而久之，这些对压力的过度反应会损害动脉，并进而导致心脏病（Matthews，1982）。

近期应用

弗里德曼和罗森曼或合作或独立地继续进行人格和行为变量在冠心病中所起作用的研究，并在该领域中扮演着带头人的角色。他们的研究连同其他研究已经发展出一种新的领域“心脏病心理学”（cardiopsychology），主要关注心理因素在冠心病的发病、病程、康复以及应对机制中的作用（Jordan，Barde，& Zeiher，2001）。本节讨论的是他们的第一篇论文，该文以及他们的其他许多的近期研究已被很多国家的众多研究所引证。A型行为的概念已经被完善、拓展和应用到诸多研究领域。其中一些领域应用A型行为的概念是完全顺理成章的，而另一些领域或许会令你感到惊奇。

例如，有一项研究检验了A型行为与汽车驾驶之间的关系（Perry & Baldwin，2000）。得出的结论让人深信不疑，即“朋友们不会让具有A型行为的人驾车！”该研究发现，A型人格与驾驶事故有密切关联，产生更多交通事故、收到更多罚单、在路上更加不耐烦、表现出更多的公路暴怒，以及更多高风险的驾驶行为。看到这里，在你下次遇到交通事故之前，你或许想用本节结尾处的A型行为量表测试一下自己。

研究者们仍在继续探索人格因素与健康（尤其是冠心病）的关系，目前定义了一种新的典型行为模式：D型人格（Denollet et al.，2010）。字母D表示苦恼（distressed），D型人格的特点是大多数时间里都充满了负面情绪，对世界持有悲观的看法（“一切都糟透了”），害羞拘谨（与他人同处时感到不自在）。研究发现，这种行为模式与很多负面的健康事件有很高相关，包括动脉疾病、血管成形术、心脏搭桥术、心力衰竭、心脏移植、心脏病发作和因心脏问题造成的死亡等。研究者发现D型人格的个体处于社交环境中时会表现出明显的焦虑，同时在日常生活中会表现出较高水平的焦虑和抑郁。另外，他们还拒绝与他人谈论自己的心理不适感，因为他们非常在意周围人对自己的看法。有些人认为D型人格是A型人格的变体，有些人则认为它们是相互独立的。

有研究还发现A型人格（或许D型人格也是一样）会影响父母与青春期子女的关系（Forgays，1996）。在该研究中，研究者分析了900多名被试的A型人格特征和家庭教育环境。结果显示，如果父母具有A型行为，则其处于青春期的孩子也倾向于具有A型行为。尽管这并不令人吃惊，但却又一次引出了先天与后天的问题。孩子是继承了父辈A型行为的基因倾向，还是他们在A型父母对其养育的过程中习得了A型行为？福盖斯（Forgays）在他的研究中强调：“进一步的分析显示，能觉察到的家庭环境是青少年形成A型行为的一个独立的原因”（P.841）。不过，从最近的研究趋势来看，如果领养儿童研究、双生子研究和脑成像研究发现了A型/B型人格特征有基因或遗传的倾向，也并不令人感到吃惊（参见研究3中鲍查德针对基因影响人格所做的讨论和研究）。

结论

你有A型行为的人格特征吗？你是怎么知道的？正如本文开头部分所提及的你的内向或外向水平一样，A型/B型行为特征是人格的一部分。用以评估人们的A型或B型行为模式的测验已被编制出来。请参考下面的A型人格特征的条目，以大致了解你在多大程度上具有这些人格特征：

1.经常同时做几件事；

2.催促别人加快速度，让其快点把话说完；

3.遇到交通堵塞或排队等待时，显得很急躁；

4.讲话时有很多手势；

5.无事可做时很难坐得住；

6.讲话时很不耐烦，而且常常出言不逊；

7.比赛时总是想赢，甚至和儿童做游戏时也是如此；

8.在观看他人完成某一任务会变得不耐烦。

如果你怀疑自己是A型人格，你或许需要求助于一位有经验的医生或心理学家，以便做一个更仔细的评估。人们已经开发了一些打破A型行为与相关严重疾病关联的干预方案，很大一部分是在弗里德曼和罗森曼研究工作的基础上发展而来。

研究28 个人与集体

Triandis, H., Bontempo, R., Villareal, M., Asai, M., & Lucca, N.(1988).Individualism and collectivism: Cross-cultural perspective on self-ingroup relationships.Journal of Personality and Social Psychology, 54, 323-338.

如果说，有哪一种人类的特征能几乎被所有的心理学家所认同的话，那就是人类的行为从来不会在真空中发生。即使是那些最强调内部动机、个性需求和遗传驱动力的心理学家们也会考虑把各种各样的外部环境力量引入最终导致个体行为和特质形成的方程式中。在过去的三四十年间，心理学领域已经开始渐渐认识到文化是一种对人类具有重大影响的环境因素。事实上，研究人员发现，很少有在所有或者在大多数文化中具有一致性和稳定性的人类行为模式（跨文化一致性的扩展分析参见研究22中关于埃克曼的面部表情研究的讨论）。这在涉及人类的相互作用和人际关系的行为领域中显得尤为突出。人际吸引、性、感动、个人空间、友谊、家庭动力、父母养育方式、儿童行为期望、求偶仪式、结婚、离婚、合作与竞争、犯罪、爱和恨等都深受文化因素的影响。可以肯定地说，如果不考虑一个人的文化背景，那就根本无法全面或准确地了解这个人。

从概念上讲，文化是很容易理解的，但具体到实践领域，文化却成了一块难啃的骨头。试想，你如何能够理清那些交织在一起的、共同塑造了现在的你的所有文化因素呢？大多数文化是如此复杂，以至于无法得出有据可循的结论。例如，结肠癌在日本的发病率比在美国低得多。日本和美国是两种不同的文化，那么到底哪些文化因素可以解释发病率的差异呢？是对鱼的需求量的不同？是消费大米数量的不同？是饮酒量的不同？是生活节奏和应激水平上的差异？或许是两国宗教习惯的差异影响了健康？来自亲戚朋友的支持的差异是否会影响健康状况？抑或更可能是以上两个、三个或者所有这些因素连同其他因素共同导致了这一结果？问题的关键是，如果你打算把文化列为全面了解人类本性的因素之一，那就需要用可靠和有效的方式来定义文化差异。正是在这一点上，哈里·川迪斯在现代心理学史上崭露头角。

从20世纪60年代起，川迪斯在芝加哥大学俄巴娜—香槟分校心理学系致力于揭示和提炼文化及其背景下的人们的基本特性，以便以有意义的方式对这些文化加以区分和研究。这项工作贯穿于川迪斯的整个事业生涯。发表于1988年的这篇论文解释并论证了他对跨文化心理学所作出的巨大贡献，它阐述了个人主义文化和集体主义文化。今天，这一基本的文化差异维度构成了每年的心理学、社会学以及很多其他领域数百项研究的基础。在这篇论文中，川迪斯认为，在某种程度上被界定为个人主义或集体主义的特定文化，正以一种复杂和广泛的方式决定着其成员的行为和人格。

用通俗的话讲，集体主义文化是这样的一种文化，即生活在该文化中的个体的需求、欲望、成就都必须从属于他所属的内群体（ingroup）的需求、欲望以及目标。内群体可以是一个家庭、一个部落、一个村庄、一个专业组织或者甚至整个国家，具体视情况而定。在这些文化中，个体的大部分行为的产生取决于该行为是否有利于个体所属的更大群体的整体利益，而不是该行为是否能为个体提供最大限度的个人成就。人们所归属的内群体往往会保持长期稳定，而且个体对其所属群体的承诺通常都很高，甚至当一个人在群体中的地位对其而言已变得困难或者不愉快时也是如此。个体依靠他们所属的群体来帮助他们满足自己的情绪、心理和实际的需要。

相反地，个人主义文化更看重个体的幸福和成就，而不是其所属群体的需要和目标。在这些文化中，群体对其所有成员的影响可能是微乎其微的。个体对其所属群体没有太多情感上的依恋，并且如果它对个体的要求过于苛刻，个体则宁愿脱离该群体而加入或者重新组建一个新的群体。在个体主义文化中，个体对群体的承诺很少，所以对个人而言，同时是多个群体的成员是很常见的事情。然而，没有哪个群体能单独对其行为施加太多的影响。在该篇论文中，川迪斯及其来自不同文化背景的合作者，描述了大量典型集体主义文化和个人主义文化特征。所有这些都被总结在表7—6中。当然，这些特点是高度概括化的，因此不管是在集体主义文化还是在个人主义文化之中，总有一些例外的情况。

按照川迪斯的观点，个人主义文化集中在北欧、西欧和那些历史上受北欧人影响的国家。此外，典型的个人主义文化有一些共同的特征：具有边界，大量的外来移民，社会和地理上的迅速变迁。“所有这些特点倾向于使群体的控制力变得不太确定。在美国、澳大利亚和加拿大，高度的个人主义是与上述特点相一致的。”（P.324）他认为，世界上其他大多数地区属于集体主义文化。

理论假设

川迪斯在其文章的开头部分指出：

文化是一种模糊的结构体。如果我们要了解文化和社会心理现象的联系，我们必须通过确定文化差异的维度来分析它。最有前景的维度之一就是“个人主义—集体主义”。（P.323）

在川迪斯的很多研究和著作中所隐含的研究假设是，当我们按照“个人主义—集体主义”模型来界定和诠释文化时，这一模型能够解释我们所见到的表现在人类行为、社会交往和人格中的大部分差异。在该文中，川迪斯试图概括出其理论的广泛的潜在用途（参见表7—6），并报告了他为了验证和阐明其个人主义—集体主义理论所做的三项科学研究。

方法

如前所述，该篇论文报告了三项独立的研究：第一项研究的被试全是美国人，以便更加清晰地定义适用于美国的个人主义的概念；第二项研究的目的是比较个人主义文化（美国）和集体主义文化（如日本和波多黎各），其核心在于比较在两种文化类型中个体与他们所属群体之间的关系；第三项研究用以检验如下假设，即集体主义文化中的成员觉察到自己获得更好的社会支持，且一贯享有令人满意的人际关系，而个人主义文化中的成员则报告他们常常感到孤独。所有这些数据都是通过问卷调查的形式来收集的。下面我们将简要介绍每项研究及其发现。

表7—6 集体主义文化和个人主义文化的差异

研究1

第一项研究的被试是川迪斯所在的芝加哥大学心理系的300名在校大学生。研究者要求每位学生完成一份包括158个项目的问卷，用以测量他们有关“个人主义—集体主义”的行为和信念倾向。如果被试赞同“只有那些依靠自己的人才能在生活中获得成功”，那么他便持有个人主义的立场。而被试如果同意“当我的同事把他们的隐私告诉我时，我们的关系更加亲密了”，则说明该被试持有集体主义的观点。此外，问卷中包括5个生活情景故事（Scenarios），这些情景故事把被试置于一种假设的社会情境中，并要求他们预测自己的行为。该论文中所提供的一个例子是，让被试想象自己想要做一次群体内其他成员都反对的长途旅行。问被试在决定是否去旅行时，会在多大程度上考虑父母、配偶、亲戚、密友、熟人、邻居以及同事的意见。

对回收的问卷进行分析后发现，在被试的回答中几乎有50%的变异能够被三个因素所解释，这三个因素是：自力更生、竞争、与所在群体的亲疏关系。只有14%的变异能被“对群体的关注”这一因素所解释。川迪斯对研究1的结果做了如下概括：

这些数据表明，美国式的个人主义是一个包括多方面含义的概念。具体包括：关心自己的目标胜过群体的目标，不太关注群体的观点；自立与竞争相结合，与群体有些疏远；做决定时根据的是自己的看法而不是其他人的观点，以及对群体不太关心（P.331）。

他还指出，该问卷所含的项目和生活情景故事能有效地测量美国文化的个人主义程度，但川迪斯对这些项目在其他的文化背景中是否同样有效尚存疑问。

研究2

在该研究中，研究所提出的问题是：“集体主义文化中的人们是否更乐意使自己的个人需要服从于集体的需要？”被试是91名芝加哥大学的学生、97名波多黎各学生、150名日本大学生和106名年长的日本人。测量集体主义特征的问卷由144个项目组成。问卷被译成西班牙语和日语后交由所有被试进行回答。经之前的研究验证，该问卷的题目分别测查关于集体主义的三个倾向：关心群体、自我与群体的亲密关系和使自己的目标服从于群体的目标。

该项研究的结果互不一致且很有趣：一些结果支持“个人主义—集体主义”的理论，而另一些则似乎又对它予以反驳。例如，日本学生比伊利诺伊的学生更在意同学和朋友的观点，但波多黎各学生并没有表现出这一特点。此外，尽管日本被试在群体获得荣耀表达了自豪感，但他们在生活中只关注他们所在的某些群体的观点，并牺牲自己的个人目标以服从这些特定群体目标，而不是对所有群体都如此。尽管服从是集体主义文化的一个共同特征，但事实上日本被试比美国被试更少地表现出对群体的服从。有结果表明，随着集体主义文化变得更加丰富化和西方化，它们可能正在经历一个向个人主义转变的过程。作为这一观点的又一证据，研究发现年长的日本被试比日本大学生倾向于认同其所属的群体。

在这一点上，你或许会问，第二项研究的结果如何纳入川迪斯的理论呢？川迪斯把它们解释成一种警示，即有关集体主义文化和个人主义文化的结论不应该过分概括化，而必须仔细分析并有选择地应用于特定的行为、情境和文化之中。他对这一观点做了如下阐述：

该项研究的数据告诉我们要限制和细化我们对集体主义的定义，……我们必须考虑到每个独立的社会行为领域。被界定为服从所在群体的规范、需求、观点，而且情绪上对群体有依恋感的集体主义对于特定的群体和社会行为领域而言是一个非常具体的概念。……集体主义在每种特定的文化中分别呈现出不同的形式。（P.334）

研究3

第三项研究正是试图要完成川迪斯在上述引语中所提出的研究任务，对研究的核心加以限制和细化。该研究拓展了先前的研究结果，即集体主义社会为它们的成员提供了高水平的社会支持，而个人主义文化中的个体则在更大程度上体验到孤独。该研究所采用的集体主义—个体主义问卷由72个项目组成，总共施测了来自芝加哥大学和波多黎各大学的100名被试，男女各半。被试还填写了另一份问卷以测量他们所知觉到的社会支持水平和孤独程度。

该研究的结果清楚地表明，集体主义与社会支持存在正相关，也就是说，随着集体主义程度的提高，相应的社会支持水平也会提高。而且集体主义与孤独程度呈负相关，即随着集体主义作用的提高，被试所意识到的孤独程度降低。作为川迪斯理论模型的进一步的证据，对该研究中的美国学生来说，最重要的因素（能解释最大的变异）是“在竞争中自力更生”，而对波多黎各学生而言，最重要的因素是“合群”（与他人的互动）。这些结果正是人们可以由“个人主义—集体主义”理论预期得到的。

讨论

川迪斯解释说，总而言之，本文中所述及的这些研究既支持又改进了他对集体主义和个人主义的定义。回过头来看表7—6中所列出的两种文化类型的特征，其所显示的状况似乎是相互对立、非此即彼的，即个人主义文化和集体主义文化看来几乎是完全对立的。不过，本文证明了这两种文化类型似乎处于一个连续体的两端，而某一特定社会则处于两端之间的某个点上，这个点通常更接近于连续体的一端而远离另一端。此外，具体到某一文化，其中特定的个体、群体、亚文化以及情境可能会偏离该文化在连续体上的大体位置而向某一端移动。图7—2呈现了这一解释的图示。川迪斯指出：“简言之，这些实证研究表明，我们必须把个人主义和集体主义看作是一种多维的结构，……每一维度的性质和特点主要取决于其所属群体的现状、情境线索以及所研究的具体行为。”（P.336）

图7—2 集体主义—个人主义的文化连续体（文化和亚文化的近似位置）

研究发现的意义和相关研究

尽管该研究的历史很短，川迪斯的研究结果已经成为心理学家看待人类行为的基础之一。在你打开大多数心理学分支——基础心理学、社会心理学、发展心理学、人格心理学、人类性行为、变态心理学和认知心理学等的新版教科书时，你将很难找到一本不涉及川迪斯的这项研究，或是他做的很多其他有关“个人主义—集体主义”的研究。可以说，在有关文化对于决定人格和社会行为所起作用的当代研究中，由川迪斯所阐述、澄清和提炼的个人主义—集体主义文化维度是最可靠、最有效和最具影响力的因素。此外，该维度能被应用于非常广泛的研究领域。以下正是这方面的两个应用实例。

在川迪斯的这篇论文中，他所提供的证据表明，集体主义和个人主义这两个心理社会概念可能会对一种特定文化的成员的身体健康产生重大影响。这项与冠心病有关的研究就是一个很好的例子。一般而言，在集体主义社会中，心脏病的发病率比在个人主义社会中要低。川迪斯认为，与心脏病密切相关的令人不快和紧张的生活状态在个人主义文化中更为常见。为了竞争和实现个人目标，孤军奋战的个体承受着巨大的精神压力。除了这些消极的生活事件之外，个人主义的社会结构本身就缺乏对其成员提供的社会凝聚力和支持力量，而这种力量却恰恰能够减少压力给人体健康所带来的影响。当然，正如本文开头部分所讨论的那样，有很多因素可以解释在心脏病以及其他疾病的发病率方面出现的文化差异。但很多研究已经表明，集体主义文化中的成员迁居到个人主义文化的国家后，也越来越易于患上包括心脏病在内的各种疾病。

或许，更有说服力的是在同一种文化中的两个不同的亚群体之间所存在的差异。正像川迪斯所指出的（P.327），研究人员做了一项以3000名日裔美国被试的研究，主要是比较那些在生活方式和态度上已完全适应了美国风格的日裔美国人和那些仍然保持传统日本生活方式的日裔美国人。结果发现，在排除了胆固醇水平、锻炼、吸烟、体重等因素的情况下，前者心脏病发病率仍然是后者的5倍。

当然，你也许已料到“集体主义—个人主义”维度会影响到特定的文化群体之间在养育子女的方式上的不同，事实上的确如此。集体主义社会中的父母更加注重培养儿童的“集体自我”（collective self），这种集体自我的特征是对群体规范的服从，对群体中权威的服从，行为具有跨时间和跨情境的可靠性和一致性。家长常常以公开或微妙的方式对做出符合群体目标的行为模式的儿童给予奖赏（Triandis，1989）。在这种情形下，只是因为自己不喜欢而拒绝从事群体期望自己做的事情是不能被接受的，这种情况也极少发生。然而在像美国这样的高度个人主义的文化中，这种拒绝是一种正常的反应，而且常常受到人们的重视和尊敬！这是因为在个人主义文化中，父母重视培养儿童的“个人自我”（private self）。这就意味着儿童会因具有自力更生、独立、自知之明以及最大限度地发挥自己潜能的行为和态度而得到奖赏。另一个看待这种差异的角度是，在个人主义文化中，反抗（在社会可接受的范围内）和独立倾向被看成是一种人格资产（personality assets），而在集体主义社会里，它们被看成是负债（liabilities）。文化经由父母向儿童传达的关于资产或负债的信息是强大而明确的，它对儿童的成长有着强有力的影响。

近期应用

川迪斯的工作影响着广泛的研究领域。其中一篇文章将川迪斯的理论应用到研究两种文化条件下大学生球迷的态度问题（Snibbe et al.，2003）。研究者对观看重要足球比赛的美国（玫瑰杯美式足球赛）和日本（闪光杯足球赛）的大学生进行问卷调查，要求这些大学生在足球比赛前和比赛后，分别对自己球队与对方球队的学校和学生进行评定。在这两场比赛中，都是具有优良学术氛围的大学输掉比赛。然而，在两种不同的文化背景下，学生的反应差别很大：“美国大学生无论是在赛前还是赛后，均表现出对自己球队更加积极的态度。相比之下，日本大学生的评分没有表现出对本队的偏爱。而且，日本大学生对学校的评分反映了每一所大学在社会上的地位，对学生的评价则是根据目前的状态。”（P.581）

另一项研究采用川迪斯的理论模型对孤独感进行了跨文化研究（Rokach et al.，2002）。该研究选取了来自北美和西班牙的1000多名被试，要求他们完成关于孤独感成因的调查问卷，其中包括个人体缺陷、发展性障碍、缺乏亲密感、迁徙和分离，以及社会排斥感。“结果表明，孤独感的成因的确受到文化背景的影响。而且，北美被试在这五个维度上的得分较高。”（P.70，附加强调）

最后，有一项研究突出了川迪斯研究工作的一个很重要的方面。当我们在对集体主义和个人主义加以研究和比较时，这种比较绝不只限于在国家之间进行。很多国家本身就包括了多种水平的集体主义和个人主义的亚类型。在世界上没有哪个国家比美国拥有更多的不同形式的集体主义和个人主义。一项根据川迪斯的理论模型完成的一项有趣的研究（Vandello & Cohen，1999）以图表的形式描绘了美国集体主义和个人主义的分布情况。在继续往下阅读之前，请想一想你认为最典型的个人主义和集体主义会出现在什么地方。研究发现，美国的南方腹地具有突出的集体主义倾向，而位于大平原和落基山脉的地区则呈现更明显的个人主义倾向。不过，即便是在这些不同的地区内，也可以发现不同层次的个人主义和集体主义的亚文化群体。

结论

川迪斯给所有的社会科学提供了一种看待基本的文化差异的新视角。随着世界变得越来越小、多种社会文化日益交织，我们所直接经历的文化多样性常常会导致一些潜在的误解、沟通障碍、冲突和挫折。对于集体主义和个体主义文化差异的觉察和尊重，有可能让我们朝着缓和文化分歧与促进世界和谐的积极目标迈出一小步，但却是富有意义的一步。

第八章心理病理学

大多数没有学过心理学的人会有这样的印象：这一学科主要涉及心理疾病的分析与治疗（心理学中研究精神病的一个分支被称为变态心理学）。然而，正如你所看到的，在这本书中，几乎所有的研究都把焦点集中在正常行为上。几乎所有的心理学家对正常行为的兴趣远远超过了对异常行为的兴趣，因为大量的人类行为并非是病态的，而是正常的。如果只研究占人类行为中很少比例的异常行为，我们就不能更多地了解人类的本性。尽管如此，对许多人来说，精神病也仍然是心理学中众多使人感兴趣的研究领域之一。在这里面包括了心理学史上一系列必不可少的研究。

第一项研究在精神卫生领域已经谈论了30多年。在这个研究中，有几个正常人假扮成精神病人进入精神病院，来了解医生和工作人员是否能把他们与真正的精神病人区别开。在所有关于心理学历史的书中都必须提及西格蒙德·弗洛伊德。因此，第二个研究是通过他的女儿安娜·弗洛伊德的著作来讨论弗洛伊德提出的“自我防御机制”这一经久不衰的概念。第三个研究是一个以狗为被试的实验，该研究阐释了一个被称为“习得性无助”的现象。这个研究与心理病理学的关联在于它引发了大量解释人类临床抑郁症的理论。第四个研究是一个极有趣的、非常有名的实验，它是关于过度拥挤的老鼠及由拥挤而导致的行为异常的研究，该实验可能对人类具有非常重要的启示作用。

研究29 究竟谁是疯子

Rosenhan, D.L (1973).Onbeingsaneininsane places.Science，179, 250-258

辨别“正常”行为和“异常”行为是心理学的基本任务。对异常行为的界定在决定一个人是否被诊断为精神病中起关键作用，并且诊断又在很大程度上决定病人接受的治疗。然而，区分正常与异常的界限并不像你所认为的那么清晰。所有的行为可以被看做是位于一个连续的轴上，正常或称为“有效的心理功能”位于一端，异常或“心理疾病”位于另一端。

在这个连续的轴上，决定人的一种特定行为在这个轴上所处的位置通常是精神卫生专业人员的责任。为了做这个决定，临床心理学家、精神病学家和其他行为科学家及临床医生可以应用下面的一条或多条标准。

·行为场合。这是一种主观判断，但你知道，某些行为在某个特定的情景中显然是古怪的，而在另一个特定情景中就没那么显眼。例如，你在院子里给草坪浇水没有什么古怪，而你在暴风雨中给草坪浇水就是行为古怪！判断行为古怪必须认真考虑行为发生的场合。

·行为持续存在。我们都曾有过疯狂的时刻。一个人有可能偶尔表现不正常行为，不一定证明他患了精神疾病。例如，当你正沿着一条繁华的商业街的人行道散步，你忽然收到了一些振奋人心的好消息，然后你忍不住跳起舞来，就这样经过了大约半个街区。尽管这种行为有些不正常，但并不表示你精神异常，除非你一直跳下去，每周或每天的大部分时间都是如此。因此，对精神疾病的这一诊断标准，要求一个古怪的、反社会的或失控的行为模式持续存在。

·社会偏差。当一个人的行为严重违反了社会期望和规范，这种行为就可能被认为是社会偏差。当偏差行为非常极端和持久，如幻听和幻视，就是精神病的证据。

·主观痛苦。我们通常知道自己的心理问题及其给我们带来的苦楚。当一个人是如此害怕封闭的环境，以至于他或她不能乘电梯，或者某些人发现自己不能与别人建立富有意义的人际关系，不需要专业人员的提醒，他们就清楚自己正处于心理痛苦之中。精神卫生专业人员做出心理诊断时，把主观痛苦看作是一种重要的指标。

·心理障碍。当一个人发现，由于心理问题他不能满意地生活了，这就可以被认为患了心理障碍。例如，一个人害怕成功，因此，生活中的每一次新的努力都会在某种程度上遭到他所患心理障碍的破坏。

·对功能的影响。一个人的问题行为对其过自己想要的或社会可接受的生活能力的干扰程度，可能是心理诊断中最为重要的因素。某种行为可以是古怪的、持续的，但如果它没有伤害你的生活功能，就不代表真正的病理特征。例如，假设你有一个不能控制的需要，即每天晚上睡觉之前，站在你的床上唱国歌。这种行为当然是古怪的和持续的，但除非你把邻居吵醒或干扰了家庭其他成员，否则你的行为只对你个人的一般生活功能有很小的影响。因此，它不能被归类为临床问题。

精神病的这些症状和特点，都依赖于心理学家、精神病学家和其他心理卫生专业人员的判断。因此，前面的指导标准存在两个问题：心理卫生专业人员真能区别精神疾病和精神健康吗？区别错误的后果是什么？大卫·罗森汉（David Rosenhan）在其著名的精神病院研究中对此进行了探讨。

理论假设

罗森汉的问题是：决定观察者（即做诊断的那些人）做出心理诊断的，究竟是由于病人本身具有的特征，还是病人所处的环境或场合。他推想，如果精神疾病诊断标准的制定和精神卫生专业人员所接受的诊断训练是恰当的，那么，专业人员应该能鉴别心智健全和心智不全（专业名词“心智健全”和“心智不全”是法律术语，心理学中不常用。这次之所以使用，是因为它们具备大众所通常理解的意义，因此罗森汉把它们引入他的研究之中）。罗森汉提出，一种检验能否正确鉴别潜在病人心理健康专业能力的方法是，让一些心理健康的正常人设法进入精神卫生机构，看看那些负责诊断的人员能否发现这些人实际上是心理健康的。如果这些假病人的行为在医院里和在日常生活中一样，且医务人员没发现他们是正常的，那么这证明在精神疾病诊断中环境因素的影响大于病人自身因素。

方法

罗森汉招募了8个被试（包括他自己）来做假病人。这8个假病人（3女、5男）由1名研究生、3名心理学家、1名小儿科医生、1名精神病学家、1名画家和1名家庭主妇组成。他们的主要任务是把自己送进12所精神病院，这些精神病院位于美国东海岸和西海岸的五个州。

所有的假病人都说相同的指导语：他们打电话到医院，并预约医生。到了医院后，他们说能听到“无意义的空洞”（empty）、“空闷的”（hollow）和“砰”（thud）等声音。除了这一个症状以外，所有被试的言行完全正常，并且给问诊者的信息都是真实的（除了他们为了隐藏研究目的而改变了自己的姓名和职业）。经过面谈，所有的被试被收入不同的医院。除一人外，其余均被诊断为精神分裂症。

一旦进入医院，所有被试不再表现任何伪装症状，而且行为正常。被试不知道自己什么时候能够出院。直到他们分别说服医务人员他们心理很正常，才得以离开医院。所有被试都把自己的经历记录下来。最初，他们只是偷偷在记，但不久就发现这种隐藏是没有必要的，因为“记录行为”本身被医务人员解释为他们疾病的另外一个症状。所有被试的目标都是尽早出院，所以，他们的行为表现像是模范病人，与医务人员合作，接受所有的药物治疗（但不把药物吞下去，而是扔到马桶里冲掉）。

结果

这些假病人的住院时间从7天到52天不等，平均住院时间为19天。在此研究中关键的发现是：没有一个假病人被医务人员识破。在出院时，他们的心理状况被称为“精神分裂症缓解期”，记录在他们的病历中。他们还记录下了其他有趣的发现和结果。

尽管医院的医生、护士和其他医务人员没能鉴别出假病人，其他真病人却不那么容易被欺骗。在假病人所在的三个医院中，118个真病人中的35人对被试表示怀疑。怀疑被试不是真正的精神病人。他们这样评论：“你不是疯子！你是记者或编辑，你们是来检查医院的！”

病人（无论被试还是真病人）与医务人员之间的交流是很少的，而且常常是怪怪的。这个研究中，通过假病人做的一个试验：接近不同的医务人员，通过问一般的、正常的问题试图与他们进行言语交流（如，我什么时候可以康复？或我什么时候可以出院？）。表8—1总结了他们得到的反应。

表8—1 医生和工作人员对假病人所提问题的反应

注：摘录自“On Being Sane in Insane Places, ” Science，179：255-258，1973.再印版获AAAS许可。

当假病人提问获得来自主治医师的回应时，常常有类似下面的对话形式：

假病人：“劳驾一下，医生，你是否能告诉我，我什么时候可以康复？”

精神病医生：“早上好，戴夫，你今天感觉如何？”

然后，医生不等待进一步的反应就继续往前走。

在医院研究中，与严重的人际交流缺乏形成鲜明对比的是，病人在药物方面从不短缺。这8个假病人在此研究中，医生共发给他们2100片药片，如前面所提到的，他们并没有吃下去。被试注意到，许多真正的病人也偷偷地把他们的药片扔到马桶里。

假病人讲到的另一个奇闻是，一个护士在满屋子全是男病人的休息室门前，解开制服的扣子，调整自己的胸罩。根据被试报告，这并不是她有意挑逗，她只是没有把精神病人当成真正的人看待。

讨论

罗森汉的研究有力地证明了，在医疗机构中，即使是受过专业训练的人员也常常不能将正常人和精神病人区分开来。根据罗森汉的研究，这是因为过于强大的精神病院环境影响了医务人员对某一个体行为的判断。一旦精神病人进入这种机构，医务人员往往会忽视病人的个体性。固有态度是：“如果他们来这儿，他们就一定是疯子。”更重要的是，像罗森汉指出的“贴诊断标签”，即当一个病人被贴上“精神分裂症”的标签后，这个诊断就成为他的核心特征或人格特质。从标签被贴上并被医务人员知晓的那一瞬间，医务人员就认为病人的所有行为都源于诊断标签。因此，他们对假病人的日记缺乏关注和怀疑，只是把它当成精神病标签的另一个行为证据。

医务人员倾向于忽略病人的环境压力，而把所有的行为视为与精神病特质相关。这里有一个证明，它来自一个被试的观察。

一个精神病学家指着许多离吃午饭还有半小时就坐在自助餐厅外的病人，对一群年轻的住院医生说，病人的等待行为就是“精神分裂症”症状中“口唇需求”（oral-acquisitive）症状的本质特征。他似乎没有想到，在精神病院里除了吃饭，几乎没有什么事儿可做。（P.253）

除此以外，那些诊断标签甚至还歪曲了对假病人的生活史的解释。请记住，所有的被试对自己的过去和家庭都给予诚实的说明。下面是一个来源于罗森汉研究的例子，关于一个假病人对他自己历史的陈述，以及在他出院以后医生在报告中对此所做的解释。被试的真实成长史如下：

童年早期，假病人与他的母亲有着密切的关系，而与父亲有些疏远。然而，从青少年时期开始，他与父亲成了亲密的朋友，而与母亲的关系变得冷淡了。他目前与妻子的关系亲密而融洽。除了偶尔争吵，冲突很少。孩子也极少挨打（P.253）。

医务人员对这一段相当正常且清白的历史的解释如下：

这名39岁的白人男子，在童年早期亲密关系方面显示了一个长时间的相当矛盾的历史。与母亲融洽的关系在青少年期变冷淡，与父亲关系的疏远则变得非常热切。缺乏感情的稳定性。他试图控制对妻子和孩子的情绪，但忍不住发脾气，打孩子。当他说他有几个好朋友时，让人感觉到一个相当矛盾的意识埋藏在这些关系中（P.253）。

应该指出，没有迹象表明医务人员的任何曲解是有意的，他相信诊断（此例指精神分裂症），并且对病人的生活史和行为的解释与诊断是相一致的。

研究发现的意义

罗森汉的研究震动了精神卫生专业领域，研究结果给出了两个关键因素：第一，它表明精神卫生机构不能将“心智健全”与“心智不全”区别开，正如罗森汉在他自己的文章中所讲到的：“医院本身就是一个特殊的环境，在这种环境中，行为的意义很容易被误解。结果，住院病人在这样一种环境中似乎无疑会对抗治疗”（P.257）；第二，罗森汉揭示了诊断标签的危险性。一个人一旦被贴上符合某个心理疾病的标签（如精神分裂症，抑郁症等），那个标签将掩盖他或她的所有其他特征。于是，所有行为和人格特征被看作是源于该精神障碍。这种做法最坏的影响是它可以变成自我证实，即当一个人在一段时间里被按照一定方式对待时，他或她的行为就可能开始变成被对待的那样。

罗森汉的研究除了提醒人们在诊断过程中要格外小心，也使人们认识到给病人贴标签的危险性。随着住院病人的减少，该研究强调的问题也有所减少。住院人数的下降是由于20世纪50年代抗精神病药物的发明和日益广泛应用引起的，药物的使用可有效减轻许多病人的症状，使他们能够在院外接受治疗，并生活在一个相对正常的环境里。与此并存的原因是社区精神卫生机构、危机干预中心和重视特殊问题且避免使用标签的行为疗法的发展。

但这并不意味着精神卫生专业人员已经取消了诊断标签。然而，在很大程度上，由于罗森汉的研究和其他相关研究，现在精神病标签的使用更加谨慎，而且人们对待标签时也充分考虑到它们的影响力。

问题和批评

当时，有一所研究和教学医院的医务人员在罗森汉的研究结果发表前听说了他的一些研究结果，并怀疑这些误诊出自他们医院。为了检验这一点，罗森汉通知该医院的工作人员，在接下来的三个月时间里，一个或多个假病人将会试图住进他们的精神病院。每一个医务人员都被要求用10点量表对当前的每个病人是假病人的可能性进行评定。三个月之后，该医院共收治了193人。其中41人被至少一个医务人员很自信地认为是假病人；23人被至少一个精神病专家怀疑是假病人；19人被一个精神病专家和另一个医务人员确认为假病人。罗森汉（这个狡猾的家伙）在这三个月的时间里，竟然没有派一个假病人去医院！“这个实验是有教育意义的”，罗森汉说，“它表明，当风险（在这里指声誉和诊断能力）很高的时候，将神志健全的人诊断为异常的倾向可以被反转。但存在一个不争的事实：任何一个诊断过程，本身很容易出这么多错时，它当然不是一个会让人很信赖的诊断过程。”（P.252）

罗森汉在1973年~1975年间，在12个医院重复了这项研究。每一次他都得到了相似的结果（见Greenberg，1981；Rosenhan，1975）。然而，其他研究者对罗森汉得出的结论提出了异议。斯皮策（Spitzer，1976）认为，尽管罗森汉所用的方法表明心理诊断系统是无效的，但事实并非如此。例如，通过说谎，假病人进入精神病院并不困难，因为准许入院是基于他们的口头报告（而且谁会怀疑有些人会使用欺骗的手段进入这种地方呢）。同理，你可以进入一个急救中心说自己腹痛，可能你就被诊断为得了胃肠炎、阑尾炎或胃溃疡而住院。斯皮策认为，虽然医生被欺骗了，但诊断方法并不是无效的。另外，斯皮策还指出，尽管假病人在入院后的行为正常，但是这种症状的变化在精神疾病中是常见的，也并不意味着医务人员不能诊断出欺骗行为就是无能的表现。

从1973年罗森汉的论文开始，有关心理诊断有效性的争论一直持续不断。不管还在持续的争论结果怎样，毫无疑问的是，罗森汉的研究在心理学历史上成为最有影响的心理学研究之一。

近期应用

为了说明这种持续性争论，我们将从众多应用罗森汉的研究、挑战由精神卫生专业人员制定的诊断标准有效性的研究中选取两个研究加以介绍。其中之一是托马斯·萨斯（ThomasSzasz）的研究。萨斯是一名精神病学家，在20世纪70年代早期，他已成为著名的精神病整体概念的批评家。他的观点是，精神疾病并不是病，而应该把它看成由社会和环境因素引起的“生活中的问题”。在一篇文章中，萨斯举例说明，一些被诊断为患有精神疾病的人表现出来的“疯言疯语”“并不是诊断一个人心智不全的有效证据”，这仅仅是因为一个人（精神卫生专业人员）不能理解另一个人（病人）（Szasz，1993，P.61）。

另一个研究建立在罗森汉1973年的研究基础上，这个研究探讨了在某些现实生活情境中，人们确实会故意装出某些精神问题的症状（Broughton & Chesterman，2001）。研究中讨论的案例是关于一个被控对一名十几岁的男孩进行性侵犯的男人，当对罪犯的精神病问题进行评估时，他表现出了各式各样的精神病行为。根据进一步的检查，临床学家发现他伪装了所有的症状。研究者指出，在诊断心理障碍时，精神卫生专家传统上先假定病人陈述的正确性（就像他们对罗森汉这些假病人所做的一样）。然而，他们认为这种伪装出来的症状，“对所有的精神病学家都是一个棘手的问题，特别是外在的社会法律问题可能成为伪造精神病症状的动机时，这个问题将变得更加复杂化”（P.407）。换句话说，我们不得不留心，防止罪犯以伪造的精神病症状作为“逃避坐牢的通行证”。

当精神病人被贴上诊断标签时，他们本人会体验到怎样的感受呢？沃尔（Wahl，1999）发起了一项研究调查了1300多名精神病人，询问他们对被歧视和污名的感受。大多数被试报告受精神疾病污名影响的感受来源于多个方面，其中包括一般公众、家庭成员、教友、同事、甚至精神健康专业人员。另外，作者写道：“大多数的被试倾向于试图隐瞒他们的疾病，并非常担心其他人发现自己的精神病身份而对自己不利。他们报告说，这种经历的结果是沮丧、痛心、气愤和低自尊。他们提出，进行公众教育是减少耻辱的手段。”（P.467）

一个名为“倾听我的疯狂”的相关研究的作者（Lester & Tritter，2005）指出，一个可能有助于我们理解精神疾病患者体验的方法是，通过类比现实社会中我们所感知到的其他类型的残疾来解释他们所受的伤害。研究者认为，重度精神疾病患者与现实社会的交往通常类似于那些接受治疗的其他残障人士。通过将残障模型应用于精神疾病，患者们将有更多机会获得他们所需要的服务与帮助。

结论

精神健康方面的专家希望我们的文化能够增加对精神病的宽容和理解。尽管在许多情况下，精神病的诊断仍旧既是艺术又是科学，但可以确定的是，诊断的能力在不断提升。有可能我们永远不会去除精神病标签；它们是有效治疗心理障碍的必要部分，就像疾病的名称是诊断和治疗躯体疾病的一部分一样。然而，如果我们被标签困扰（不开玩笑），我们必须为去掉由标签所引起的污名、困窘和羞愧而继续努力。

研究30 你将再次获得防御

Freud, A.(1946).The ego and the mechanisms of defense.New York: International Universities Press.

在任何一部涉及改变心理学研究的历史书中，有一个重要的人物很难被忽视，那就是西格蒙德·弗洛伊德（Sigmund Freud，1856-1939）。如果没有弗洛伊德的贡献，心理学就不大可能像今天我们所知道的这样。他使我们对人类行为的解释（特别是异常行为）从中邪着魔的非理性迷信，提高到推理和科学的理性取向。因此，如果对他的工作没有一个评介，这本书就是不完整的。现在，你可能要问自己，既然弗洛伊德这么重要，为什么这篇论述是关于他的女儿—安娜·弗洛伊德（Anna Freud，1895-1982）所著的一本书？要回答这个问题，需要一点儿解释。

虽然弗洛伊德的贡献在心理学历史中是不可或缺的，对于本书而言也同样如此。但是，要把他的研究和其他人的研究一起放在这里却很困难。这是由于弗洛伊德并不是通过界定清晰的科学方法论得出他的结论的。因此，就不能像本书介绍的其他人研究那样，选择一个单独的或一系列实验代表他的工作。弗洛伊德的理论是从他对病人细致的观察，以及几十年的临床分析基础上发展起来的。因此，至少可以说，他的著作很丰富。他的英译本著作集（Freud，1953 to 1974）共有24卷！很明显，在这里能讨论的只是他著作中很少的一部分。这里所选择的文章，是弗洛伊德理论中经过时间检验的、相对没有遭到抨击的部分。在过去的一个世纪，针对弗洛伊德的理论有大量的批评。特别是近50年，从科学的角度看，他的工作受到了严重的质疑。批评者们认为，他的许多理论不能被科学所检验，或者即使能被检验，也被证明是不成立的。因此，尽管没有人怀疑弗洛伊德工作的历史重要性，但当今绝大多数的心理学家对他的人格结构理论、人格的性欲发展五阶段理论和人们心理问题的根源理论持否定态度。然而，他在某些方面的工作多年来一直得到积极的评论，目前已被相对广泛地接受。其中之一就是他的“自我防御机制”的概念。这是自我用以抵御自身产生焦虑的心理“武器”。本书收录了弗洛伊德著作中的这部分内容来代表他的工作。

西格蒙德·弗洛伊德发现的自我防御机制，是在他30多年解决心理问题的经历中逐渐发展起来的。在西格蒙德·弗洛伊德众多著作中，都没有对防御机制进行独立的系统、全面的论述。事实上，弗洛伊德把他的这项工作交由他的女儿完成，他女儿在自己的领域，特别是帮助儿童方面也是一位重要的精神分析专家。在1936年安娜的《自我和防御机制》一书第一次在德国出版之前，弗洛伊德承认了这个事实。他写道：“有大量的方法（或我们所说的机制）被自我用来执行防御功能。我的女儿——儿童分析家写了一本与此有关的书。”（S.Freud，1936）因此，是安娜·弗洛伊德把她父亲关于防御机制的理论整合成了一本书，我们对此书进行了节选，以此展开对弗洛伊德工作的讨论。

理论假设

为了检验弗洛伊德的防御机制的概念，我们应该简单介绍一下他的人格结构理论。弗洛伊德假设，人格由三部分组成：本我、自我和超我。

在弗洛伊德的观点中，本我（id，是“it”的拉丁文简写）自出生时就有，是由人的基本生物冲动和本能组成，如饥饿、渴和性的冲动。每当这种需要得不到满足，自我都会产生强烈的信号使人找到办法满足它，并且立即这样做！本我按弗洛伊德所说的“快乐原则”行动，意味着它坚持要求即刻满足所有的欲望，不顾道德、安全、逻辑、理性等一切因素。弗洛伊德认为，存在于每个人本我中的那些黑暗的、反社会的、危险的本能冲动（特别是性冲动）会不断地寻求表现。因为本我在无意识水平运行，因此人们通常不能意识到它。然而，如果你缺乏人格中的其他部分而只有本我，弗洛伊德会预期你的行为将是不道德的、有严重的偏差或越轨，甚至对自己和别人都是致命的。

在弗洛伊德的观点中，你没有按这些危险的、越轨的方式去行动的原因，是靠你的自我和超我的发展来限制和控制本我的冲动。按照弗洛伊德的解释，自我（ego）按“现实原则”行动，即它关注现实社会和行为的结果。自我是有意识的，其工作是让本我的欲望得到满足，但是要用理性的和相对安全的方式来实现。然而，自我也受超我（superego，意思是“在自我之上”）的限制。你的超我，实质上要求自我根据已有的一套关于是非对错的准则，找到合乎道德和伦理的解决方案来满足本我的需要。弗洛伊德认为，这些道德准则是由你的父母逐渐灌输给你的，并且如果你的行为方式违反了这些准则，你的超我会用它非常有效的武器惩罚你：那就是内疚。你认出超我了吗？它就是我们通常所说的良心。弗洛伊德认为超我在意识水平和无意识两个水平上发挥作用。

弗洛伊德的人格观是一个动态的，即自我不断地试图平衡本我的需要、欲望和超我的道德要求，从而决定你的行为。接下来的这个例子说明了它是怎样工作的。想象一下，一个年轻人在一个小镇的街上漫步。时间是晚上10点钟，他正在回家的路上。突然，他意识到自己饿了，在路过一个杂货店时，他看到在一个大的橱窗里有食物，但店门已关。他的本我可能说：“看，食物！跳过橱窗拿一些。”（记住，本我想立刻满足而不顾后果）他可能没有意识到本我的建议，因为它们在意识水平之下。自我可能“听到”了这些，不过，因为它的工作是保护男孩不受危险，它可能回答：“不，那将是危险的，让我们绕到后面，破门而入，偷些食物吧！”这时，超我将表达它的愤怒：“你不能那样做，那是不道德的，如果你那样做，我将惩罚你！”因此，这个年轻人的自我重新考虑并提了一个新建议，那是本我和超我都能接受的。“你知道，穿过四条街有一个通宵快餐店，我们去那儿买点食物吧！”假定这个男孩的心理是健康的，这就是最终反应在行为上的解决方法。

按照弗洛伊德的解释，大多数人不存在行为上的反社会或越轨行为，是因为在人格三部分之间有这个检查和平衡系统。但如果这个系统发生故障，即平衡丧失，会发生什么？可能发生的一种情况是本我的要求太强烈而自我不能充分地控制。如果不被接受的本我欲望挤进你的意识（弗洛伊德称为前意识），并开始击败你的自我，会发生什么情况？弗洛伊德认为，如果这种事情发生，你将经历一种非常不愉快的、被称为焦虑的情况，特别是他所说的游离性焦虑，虽然你感到焦虑和害怕，但你不知道为什么会有这种感觉，因为产生焦虑的原因并没有完全进入意识。

当这种焦虑状态存在时，人就不舒服，会试图改变它。要做这件事情，自我要拿起它的所谓的“自我防御机制”的“大枪”。防御机制的目的是阻止本我被禁止的冲动进入意识。如果自我成功，由本我的冲动引起的焦虑不适将缓解。防御机制通过自我欺骗和歪曲事实，使本我的欲望没有得到承认，由此避开了焦虑。

方法

弗洛伊德声称这是他多年在与自己的病人的临床交往中逐渐发现了防御机制。自从西格蒙德·弗洛伊德去世和安娜·弗洛伊德的书出版之后的这么多年来，防御机制的解释又得到了进一步完善。下文中有关防御机制的摘要是得到西格蒙德·弗洛伊德认可并又被他女儿精细化了的内容。

结果和讨论

安娜·弗洛伊德（P.44）确定了她父亲曾描述过的10种防御机制。在此将讨论今天常被使用和认可的五种原始防御机制：压抑（repression）、退行（regression）、投射（projection）、反向形成（reaction formation）和升华（sublimation）。请记住，防御机制的基本功能是改变现实以避免焦虑。

压抑

压抑是我们所使用的保护自我的最基本、最常用的防御机制。在弗洛伊德早期著作中，他把“压抑”和“防御”这两个概念互用，并且把压抑解释为重要的、唯一的防御机制。后来，他承认压抑是许多有效防止焦虑的心理过程之一。弗洛伊德认为，个体使用压抑可以完全把烦恼冲动挤出意识层。因此，与“被禁止的”想法相联的焦虑就可避免，因为人们根本就没有意识到它们的存在。按照弗洛伊德的观点，压抑通常被用来抵御由不可接受的性欲望产生的焦虑。例如，一个妇女对他的父亲有性欲的感觉，如果她意识到这种冲动，她将表现出强烈的焦虑。为了避免焦虑，她可能压抑她的不可接受的性欲望，迫使它们全部进入无意识。这并不意味着她的欲望消失了，只是因为它们被压抑而不能产生焦虑。

你可能觉得奇怪，如果这些想法存在于无意识之中，又怎么会被发现？根据弗洛伊德的解释，这些隐藏的冲突可以通过口误、梦、自由联想或催眠术等精神分析的各种技术（如自由联想或催眠术）被揭示出来。此外，压抑的欲望可产生心理问题，并以神经症的形式表现出来。例如，上面提到的那个妇女压抑了对父亲的性欲望。她可能以另外的形式表达了这种冲动，即她无意识中试图解除对父亲的情感冲突，而不断地陷入与男性的失败关系。

退行

退行是一种被自我用来防止焦虑的防御机制。这种防御使人退回到发展的早期阶段中那种要求很少和相对安全的行为。通常，当第二个孩子来到一个家庭，大孩子将退行，用小孩子的说话方式，想要奶瓶甚至尿床。成人也可能用退行机制。想一想，一个男人感受到了“中年危机”（midlife crisis），他害怕变老和死去，为了避免与这些无意识恐惧相联的焦虑，他可能退行到青年时期，变得不负责任，开赛车兜风，试着与年轻女性约会，甚至是吃儿童的食品。另一个退行的例子是，每当婚姻中出现问题时，已婚的成人就会搬回家跟妈妈住。

投射

想象一下你的自我正被你的本我挑战。虽然你不知道为什么，但你感到非常焦虑。如果你的自我用投射机制消除焦虑，你将从别人的行为中看到你无意识的欲望，即你把你的冲动投射到别人身上。理论上，这样可以把引起焦虑的感觉外化，进而减少焦虑。你将不会意识到你做的这些，而被你投射的人也不可能因你的谴责而有罪恶感。安娜举的一个例子是：一位丈夫有了对他妻子不忠的冲动（P.120），他可能甚至没有意识到这种欲望，但这种欲望从他的本我不知不觉地爬上来，并引起焦虑。为了防止焦虑，丈夫把他的欲望投射给他妻子，变得善妒，谴责她有外遇，即使没有证据支持他的谴责。另一个例子是，一位妇女害怕变老，开始指出她的朋友和熟人看起来多么老。这些例子中的个体并不是在表演或说谎，而是真实地相信他们的投射。如果他们不这样想，对焦虑的防御将会失败。

反向形成

弗洛伊德用莎士比亚的《哈姆雷特》中的一句话来举例说明反向形成的防御机制。当哈姆雷特的妈妈看完演出的一幕，对哈姆雷特说：“我认为，这个女士申辩得太多了”。当一个人感受到不可接受的、无意识中的“邪恶”冲动，为了避免这些所引起的焦虑，人们表现出与本我真实欲望相反的行为。安娜指出，这些行为通常是夸张的，甚至是过分的。人们采取表面的、完全没有本我真实欲望的态度和行为来阻止焦虑。除非本我和自我的冲突以某种方式解决，否则，反向形成倾向于成为个体人格的永久的部分。举这样一个例子，再想一想刚才那个丈夫，他潜意识里想得到别的女人，如果他是用反向形成而不是用投射来防止焦虑，那么他会变得过度殷勤地对待他的妻子，并送她礼物，宣布他忠贞不移的爱情。另一个例子来自于被称为“怒殴同性恋”（gay bashing）暴力犯罪的令人不安的新闻报道。按照弗洛伊德的解释，一个体验到无意识的同性恋欲望（这种欲望是他所恐惧的，因为社会不认同同性恋取向）的男人，可能会有这种攻击或打击同性恋的极端反向的行为，以掩藏他真实的欲望和与此相联的焦虑（这个概念在后面部分中会进一步讨论）。

升华

西格蒙德·弗洛伊德和安娜·弗洛伊德两人都把大多数防御机制，包括之前描述的四种，作为心理调适有问题（神经症）的指标。相反，他们不但把升华这种防御机制看作是正常的，而且是值得利用的。当人们使用升华机制，他们就找到了以社会认可的方式来转化无意识中被禁止的欲望所产生的焦虑的能量。西格蒙德·弗洛伊德主张既然每个人的本我都包含这些欲望，升华就是多彩和健康生活所必需的一部分。另外他相信，那些最强烈的欲望可用不同的方式升华。某个人有强烈的攻击冲动，可以通过参加对抗运动或成为外科医生来得到升华；一个小女孩喜欢骑马，可以解释为不可接受的性欲望的升华；一个好带着色情的目光注视人体的男人，可以通过成为一名裸体像画家或雕塑家来升华他的感情。

弗洛伊德提出，所有被我们称之为“文明”的现象都可能是通过升华机制而来的。按照他的观点，人类可以升华他们原始的、生物性的欲望和冲动，引导他们转向建设文明的社会。然而，弗洛伊德认为，有时人类的无意识的力量会击败我们的“集体自我”（collective ego），而这些原始的、兽性的欲望就会以不文明的、野蛮的形式爆发出来，例如战争。但是，不管怎样，也只有通过升华，文明才能存在（S.Freud，1936）。

意义及近期应用

虽然安娜·弗洛伊德在她的书中清楚地写道，防御机制的使用常常与神经症行为并存，但情况并不总是如此。几乎每个人在他的生活中都会不时地应用各种防御机制，尤其是帮助他们应对压力增加的时期。防御机制帮助我们减少焦虑，保持一个积极的自我意象。某些防御机制的使用甚至被证明可以减少非健康的心理活动。例如，一项研究发现投射防御机制的使用与血压的降低相关（Cramer，2003）。不过，防御机制包含了自我欺骗和歪曲事实，如果过度使用，会产生消极的结果。例如，一个人每次都用退行机制，生活中的难题就会越积越多，他可能永远都不会自己采用必要的策略去处理问题和解决问题。结果，他作为一个整体人的发展会被抑制。而且，弗洛伊德和许多其他心理学家主张，当某些特定冲突引起的焦虑被压抑后，它就会在某些时候以其他形式表现出来，如恐怖症、惊恐发作或强迫症。

当下，绝大多数研究者对弗洛伊德大部分的理论都有所质疑，包括他的自我防御机制的概念。防御机制真的存在吗？真的能通过阻止本我的冲动来阻止焦虑的产生吗？也许最常引证的对于弗洛伊德所有工作的批评是：说得好听一点是很难科学地验证它；通常的批评则是不可能科学验证它。许多研究试图清楚地证明弗洛伊德的各种概念的存在。研究结果是多种多样的，其中一些观点已经得到一些科学的验证（见Cramer，2007），而另一些被证伪，还有一些无法进行科学研究（见Fisher & Greenberg，1977，1995）。

有一项吸引人的研究所得到的支持性证据来自于同性恋恐怖症（homophobia），即某些异性恋者所表现的对男同性恋和女同性恋的不合理的恐惧、回避和偏见，其实可以被看作是一种反向形成，即为了避免由自我压抑的同性恋倾向引起极端的焦虑所采用的防御机制（Adams，Wright & Lohr，1996）。在这个研究中，一组男性接受一种评估同性恋恐怖症水平的纸笔测验，然后被分成两组：同性恋恐怖症组和非同性恋恐怖症组。接着，所有的被试观看描述异性恋、男同性恋或女同性恋表演性活动的录像，当他们观看这些录像的时候，同时监测他们性唤起的生理信号。两组被试唯一的不同是，他们观看男同性恋的录像时的生理情况。“结果显示，同性恋恐怖症的男性在性唤起方面表现明显增加，而非同性恋恐怖症的男性没有这些表现。”（P.443）事实上，当观看男性同性恋的录像时，非同性恋恐怖症组中66%的被试没有明显的性唤起信号，而同性恋恐怖症组仅有20%的被试表现出很低的性唤起，或没有明显的唤起信号。而且，当要求同性恋恐怖症组的男性主观评价自己的性唤起水平时，他们低估了自己在对同性恋录像中的性唤起的水平。这项研究结果与安娜·弗洛伊德对反向形成的描述相吻合。同时，也为暴力反对同性恋的可能解释提供了支持。

结论

从本文中的研究中可以看出，心理学家对防御机制的科学兴趣在各分支学科不断增加，包括认知心理学、人类发展心理学、人格心理学和社会心理学（参见Cramer，2000）。通过对防御机制的认识和了解，你对人们行为原因的洞察能力将明显提高。如果你在自己的头脑中保存一份防御机制的条目表，你就可以开始在别人或自己身上发现它们。顺便说一下，如果你认为某人正在使用防御机制，记住，他或她这样做的原因是为了避免令人讨厌的焦虑。所以，提醒他们注意到这一点可能并不是一个好主意。虽然在你与别人的交往中，防御机制的知识是一个强有力的工具，但必须小心、谨慎地使用这些知识。

通过详细查看近期关于心理分析理论的主要学术著作，你会很容易地体验到安娜·弗洛伊德对她父亲的那些防御机制概念的综合、分析对你的持久影响。的确，你所看到的大多数的弗洛伊德的引证都与西格蒙德有关。但是，当讨论转向防御机制时，安娜·弗洛伊德在1946年出版的书及其各种修订本被认为是论述此话题的权威性著作。

研究31 习得性抑郁

Seligman, M.E.P., & Maier, S.F.(1967).Failure to escape traumatic shock.Journal of Experimental Psychology, 74，1-9

如果你和大多数人一样，你就会期望你的行为产生特定的结果。你的预期既会使你的行为朝着令人满意的结果迈进，又会尽量避免令人失望的结果。换句话说，你的行为至少部分由一种信念所决定，即你相信自己的行为会产生某种后果，而这种后果与行为有对应关系。

让我们设想一下，假如你不喜欢现在的工作，于是你开始着手准备换个工作。你与周围的熟人联系，翻阅你感兴趣的招聘广告，为获取新的技能参加业余培训，等等。所有这些行为都由你的信念所引发，即你的努力最终会给你带来好工作和幸福的生活。人际关系也是如此，如果你正处于一种不良的人际关系中，这种人际关系带有侮辱性或使你不愉快，你将希望采取必要的行动改变它或终止它，因为你期望成功地建立一种令人满意的人际关系。

所有这些都与能力和控制力有关。许多人相信自己有足够的能力，并能控制发生在他们身上的一切，至少在有些时候是这样，因为他们在过去曾对某些情况进行过控制并取得了成功。他们相信能够通过自己的努力而达到目标。如果一个人觉得自己缺乏能力和控制力，那么剩下的就只有无助和绝望了。如果你感到自己被一份不满意的工作所困扰，却又找不到另一份工作，或不能学习新技术来提高自己的职业水平，那么你将不太可能为改变工作而作出必要的努力。如果你太依赖某人，而你与他的关系已经破裂，又觉得无力去修复或结束它，那么你便只能无奈地处于这种关系中并忍受煎熬。

能力与控制的知觉对身心健康是非常重要的（参见研究20中兰格和罗丁关于养老院中老年人自制力的研究讨论）。想象一下，如果你突然发现自己不再有使生活发生改变的能力和控制力，在你身上发生的事情与你的行为无关，你将有何感受？你可能将感到无助和无望，并且放弃一切尝试。换句话说，你将变得抑郁。

马丁·塞里格曼（Martin Seligman）是非常著名和有影响力的行为心理学家。他认为，我们对能力和控制的知觉是从经验中习得的。他相信，当一个人控制特定事件的努力遭受多次失败后，他（或她）将停止这种尝试。如果这种情形出现得太过频繁，这个人就会把这种控制缺失的知觉泛化到所有的情景中，甚至泛化到实际上能控制的情况下。于是，他（或她）开始感到自己像一颗“命运的棋子”（pawn of fate）任人摆布，无助而抑郁，塞里格曼把这种抑郁的产生原因称为“习得性无助”（learned helplessness）。塞里格曼在宾夕法尼亚大学以狗为被试，通过一系列现在被视为经典的实验，发展了他的理论。我们下面将要讨论的这项研究由马丁·塞里格曼与史蒂文·梅尔（Steven Maier）共同完成，它被认为是对其理论有决定性作用的最早论据。

理论假设

塞里格曼从一项有关学习的早期实验中获悉，狗在受到既不能控制也无法逃脱的电击一段时间后，即便逃离的机会唾手可得，也学不会逃走。你想一想，这在一个行为主义者看来是多么奇怪的事情。在实验室中，对狗的惩罚是电击，但这种电击不会对其构成伤害。然后，把狗放在一个“梭箱”（shuttle box）里，那是一个大箱子，由一块隔板分割为两部分。在箱子一边的地板上通电。狗感到箱子的一边有电流时，便只需越过隔板，跳到箱子的另一边即可避开电击。通常，狗和其他动物都能很快学会这种逃脱行为（不难看出其中的原因）。事实上，如果有一个信号（如一个闪光灯或一个蜂鸣器）警告狗电流即将来临，狗将学会在电击前跳过隔板而完全避开它。然而，在塞里格曼的实验中，在梭箱里的狗在经历无法逃脱的电击后，它们就学不会这种“逃脱—回避”（escape–avoidance）的行为了。

塞里格曼的理论认为，动物在学习控制不愉快刺激的过程中存在着某些因素，这些因素决定了它们后来的学习。换句话说，这些狗在先前的电击经历中已经懂得自己的行为不能改变电击结果。因此，当它们处于新的环境中时，即便它们有能力逃脱——做出控制行为——它们也会放弃。它们已习得了无助感。

为了检验该理论，塞里格曼和梅尔计划研究可控电击与不可控电击如何对后来学习回避电击产生影响。

方法

该研究是本书中几个用动物作被试的经典研究之一。而该研究所引起的关于动物研究的伦理问题，可能比其他几项研究都要多。为了检验一种心理学理论，就要让狗忍受令其痛苦的电击（虽然没有身体上的伤害）。这种做法在伦理上是否恰当，是每个研究者和心理学学习者必须面对的问题（这个问题我们将在讨论塞里格曼的研究结果后再进行论述）。

实验的被试是24只“杂交犬，它们肩高15~19英寸，体重25~29英磅”（P.2）。它们被分为3组，每组8只。一组是“可逃脱组”，另一组是“不可逃脱组”，第三组是“无束缚的控制组”。

可逃脱组的狗和不可逃脱组的狗均被单独安置并套上狗套，这种套子与巴甫洛夫设计的实验装置相似（参见研究9中对巴甫洛夫实验方法的论述）；虽然狗受到约束，但并不是完全不能移动。在狗头部的两边各有一个鞍垫（panel），以保持头部面朝正前方。狗可移动头部，以挤压两边的鞍垫。可逃脱组的狗受到电击后，它可以通过挤压头部两边的鞍垫终止电击。不可逃脱组的狗与可逃脱组的狗一一配对（这是一种称为“匹配”的实验程序），然后在同一时间给每一对狗施加完全相同的电击，但不可逃脱组的狗不能控制电击。无论这些狗做什么，电击都将持续，直到可逃脱组的狗挤压鞍垫终止电击为止。这样就能确保两组狗接受电击的时间和强度完全相同，其唯一不同的是一组狗有能力终止电击，而另一组却不能。8只控制组的狗在实验的这一阶段不接受任何电击。

可逃脱组的狗和不可逃脱组的狗在90秒的时间里均接受了64次电击。可逃脱组的狗很快学会了挤压旁边的鞍垫来终止电击（既为它们自己，又为不可逃脱组）。24小时以后，所有的狗被放入前面所述的梭箱中，箱子两边都安装有灯，当箱子一边的灯光熄灭时，电流将在10秒种后通过箱子的底部。如果狗在10秒内跳过隔板，它就能完全避免电击。如果不这样做，它将持续遭受电击，直到它跳过隔板，或直到60秒钟电击结束。每只狗在此梭箱中进行10次试验。

研究者根据以下指标对学习程度进行了测量：（a）从灯光熄灭到狗跳过隔板平均需要多长时间；（b）完全没有学会逃脱电击的狗在每组中所占的比率。另外，7天后不可逃脱组的狗在梭箱中再次接受10次额外测试，以评价该实验处理的持续效果。

结果

在64次电击的过程中，可逃脱组的狗用于挤压鞍垫并停止电击的时间迅速缩短；而不可逃脱组的挤压鞍垫行为在30次尝试后便完全停止。

图8—1表示了在梭箱中进行的全部实验中，三组狗逃脱所用的平均时间。记住，这个时间是指灯光熄灭到狗跳过隔板之间的时间。可以看出，不可逃脱组的狗与其他两组间的狗存在显著差异；但可逃脱组的狗与控制组的狗之间的差异无显著性。图8—2表示10次尝试中至少9次不能跳过隔板并避免电击的狗在每组中所占的比率。可逃脱组的狗与不可逃脱组的狗之间也存在非常显著的差异。不可逃脱组中有6只狗在9次甚至全部10次实验中完全失败。7天后，这6只狗被放入梭箱中再次进行测试；结果，6只狗中的5只没能在任何一次试验中逃脱电击。

图8—1 在梭箱中成功逃避所需的

（引自P.3）

图8—2 在梭箱中被试未成功习得逃避电击的百分比

（引自P.3）

讨论

因为可逃脱组的狗与不可逃脱组的狗之间唯一的不同是：狗能否主动终止电击。因此，塞里格曼和梅尔得出结论认为，一定是这种控制因素导致了两组狗在梭箱中学习逃脱电击时表现出明显不同。换句话说，可逃脱组的狗在梭箱中能正常学会新技能的原因是，它们在前一阶段已习得自己的行为与电击终止之间存在相关。因此，它们能主动地跳过隔板并逃脱电击。而不可逃脱组的狗在前一阶段的行为与电击的终止毫无干系。因此，在梭箱中它们并不认为自己的行为能终止电击，故不会主动尝试逃脱。正如塞里格曼和梅尔所预言的，它们习得了无助感。

偶然地，不可逃脱组的一只狗在梭箱中做了一次成功的逃脱。然而，在下一次试验中，它又恢复到无助状态。塞里格曼和梅尔对此的解释是，即便是在一次成功的经历之后，前一阶段的无效行为依旧阻止它们在新的情境（梭箱）中形成终止电击的新行为方式（跳过隔板）。

塞里格曼和梅尔在后继的实验中报告了另一些有趣的发现。在第二项研究中，首先将狗放置在可逃脱的情境下，在此情境下，狗可挤压鞍垫以终止电击，然后将其转移到不可逃脱的条件下，最后将狗放入梭箱中接受10次实验。处于不可逃脱条件下时，狗不断尝试挤压鞍垫，并没有像在第一项研究中的狗那么快地放弃了尝试。而且，它们在梭箱中都成功地学会了逃脱和回避电击。这表明，一旦动物习得了有效的行为，随后的失败经历不足以消除它们改变自己命运的动机。

后续研究

当然，塞里格曼也想做你可能已经在脑子里进行的事情：把这些研究结果应用于人类。在随后的研究中，他声称人类的抑郁发展与动物习得性无助的形成过程非常相似。在这两种情形下，他们（它们）都表现出被动、消极、坐以待毙、缺乏进取心、学习某些成功行为极为缓慢、体重减少和社会性退缩等行为。无助的狗和抑郁的人都认为从以往的特殊经历中习得自己的行为是徒劳的。无论狗做什么，它都无法逃脱电击；而人也有无法控制的事件，如爱人的去世、父母的粗暴、失业或严重的疾病（Seligman，1975）。

习得性无助导致的人类抑郁可以产生比抑郁本身更严重的后果。研究表明，许多老年人，像生活在养老院中的老人，由于各种原因而失去了对自己日常生活的控制力，他们的健康状况比那些能保持这种控制力的老人差，死亡的概率也更大。另外，一些研究也表明，不受人力控制的应激事件在诸如癌症这样的严重疾病的形成中起重要的作用。一项研究发现，在过去的几年中遭受丧偶、失业、失去威望等事件都将增加一个人的癌症患病概率（Horn & Picard，1979）。在医院里，医生和其他医务人员都希望病人能心平气和地配合医生，心甘情愿地把自己的命运交到这些医学权威的手中。病人认为他们想要尽快康复，就必须完全听从医生和护士的指导。一位著名的健康心理学家曾指出，做一名“好的住院病人”意味着病人必然是被动的，而且必须放弃所有控制力。这其实是为病人创造了一种习得性无助的境况，此后即使控制力有可能对继续康复起作用，这些病人也已丧失了使用控制力的能力（Taylor，1979）。

由芬克尔斯坦和雷米（Finkelstein & Ramey，1977）完成的一项引人注目的研究可作为习得性无助的进一步证据。研究者在所有婴儿床的上方架设旋转的可动装置（rotating mobiles）。有一组婴儿，其头枕着对压力敏感的（pressure-sensitive）特制枕头，以便他们可以通过转动头部来控制可动装置的旋转。另一组婴儿，其床的上方虽然有同样的可动装置，但它们被设定为随机旋转，不受婴儿的任何控制。可控制枕头组的婴儿每天有10分钟时间接触这种可动装置。经过两周，这组婴儿掌握了非常熟练的技术，通过转动自己的头使可动装置旋转。然而，更重要的发现接踵而来——后来实验者把不可控制枕头组的枕头全换成可控制的，并给予这组婴儿比第一组更多的学习时间，他们却全都无法学会控制可动装置。第一种情境下的经历已使这些婴儿了解到自己的行为是无效的，并且这种认识迁移到可控制的新情境下。对于可动装置，婴儿们已习得了无助。

近期应用

塞里格曼关于习得性无助的研究一直影响着当代的研究，并在许多领域引起争论。其他一些研究者致力于增加我们对个人控制力在生活事件中的重要性的认识，塞里格曼的观点与这些研究者的相吻合。

关于这种广泛影响的一个非常糟糕的例子是恐怖袭击引发的大面积恐慌和之后的“反恐战争”。2001年9月11日发生了对美国世贸中心和五角大楼的恐怖袭击。这些恐怖事件产生的心理上的影响在美国和全世界范围内蔓延。这些症状包括持续增长的焦虑、愤怒、紧张、酒精滥用、对外部事件控制感丧失以及无助感（CDC，2002）。事实上，恐怖分子的袭击目的之一就是让人们产生脆弱和无助感。一位临床心理学家对袭击后的影响作出如下总结：

恐怖主义威胁为焦虑和抑郁的出现营造了标准的心理氛围。心理学家称之为“预期焦虑”，就像谚语中描述的那样，一直在等待另外一只鞋掉下来。现在这个情况下即是等待恐怖分子的炸弹爆炸。加上“习得性无助”这个成分，即面对阻止恐怖主义，你意识到自己能做的很少或者什么也做不了，会使抑郁、易受伤害、控制感缺失进一步加剧。这些正好是自“9·11”袭击事件后，我们大家所感受到的状态。这些就是“新常态”和“9·11综合征”的特征（Braikery2002）。

有趣的是，近期的一个研究表明，间接地体验到创伤性事件，经过一段时间后，可能会有一些心理获益（Swickert等，2006）。尽管作者没有否认或轻视“9·11”事件目击者所经受的极度痛苦所带来的心理影响，但他们指出在一些个体身上存在着相反的结果，这些人被称为创伤后成长。研究者指出，以往的研究假定“当人们对自己、他人和将来的基本假设受到挑战时，会出现创伤后成长。作为对这个挑战的回应，心理受创伤的个体可能会试图从他们的经历中寻找意义。因此，有些人常会发现他们从创伤事件中获益”（P.566）。你可能会问，这种经历会产生哪些可能的益处？作者指出，另一个研究已经给出答案。在经历“9·11”事件后，个体的一系列积极特征都有所增强，其中包括感激、希望、仁慈、领导力、爱、灵性和团队合作。研究者说，那些间接目击了袭击的人在事件发生不久后报告了相似的获益，但这些影响会随着时间的流逝而减弱。

结论

现在，我们再回到实验的伦理问题上。对我们中的大多数人而言，读到在心理学实验室中用动物，特别是把狗或其他常成为我们宠物的动物作为被试进行电击实验是很难接受的。在过去的许多年中，实验的伦理标准已得到发展，以确保实验者更人道地对待动物（参见本书前言中就该问题的论述）。然而，在科学领域内外，还有许多人认为这些标准是不够的。一些人提倡在心理学界、医学界和所有的科学界彻底取缔以动物为被试的研究。在此问题上，无论你的个人立场如何，你应该思考的问题是，这些研究的结果是否扩展了我们的知识，减轻了人类的痛苦，并提高了人们的生活质量，所有这些收益是否足以为其所用方法的合理性进行充分辩护？

就塞里格曼和梅尔的这项研究，请你自己思考一下以上这些问题。他们的研究创立了解释为什么有些人变得无助、无望和抑郁的理论。塞里格曼随后继续发展了一种被人们广泛接受的治疗抑郁的模式和方法。他的理论经过多年的不断完善和补充，现已能对在明确界定的条件下发生的抑郁进行更精确的治疗，比如爱人的死亡、重大的自然和人为灾难。

例如，通过塞里格曼的研究，我们现在了解到，如果个体学会把自己的控制力缺失归因于：（a）永久性的，而不是暂时性的；（b）自己的内在人格因素（而不是情境因素）；（c）渗透到他们生活中的许多方面（参见Abramson，Seligman, & Teasdale，1978），那么，个体最有可能变得抑郁。认识到这些后，治疗师和咨询师就能更好地理解、干预和治疗严重的抑郁症病人了。

这些知识能否表明在习得性无助的早期研究中采用的方法是合理的呢？这个棘手的问题就由你自己来决定吧！

研究32 拥挤导致行为失常

Calhoun, J.B.(1962).Population density and social pathology.Scientific American, 206，139-148.

近几十年来，拥挤对行为的影响始终令心理学家很感兴趣。可能你也注意到，当自己身处拥挤的人群中时，你的情绪和行为会有所变化。你变得孤单离群、不引人注目，或是想法儿抽身离开，抑或是变得易激惹和好攻击。

本章中这篇研究报告在题目中用了“人口密度”（population density）一词，而没有用“拥挤”（crowding）。这两个词看起来很相似，但心理学家对两者有明确的区分。人口密度被定义为一定空间内个体的数量。如果一间12×12英尺的房间内有20个人，这房间就被认为是人口密度很高。而拥挤则是由不同程度的密度造成的个体主观体验。如果你试图专心于一项困难的任务，而却与20个人待在这样一间屋子里，这时你可能感到太拥挤了；相反，如果你在上述同样的房间里与20位朋友聚会，你可能一点也不感到拥挤。

行为学家研究密度和拥挤效应的一种方法是，观察那些已经很拥挤的地方，如曼哈顿、墨西哥城、某些住宅区和监狱等。用这种方法进行研究的问题是，在这些地方除了人口密度外，还有许多其他因素也会影响行为。例如，如果我们发现在一个拥挤的贫民窟犯罪率很高，我们无法断言拥挤就是犯罪发生的原因，可能是贫穷，可能是吸毒率较高，也可能是所有这些及其他因素与拥挤因素共同导致了高犯罪率。

另一种研究拥挤的方法是让人类被试在高密度条件下待较短的一段时间，并研究他们的行为反应。如果是让被试长时间处于该状况则是不符合伦理的。尽管采用这种方法，研究者可以控制更多因素，并分离出拥挤这一因素对行为产生的影响，但这与现实中拥挤的生活环境相比，它还不是很真实，因为现实中的拥挤往往持续很长一段时间。然而，这两种研究方法都得到了关于拥挤的一些有趣的发现，我们稍后将在本文中对此进行讨论。

只为研究的需要而让人长时间处于拥挤环境中，这在伦理学上是不可行的（因为存在应激和其他潜在的损伤后果），因此研究者们使用了第三种方法来研究密度的影响：用动物作被试进行研究（参见前言部分关于动物研究的论述）。这类研究中最早最关键的系列研究之一是由约翰·B·卡尔霍恩（John B Calhoun，1917~1995）在20世纪60年代早期年进行的。卡尔霍恩让几组白鼠的数量增加到在狭小空间中正常数量的2倍（靠它们自己繁殖），然后观察它们在这一环境中存活16个月所表现出来的“社会”行为。

理论假设

卡尔霍恩特别想了解高人口密度对社会行为的影响。虽然把白鼠看作社会性动物对你来说似乎有点奇怪，但它们在自然环境中会以许多社会化的方式来互动。

在探讨卡尔霍恩的这项研究以前，有必要回顾他更早几年所做的一项研究。卡尔霍恩把一群白鼠关在一个1/4英亩的安全而封闭的户外空间内，给予它们充足的食物，理想的、受保护的筑巢空地，没有天敌，所有的疾病被控制在最低限度。换句话说，这是一个老鼠的天堂。卡尔霍恩早期的研究重点仅仅是研究在一个不存在控制过度繁殖的自然因素（例如掠夺者、疾病等）的环境中，白鼠的繁殖率为多少。27个月后，仅剩150只成年鼠。这很让人吃惊，因为在这样理想的环境中，考虑到成年鼠的低死亡率和通常的繁殖率，在这一段时间的累积下，卡尔霍恩应该看到5000只成年鼠才对。卡尔霍恩认识到，白鼠数量有限的原因在于幼鼠极高的死亡率。显然，在这150只白鼠中，繁殖行为和母性行为由于社会相互影响的压力而严重改变了，因此几乎没有幼鼠可活到成年。虽然150只白鼠生活在1/4英亩的区域内，看起来似乎不是特别拥挤，但这种拥挤程度已足以导致明显的行为变化。

这一发现促使卡尔霍恩在实验室中设计控制更严格、更易观察的实验条件，以便进一步研究在这样的高密度条件下，白鼠会发生什么样的行为变化。换句话说，他已经观察到了现象，而现在想弄清原因。

方法

在由三项研究组成的系列研究中，研究者将成年白鼠放入10×14英尺的实验空间里，实验空间被分成四个部分或围圈（pen）（见图8—3），它们之间有通道可让白鼠从圈1到圈2，从圈2到圈3，从圈3再到圈4，但圈1和圈4之间无法直接相通。因此，圈1和圈4就是“末端围圈”。如果一只白鼠想从圈1到圈4中去，它就不得不经过圈2和圈3，每部分的隔板是通电的，因此，白鼠很快便知道，它们不能爬过隔板。

图8—3 卡尔霍恩的拥挤研究中实验房间的安排示意图

这些围圈里有食物、水和供白鼠筑巢用的围篱。白鼠有足够的食物、水和筑巢用的材料。在房间的天花板上有一个观测窗，用于研究小组观察和记录白鼠的行为。

通过几年对白鼠的研究，卡尔霍恩知道，在正常情况下，这个特殊的白鼠种群是12只成年白鼠聚居在一起的。因此，观察室的大小是每个围圈能够容纳12只白鼠，共48只。白鼠被放进观察室后，允许自由繁殖，直至接近正常密度的2倍，达到80只。一旦白鼠的数量达到80只时，多余的幼年白鼠在断奶后将被转移，以使白鼠的数量保持恒定。

有了这种实验装置，剩下的所有工作就是要对这些处于拥挤环境中的动物观察一段时间，并记录他们的行为，这些观察持续了16个月。

结果

对于白鼠来说，实验中的种群密度水平并不极端。事实上，这种密度只是中等程度。如果还想增加白鼠的话，每个围圈大约还可增加20只，但事实并非如此。当雄白鼠成熟以后，它们像在自然环境中一样，为了社会地位而开始相互争斗。这种争斗发生在所有的围圈中，但每个围圈中的结果并不完全相同，因为两个末端围圈（1、4）只有一个进出口。因此，当这两个围圈中的一只雄性白鼠赢得了战争，处于统治地位时，它将捍卫它的地位和领土（整个围圈），其方法很简单，即守住唯一的那个入口，攻击任何其他胆敢冒险通过那个通道的雄鼠。于是，其他的雄鼠都被逐出，每个末端围圈中最终只剩下一只雄鼠，当然，那里并不是只有它自己，因为在四个围圈中雌鼠的分布较为平均。因此，围圈1和4的“统治者”们每只霸占8到12只雌鼠。而且这些雄鼠没有心存侥幸。为了防止外敌侵入，雄鼠直接睡在通道的入口处，并始终处于警戒状态。

偶尔，有些别的雄鼠也会进入末端围圈，但它们都处于从属地位，大部分时间都与雌鼠待在窝里睡觉，出去仅是为了觅食。它们不想与雌鼠交配，在这些围圈中的雌鼠基本上起着母亲的作用，它们筑建舒适的窝、养育和保护后代。换句话说，在末端围圈中生活的大部分白鼠相对正常，繁殖行为也很成功，幼鼠中有一半可存活到成年。

其余约60只左右的白鼠挤在中间的两个围圈中。因为这两个围圈都有中央供食和供水装置，因此，这些白鼠彼此间有很多相互接触的机会。在围圈2和3中的白鼠有一种行为现象，卡尔霍恩称之为“行为沉沦”（behavioral sink）。行为沉沦是“把超乎寻常数量的动物聚集在一起所产生的任何行为变化过程的结果。这个术语暗示着它本身对健康不利，这并非偶然，行为沉沦的确会使在一个集体内发生的所有形式的病理症状恶化”（P.144）。让我们看一看他所观察到的一些极端的、病理性的行为。

1.攻击

在野生环境中，正常雄鼠会为了维护自己在社会阶层中的统治地位与其他雄鼠进行争斗。这种争斗在本研究中的一些富有攻击性雄鼠身上也能看到。与它们在自然环境中所不同的是，在末端围圈中处于统治地位的雄鼠必须经常与其他雄鼠争斗以保持其地位，且一般常会是几只白鼠打群架。不过，研究者通过观察发现在中间围圈中最强的雄鼠是最正常的。然而，即使是这些白鼠有时也表现出“病理的症状，如发狂；攻击雌鼠、未成年鼠以及不太活跃的雄鼠；并表现出一种特殊的嗜好——一种鼠类的不正常行为——咬其他白鼠的尾巴”（P.146）。

2.服从

与极端攻击行为相反，其他组的雄鼠忽略并避免为争霸主地位而起的战争。其中一组雄鼠是围圈中看起来最健康的白鼠组成，它们身体肥硕、皮毛完好，没有因争斗而常会出现的秃斑。然而，这些白鼠完全不适应社会环境。在围圈之间走动时，它们似乎处于睡眠状态或类似催眠的状态，它们无视其他白鼠的存在，反过来也被其他白鼠所忽视。它们对性活动一点儿也不感兴趣，即使面对发情的雌鼠也无动于衷。

另一组白鼠则极为活跃，并一直在搜寻发情的雌鼠。卡尔霍恩把它们称为“探索者”（prober）。它们常常被更强势的雄鼠攻击，但他们对争夺地位从不感兴趣。它们的性欲极强，其中相当一部分甚至以同类为食。

3.性偏差

这些探索者也不遵守自然的交配程序。通常情况下，雄鼠追逐发情的雌鼠，直到它逃进洞里，然后，雄鼠耐心地等待，甚至干脆在洞口跳起求婚舞。最后，雌鼠从洞里出来，进行交配。在卡尔霍恩的研究中，大部分进行性活动的雄白鼠遵守这一程序，但探索者例外。它们完全拒绝等待而直接跟着雌白鼠进洞。有时，洞内的窝中还有已死亡的幼鼠，研究者在随后的研究中发现，探索者正是由此开始蚕食同类。

某些特定雄鼠组被称为“泛性者”（the pansexual），因为它们不加分辨地试图与任何其他白鼠进行交配。它们以性为目的，接近其他的雄鼠、幼鼠以及没有发情的雌鼠。这是一个驯服的群体，常常受到更强势的成年雄鼠的攻击，但它们从不为争夺地位而打斗。

4.繁殖异常

白鼠有一种自然本性，那就是筑巢。在本研究中，研究者向白鼠不限量地提供小纸条作为筑巢的原材料。正常情况下，雌鼠非常主动地筑巢，以便为生产做准备。它们将材料集中并堆积起来，形成一个垫子的模样，然后将窝的中间部分做一个凹陷形以放置幼鼠。然而，行为改变的雌鼠丧失了一般的筑巢能力（或倾向），最初它们不能做出中间的凹陷，后来，随着时间的推移，它们收集的纸条越来越少，以至于最终幼鼠直接降生在覆盖着木屑的地板上。

当母鼠预感到存在危险时，它们也丧失了把幼鼠从一个地方转移到另一地方的能力。它们可能转移了一些幼鼠而忘了另一些，或在转移的过程中不小心把它们丢在了地上。通常，这些掉在地上的幼鼠或是被遗弃或是死去，随后被成年鼠吃掉。幼鼠的死亡率在中间两个围圈中最高，约在80%~96%之间。

除此之外，在中部围圈中的雌鼠发情时，它们会被大群的雄鼠追逐，直到它们最终不能逃脱为止。这些雌鼠在怀孕和生产过程中并发症发生率很高，并且它们变得极度不健康。

讨论

你可能会预计这些发现的必然延伸是将它们应用到处于高密度环境的人群中去。然而，由于接下来我们要讨论到的一些原因，卡尔霍恩没有得出任何这样的结论。事实上，他很少谈论自己的发现——可能的推测或逻辑是：他的结果本身已说明了一切。他只对一个明确的结果进行过评论：白鼠的自然及社会生存行为已被高密度的居住环境所产生的应激明显改变。另外，他提到通过进一步研究、改进方法和修改对结果的解释，他的研究以及其他类似的研究可以有助于我们理解人类在面对类似问题时的情形。

研究发现的意义

就像这本书里的许多研究一样，卡尔霍恩这项研究最重要的一个方面是它引发了许多相关的研究，关注高密度居住环境对人的影响。虽然在这里不可能详细复述所有的研究，但有些例子值得一提。对人来说，促使行为改变发生的环境之一就是特别拥挤的监狱。由国家法官协会资助的一项研究对每个囚犯平均只占50平方英尺[1]的监狱与不太拥挤的监狱进行比较研究。结果发现，前者的死亡率、杀人率、自杀率、生病的次数及惩戒的比率明显较高（McCain，Cox，& Paulus，1980）。但再提醒一下读者，请记住，除了拥挤因素以外，还可能有其他因素影响了这些行为（例如，参见研究37中有关津巴多监狱的内容）。

另一有趣的发现是，拥挤因素对问题解决能力会产生消极影响。有一项研究让人待在非常拥挤的小房间里（每人只有3平方英尺），或待在不太拥挤的较大房间内，并要求被试完成相当复杂的任务，如把不同的形状进行归类，同时给被试听故事，随后要对故事内容进行测试。在拥挤条件下，被试的成绩明显低于不拥挤条件下的被试（Evans，1979）。

请猜一猜，在拥挤环境中你的生理指标将会发生怎样的变化？有研究已显示，你的血压会升高，心率会加快。伴随着这些影响，你会感到其他人对你充满敌意。随着人口密度增加，你会感到时间过得越来越慢（Evans，1979）。

批评

卡尔霍恩对动物的研究结果已得到后继动物研究的支持（参见Marsden，1972）。然而，正如我们在本书的前面所提及的，把动物研究的结果推广到人类时必须特别小心。正如某些物质可能引起鼠类疾病，但对人类的身体健康毫无影响一样；影响鼠类社会行为的环境因素或许不能直接应用于人类，动物充其量只能代表人类的某些方面。有时，动物研究是非常有用的，它可揭示并引导对人进行更加明确的研究；另一些时候，它也可能通向一条死胡同。

1975年，研究者们在纽约城进行了一项研究，试图用人类被试来重复卡尔霍恩的一些研究结果（Freedman，Heshka，& Levy，1975）。对不同居住密度的地区，研究者分别收集了死亡率、生育率（出生率）、攻击行为（法院记录）、心理病理学（精神病院的病人数）等数据。分析所有数据后，研究者没有发现在人口密度和社会病理行为之间有任何显著相关。

虽然如此，在20世纪60年代初期，卡尔霍恩就把工作焦点集中在拥挤情境对人类心理和行为的影响上。因为这与人类相关，这一领域的研究持续至今。

近期应用

约翰·卡尔霍恩在1995年9月7日逝世，他给我们留下了一系列发人深省并具有历史意义的研究。卡尔霍恩在1962年的文章中所论述的各种社会问题与人类生存条件之间表现出愈发紧密的关系。因此，当科学家对攻击行为、不孕症、精神疾病或各种形式的社会冲突等问题进行进一步了解和干预研究时，常会参考卡尔霍恩关于拥挤和行为病理学的研究。

另一项有趣的研究引用了卡尔霍恩的观点，考察在驯养过程中动物行为的改变（Price，1999）。该研究者普莱斯（Price）认为，某些动物被驯化了，即宠物。这些动物经历了若干代遗传与发展的变化，从而改变了自己的行为，这样它们便能与人和平共处，分享同一生活空间。普莱斯的主要观点是，野生动物经过几个世纪的驯养，不得不适应人类的生活方式，虽然这种环境与它们原始的栖息地非常不同。这种生活方式通常包括在相当拥挤的条件下与同类的其他动物、其他种类的动物以及人类和平相处（至少大多数时间是如此）。作者认为，这是通过提高反应阈限的水平而达到的，即要想让一只驯养动物成为占领者和侵略者需要更强的外部刺激。换句话说，在一个相当小的空间中，狗、猫和人类都能够和谐相处，而未经驯养的野生动物间将会逃走和相互厮杀。

一个相关研究发现，与动物相比，人类对人口密度的反应可能存在着一个关键差异。在动物研究中，作为密度增长的直接后果，病理行为是呈线性增长的：一个数据增长，另一个相应跟着增长。然而，雷格兹（Regoeczi，2002）的研究发现，对人类而言，家庭人口密度对增加的社会退缩和攻击性行为的影响实际上是随着一个单独的家庭中人口的增加而降低的。但是，这种影响趋势只有在居住人数没有超过家庭中的房间数时才会出现；当远远超出这个数字时，反社会影响就会伴随着人口密度增加而显现出来。换句话说，当居住条件是5个人居住在一个3居室的公寓里或者7个人挤在一个4居室的屋里时，人们倾向于表现出更多的退缩或攻击性行为。这里有两个可能原因在起作用：也许是人口密度导致了病理行为；也许是那些退缩或攻击性程度高的人出于自愿或被排斥的缘故，而最终获得不大拥挤的居住环境。

卡尔霍恩的研究有助于精神治疗理论。由于当今世界人口日益增多，人员迁移和多元化发展也更为频繁，对精神治疗领域中提高专业化程度的需求也变得十分必要（Dumont & Torbit，2012）。例如，由于多种文化之间相互作用的增加，对文化交叉相关领域的专业咨询师的需求也逐渐增加。随着寿命的延长，人们会对那些在工作和退休的转型期和慢性病与死亡之间的问题上有专长的咨询师的需求将会增加。随着城市越来越大，越来越拥挤（更多更大的高密度居住区），市中心人口也在不断增多，犯罪率上升。总体来说，很多城市问题会愈发加深，卡尔霍恩的工作与之紧密相关。当这一切发生时，对能够解决各种城市功能障碍的咨询师的需求将会大大增加。

结论

以上这些研究以及其他许多研究表明了社会学家们在探索、完善人口密度和拥挤的影响研究上所作出的不懈努力。尽管社会病理行为产生的原因是繁多且复杂的，然而正是卡尔霍恩45年前的研究第一次让我们注意到了人口密度的影响，这个影响因素虽然只是揭开这个谜团的钥匙之一，但是它所发挥的作用却是至关紧要的。

第九章心理治疗

心理治疗（psychotherapy），简单地说，就是“对心理问题进行治疗”。典型的治疗包括治疗者和当事人之间紧密的关爱关系。临床心理学是心理学中关注研究、诊断和治疗心理问题的分支学科。心理治疗的历史主要是由一长串的各种各样的治疗方法组成，每一种方法都被其发明者认为是最有效的。而能证明这些方法有效性的研究并不很充分，也不太科学。然而，这其中产生了一些重要且有影响力的研究突破。

关于心理治疗，常被问及的一个问题是：“哪一种方法最有效？”本章的第一项研究探讨了这一问题，该研究通过一种创新的统计分析方法（就当时而言）证明，各种形式的治疗在一般情况下有效性相等；第二项研究讨论了另一种研究思路，其得出的结果似乎是第一项结论的一个例外；对于恐惧症（对某些事物感到极端的、莫名其妙的紧张）而言，一种称为“系统脱敏法”的行为疗法显然比其他疗法有效得多。该研究由被誉为系统脱敏法创始人的心理学家约瑟夫·沃尔普（Joseph Wolpe）完成；本章的第三、第四项研究涉及两种与心理治疗及诊断相关的诊断工具：罗夏墨迹法和主题统觉测验（TAT），它们常被治疗师用来诊断当事人的心理问题，或是帮助他们探讨其敏感、痛苦甚至是隐秘的心理问题。

研究33 为自己挑选心理治疗师

Smith, M.L., & Glass, G.V.(1977).Meta-analysis of psychotherapy outcome studies.American Psychologist, 32, 752-760.

你不必非得“疯了”才需要心理治疗。大多数人接受心理咨询师和心理治疗师的治疗，不是因为精神疾病，只不过是在生活中遇到了凭借他们通常的应对机制和支持网络不能解决的问题而已。

想象一下，你正处于情绪的低谷，你向周围的密友和家人寻求帮助，但仍不能解决问题。当你忍耐这种痛苦很长一段时间后，你最终决定去寻求专业帮助。因为你是一个消息灵通、敏捷睿智的人，你读过一些心理治疗方面的书，发现有很多可供使用的治疗方法，例如行为疗法（包括研究34中讨论的与沃尔普的研究有关的系统脱敏法）、人本主义疗法、认知疗法、认知行为疗法和种类以弗洛伊德的精神分析理论为基础的心理动力学疗法（psychodynamic therapies）。这些种类的治疗方法虽然使用了不同的基本技术，但其目的都是一样的，即要帮助你改变生活方式，使你成为更快乐、更有创造性和效率更高的人（对各种心理治疗形式更详尽的讨论参见Wood，2007）。

现在，你可能完全糊涂了，如果你需要帮助的话，到底该选择哪种治疗方法呢？下面的内容是你所需了解的：（1）心理治疗真的有效吗？（2）如果它确实有效，那么哪一种治疗方法最好呢？在过去40多年的时间里，心理学家也一直在问同样的问题，知道这一点可能会对你有所帮助（也可能不会）。虽然研究者们进行了许多比较研究，但大多数研究结果都倾向支持进行该研究的心理学家所偏爱的方法。这没什么奇怪的。另外，大多数研究所涉及的被试数量太少，研究手段过于单一。更糟糕的是，这些研究被广泛传播，散见于各种书刊杂志上，因此，要作出完整而全面的判断实属不易。

为了填补心理治疗技术研究文献方面的空白，玛丽·史密斯（Mary Lee Smith）和吉恩·格拉斯（Gene Glass）于1977年在科罗拉多大学开展了一项工作，主要任务是收集截至1977年所有关于心理治疗效果的文献，并重新进行分析。通过对1000多种不同期刊、杂志和书籍的考察研究，他们最后选定了375项研究用来检验心理咨询和心理治疗的效果。之后，他们采用格拉斯发明的元分析统计技术，对所有研究数据进行处理，以从整体上判断不同治疗方法的相对效果（元分析是将许多个别研究的研究结果整合起来进行更大的统计分析，使丰富多样的数据联合在一起，形成一个更有意义的整体）。

理论假设

史密斯和格拉斯的研究目的如下（P.752）：

1.鉴别并收集所有检验心理咨询和心理治疗效果的研究；

2.判断每项研究中治疗方法的疗效如何；

3.比较不同类型心理治疗的效果。

理论假设就隐含在这些目的之中，即通过元分析技术，可显示出心理治疗是否有效，以及不同方法的疗效是否存在明显差异。

方法

虽然史密斯和格拉斯分析的375项研究在使用的研究方法和所评估的疗法类型方面有很大的差别，但每一项研究都至少包括一组接受某种治疗方法的被试与一组接受另一种治疗方法或不接受任何治疗的被试（控制组）。对史密斯和格拉斯来说，对所有研究进行元分析后，各种疗法的有效程度是最重要的发现。效应值从原作者选择使用的治疗方法的所有结果测量中获得。通常，原文会提供一个以上的有效性测量指标，有时候同一指标被使用多次。如自尊心增加、焦虑减少、学业成绩提高和总体适应能力的提高都被用来评估治疗结果。只要有可能，在一项特定研究中使用的所有测量指标，都会包含在元分析中。

从375项研究中共计算出833种不同的效应值。研究涉及约25000名被试。在这些研究中，被试的平均年龄为22岁，他们平均接受17个小时的治疗，治疗师的平均从业年限是3.5年。

结果

第一，史密斯和格拉斯比较了研究中所有接受治疗和没有接受治疗的被试的治疗类型和效果测量指标。他们发现“接受治疗的被试平均恢复水平高于75%的未接受治疗的控制组被试。……有代表性的结果显示，心理治疗将当事人的健康水平从第50个百分位数移到了第75个百分位数”（P.754-755）。百分位数指的是对某一测量指标而言，落在特定分数下的人数在总体中所占的百分比。例如，如果你在一项测验上的得分处在第90个百分位，这意味着与你做同一测验的90%的人分数在你之下。此外，在833种不同疗效中，只有99种（12%）的效应值是负的（意思是说当事人的状态比治疗前更差）。作者指出，如果心理治疗是无效的，那么负效应值应达到或超过50%，即417种。

第二，将各种指标上的所有心理治疗的效果进行比较。结果见图9—1，从图中可清楚地看到，从总体上说，治疗比不治疗明显有效。

第三，史密斯和格拉斯用相似的统计程序比较了所有研究中应用的各种心理治疗方法，图9—2总结了他们关于几种较常见的心理治疗方法的研究结果。

图9—1 从四个方面分析所有研究综合效果的测量

注：如果病人状况没有改善，病人的得分应为50。如果病人的状况变得更糟，病人的得分应低于50。

资料来源：引自P.756的数据。

第四，史密斯和格拉斯把各种治疗方法分成两大类：行为疗法和非行为疗法。其中，行为疗法包括系统脱敏法、行为矫正法和冲击疗法；其余治疗方法均属于非行为疗法。当他们分析用行为疗法和非行为疗法进行的所有研究，并与不接受治疗的控制组比较时发现，两类疗法之间没有差异（相对控制组而言，分别处于第73个百分位数和第75个百分位）。

讨论

总的来说，心理治疗在处理各种心理问题时，都是成功的（见图9—1）。另外，无论不同的治疗方法如何划分归类，它们之间的差异均不显著（见图9—2）。

史密斯和格拉斯从他们的发现中得出三个结论：第一，心理治疗是有效的，元分析的结果清晰地支持了接受心理治疗好于不接受心理治疗的主张；第二，“尽管大量专业人员依据不同的心理学理论在从事心理治疗，但本研究结果显示，不同类型的心理治疗所产生的疗效差异是可以忽略的。认为一种心理治疗绝对比另一种优越……是不恰当的”（P.760）；第三，由于相关信息在各类出版物中的传播还远远不够，研究者和治疗师对于心理治疗效果的假设是不牢靠的。因此，他们提出本研究为解决这些问题迈出了重要的一步，且采用类似技术的研究也值得人们作进一步关注。

图9—2 七种心理治疗方法效果的比较

注：分数的含义与图9—2相同，分数高于50表明治疗有效。

资料来源：引自P.756的数据。

研究发现的意义和后续研究

史密斯和格拉斯的研究结果减少了当事人对心理治疗效果的困惑，但却增加了心理治疗师的困惑，因为那些选择心理治疗作为职业的人常常会深信某种特殊的治疗方法（他们所选择的）比其他治疗方法更有效。然而，史密斯和格拉斯的研究结果已得到了后续研究的支持（Landman & Dawes，1982；Smith, Glass， & Miller，1980）。这些研究的影响之一是：愿意采用折中疗法来帮助当事人的心理治疗师开始增多，即在治疗实践中，他们会综合采用几种心理治疗方法，使自己的治疗适合每一位作为特殊个体存在的来访者及其独特的问题。事实上有40%的心理治疗师认为自己采用的是折中法，这个百分比远远高于其他只采用某种特定疗法的医师。

从这些研究以及相关研究中得出“所有的心理治疗方法对所有心理问题和所有的病人都同等有效”的结论，显然是错误的。这些研究从一个非常宏观的角度对心理治疗的疗效进行了综述。然而，依据个人的人格特征及具体问题的具体情况，一些治疗方法可能比另一些更有效。

在你选择心理治疗师的时候，最重要的并不是要考虑他所采用的治疗方法，而是你对心理治疗的期望、心理治疗师的特点以及咨访关系的质量。如果你相信心理治疗会对你有帮助，满怀希望地进入治疗关系，那么治疗的成功概率就会大大增加。你对与治疗师之间关系的感受，也可以使治疗效果有很大的不同。如果你信任你的治疗师，并且相信他或她能真正地帮助到你，那么你的治疗可能会更加有效。

近期应用

史密斯和格拉斯的研究结果和研究方法，在探讨多种形式的心理疗法对各种心理问题的干预效果时，仍有深远的影响。这种影响不仅来自他们得出的结论，即大多数心理疗法的有效性相当，同时也来自于他们对元分析研究技术的应用。

沿用史密斯和格拉斯的方法进行的研究中，有一项研究评估了抑郁症的团体治疗方法的有效性（McDermut，Miller & Brown，2001）。作者对48项以团体形式治疗抑郁症的研究进行了元分析，发现接受治疗的患者通常比未接受治疗对照组中的85%的患者抑郁症状有显著的改善。研究者们推断“团体治疗对抑郁症患者是有疗效的，但是，对于团体治疗可能在哪些方面优于个别治疗则少有实证研究”（P.98）。依据史密斯和格拉斯的研究，你可以预测团体和个别治疗方法的有效性可能是相似的，但需要进一步的研究来明确这一点。

另一项研究展示了史密斯和格拉斯使用的元分析方法的不同应用，该研究关注各种对偏头痛和紧张性头痛患者的行为（即非药物）治疗（Penzien，Rains，& Andrasik，2002）。研究者们用元分析方法比较了30年以来有关放松训练、生物反馈和压力管理三种干预手段的研究。他们发现，总的来说，单独运用行为疗法，偏头痛和紧张性头痛患者的头痛情况就减少了35%~50%。正如作者所指出的，这是一项重要的发现，因为“已有的证据显示，运用行为干预方法改善头痛的水平可以与已被广泛使用的药物治疗相媲美”（P.163）。根据这项发现，作者提出，如果能够使行为治疗更普及、费用更低一些的话，更多的医生和他们的慢性头痛患者可能会选择非药物治疗。

有一项研究证实了史密斯和格拉斯的元分析方法与发现的广泛影响，该研究调查了对精神发育迟滞个体进行心理治疗的有效性（Prout，& Nowak-Drabik，2003）。他们搜集了大量的研究用以进行元分析，这些研究在方法论、心理治疗方式和来访者特点上有着广泛的多样性。分析所有研究得出的结论显示，心理治疗对于精神发育迟滞来访者具有中等程度但十分显著的效应。研究者们推断“应考虑将心理干预手段作为治疗精神发育迟滞者整体计划的一部分”（P.82）。

结论

史密斯和格拉斯的研究在心理学的历史上是一座里程碑，因为这将使人们不再沉迷于试图证明某种具体疗法最为优越，而是把焦点集中在如何更好地帮助那些受心理问题困扰的人们。此后的研究可能更加直接地聚焦于哪些因素能使疗程最短、疗效最令人满意，尤其注重哪些因素能使来访者获得最佳治疗体验。

研究34 缓解你的恐惧心理

Wolpe, J.(1961).The systematic desensitization treatment of neuroses.Journal of Nervous and Mental Diseases，132，180-203.

在我们讨论心理治疗中占据重要地位的系统脱敏疗法（即缓和地逐渐降低你的焦虑或恐惧水平）之前，应首先了解神经症这个概念。神经症这个术语目前已有些过时，它过去常用于描述以极端焦虑为主要特征的一系列心理障碍。现在这些问题统称为“焦虑障碍”（anxiety disorders）。我们都很熟悉焦虑，有时在某些使人紧张不安的场合，如公开演讲、面试、考试，等等，我们会体验到高度焦虑。然而，当某人患有焦虑“障碍”时，他的反应会特别强烈、弥漫、频繁，并导致衰弱。通常这种障碍会影响个体的正常生活，以致其无法发挥正常、应有的生活功能。

最常见的与焦虑相关的障碍有恐惧症、惊恐发作和强迫症。如果你曾经罹患过其中一种疾病，你就会知道这种焦虑可以控制你的生活。这一章中所讨论的约瑟夫·沃尔普（Joseph Wolpe，1915~1997）对这些障碍的治疗工作主要集中在恐惧症上。恐惧症（phobia）一词来源于Phobos这个词，Phobos是希腊恐怖之神的名字。古希腊人把他们想象的Phobos画在面具和盾牌上，用以恐吓他们的敌人。

恐惧症是一种不合情理的恐惧。换句话说，它是一种与实际危险不相称的恐惧反应。例如，当你在森林中的小路上散步，突然一条响尾蛇出现在你面前，盘绕着身子并准备向你进攻，你会感觉到恐惧（除非你是哈利·波特之类的人物）。这不是恐惧症，而是一种正常的、对真实危险合理的恐惧反应。但如果你不敢去动物园，是因为在那儿你可能会看到厚厚玻璃笼中的蛇，那么你就有点儿恐惧症的嫌疑了（除非你是《哈利·波特》中胆小的达力·德思礼）。这在你听起来也许很可笑，但对那些患恐惧症的人来说，一点也不好笑。恐惧症反应是非常难受的，它包括许多症状，如头晕、心悸、乏力、呼吸急促、出汗、发抖、恶心等。恐惧症患者总是警惕地回避那些可能遭遇恐惧刺激的情境，这种回避通常会严重影响一个人正常的生活功能。

恐惧症分为三个主要类型：①单纯性（或特定性）恐惧症，包括对动物不合情理的恐惧（如鼠、狗、蜘蛛或蛇）或对特殊场所，如狭小的空间（幽闭恐怖）或高空（恐高症）的恐惧；②社交恐惧症，以与他人交往时不合理的恐惧为特征，如在公开场合说话，或对困窘的恐惧；③广场恐惧症，是对不熟悉的、开放的、或拥挤的空间的不合理恐惧。虽然各种类型恐惧症的症状是相当不同的，但它们有两个共同的特征：它们都是非理性的，并且都可以用同样的方法进行治疗。

早期对恐惧症的治疗以弗洛伊德精神分析学派的观点为主。这种观点认为恐惧症是无意识心理冲突的结果，这种冲突起源于童年时的精神创伤。这一学派还进一步主张，恐惧症可能是个体不愿面对的某些其他深层恐惧和愤怒的替代品。例如，一个人有不合理的高空恐惧（恐高症），这很可能与他小时候受父亲恐吓有关，他父亲假装要把他从悬崖上推下去。作为一个成人，要承认这种经历可能迫使他去接受曾遭父亲虐待的事实（他不想面对的一些事），于是他压抑了这些事实，并以恐惧症的形式取而代之。根据对问题根源的弗洛伊德式的看法，精神分析一直试图通过帮助病人了解无意识感情，释放隐藏的情感，在此过程中使他们摆脱恐怖。虽然有时这种技术在治疗其他类型的心理障碍时很有帮助，但在治疗恐惧症时却效果不佳。研究发现，有时即使某人揭示了无意识中与恐惧相关的心理冲突，恐惧症仍然存在。

虽然，约瑟夫·沃尔普不是第一个提出使用系统脱敏法这一行为技术的人，但他被公认为是对此技术进行改良，并用来治疗焦虑障碍的第一人。行为疗法与精神分析最大的不同是，它不关心心理障碍的无意识根源和受到压抑的冲突。行为治疗的基本观点是：你习得了一种无效的行为（恐惧症），现在你必须消除它。这便是沃尔普治疗恐惧症的基础。

理论假设

沃尔普和其他人在早期研究中已发现，动物的恐惧反应可以通过一个简单的条件反射程序而得到减轻。例如，一只老鼠看到一幅逼真的猫的照片时，会表现得非常恐惧。但如果在每次呈现猫的照片时，都给老鼠食物，老鼠的恐惧会越来越小，直到最后恐惧反应完全消失。老鼠最初把猫的图片与恐惧条件反射性地联系在一起。然而，老鼠进食所引起的反应与恐惧反应是不相容的。由于恐惧反应和进食反应不能同时并存，所以前者被后者抑制了。这两种不相容的反应称为交互抑制（当两种反应彼此抑制，在既定时刻，只有一种反应可以存在）。沃尔普提出了更普遍的假设，即“如果一个反应在引起焦虑的刺激呈现时能抑制焦虑的产生……存在于刺激和焦虑之间的联结将被削弱”（P.180）。他还认为，人类的焦虑反应与那些在动物实验室里发现的焦虑反应非常相似，因此交互抑制的观点也可用来治疗人类的各种心理障碍。

在对人的治疗中，焦虑的抑制反应是深度放松训练而不是进食。这一观点的理论基础是：你不可能在同一时间里既体验到深度的身体放松，又体验到恐惧。作为一名行为主义者，沃尔普相信患恐惧症的原因是你通过经典条件反射过程，在生活的某个时间点习得了恐惧。通过经典条件反射，某些物体与极度的恐惧在你脑中形成联系（参见研究9中巴甫洛夫的研究）。从华生（参见研究10中关于小艾尔伯特的内容）及其他学者的研究中，我们知道这种学习甚至可以在年幼时发生。为了治疗你的恐惧症，当你面对一个恐怖情境时，你必须经历一种能抑制恐惧或焦虑的反应（放松）。这种治疗技术有效吗？沃尔普的研究报告是基于从150例恐惧症患者中随机抽取的39例被试，他用系统脱敏技术对这些被试进行了治疗。

方法

假设你患有恐高症，且这一问题非常严重，以至于你很难爬上梯子去修剪你庭院里的树木或走上二楼的办公室，你的恐惧症严重干扰了你的生活，于是你决定寻找像沃尔普这样的行为治疗师进行心理治疗。你的治疗将包括放松训练、焦虑层次的建立和脱敏三部分。

放松训练

在最初的几次治疗中，对恐惧症的针对性治疗非常少。相反，治疗师把精力集中在教你如何放松你的身体上。沃尔普采用了一种由埃德蒙·雅克布森（Edmund Jacobson）在1938年发明的渐进性肌肉放松练习，这种放松练习在当前心理治疗中仍经常使用。该过程包括拉紧和放松你全身的各组肌肉（如双臂、双手、面部、后背、腹部、双腿等）以达到深度放松，放松训练可能要在治疗师指导下进行数次，直到你能独自达到放松状态。通过这种训练，无论何时，你都可以让自己处于放松状态。为了确保完全的放松，沃尔普对许多被试配合使用了催眠术，但现在已明确这点对有效的治疗通常是不必要的，因为人们往往不需要催眠术也可达到完全的放松。

焦虑层次的建立

治疗过程的下一阶段是要你和你的治疗师共同制定一张焦虑产生情境或恐惧产生场景的条目表。条目表以引起轻微不适的情境开始，强度逐渐增加，直到你能想象到的能引发最严重焦虑的事件。层次的数量从5或6，到20或更多。表9—1列出了可能的恐高症层次表，还有一张直接来源于沃尔普研究报告的幽闭恐惧症患者的层次表。

表9—1 焦虑层次

脱敏

现在，进入实际的“消退”阶段。根据沃尔普的观点，不直接与恐惧情境接触，对减少病人对情境的敏感性是必要的（这是来访者很乐于听到的）。相同的效果可以通过描述和想象来完成。记住，恐惧症是你通过联想而产生的。因此，你将以同样的方式消除恐惧症。首先，治疗师将要求你进入深度放松状态，就像你曾学过的那样。然后，治疗师便从焦虑层次的第一条开始，给你一一描述情境：“你走在人行道上，来到一个大栅栏前。当你继续往前走，你可以看到栅栏有4英尺高。”你的任务就是想象这个情境，并同时保持完全放松。如果成功，治疗师将进行下一个步骤：“你坐在三层楼的办公室内……”等等。如果在此过程中的任何时候，你感到轻微的焦虑，就举起你的食指示意，这时治疗师将暂时停止对焦虑层次表的呈现，直到你再次完全放松为止。然后当你能保持放松状态的时候，描述重新从前面某一个条目开始。这个过程一直持续到你完成全部层次表中的条目并能保持放松状态。一旦你完成了这个过程，在后面的治疗期内你可以多重复几次。在沃尔普的研究中，病人治疗成功所需要的次数因人而异。有些病人不超过6个疗程就康复了，而有一个病人治疗了近100个疗程（这是一个对死亡有严重恐惧的病人，而且还患有另外两种恐惧症）。平均疗程在12个左右。这个疗程数比正规精神分析一般需要的时间要少得多，精神分析治疗通常需要持续一年。

与此治疗方法相关的重要的问题是，系统脱敏疗法真的有效吗？

结果

在沃尔普的文章中报告的这39个病例患有多种不同类型的恐惧症，包括：与他人在一起、幽闭恐怖、暴风雨、被注意、拥挤、亮光、伤口、恐高症、摔倒、拒绝和蛇形物。判断治疗成功与否，是根据病人的自我报告和现场的直接观察。通常，病人以描述脱敏过程的方式来报告病情好转和逐渐康复，沃尔普以此描述为依据来判断病人。他把脱敏过程评定为完全成功（完全脱离恐怖反应）、部分成功（恐怖反应只有原来的20%或更少）和不成功三个等级。

在这39例患者中，共有68种恐惧症状需要治疗。在这些治疗中，其中62种症状（涉及35例患者）的治疗被评定为完全成功或部分成功，因而成功率为91%，其余6种症状（占9%）的治疗没有成功。成功治疗的平均疗程为12.3次。沃尔普的解释是：大多数不成功的病例存在特殊的问题，例如，不能想象层次表中呈现的情境，因而无法进行适当的脱敏。

对沃尔普的批评主要来自于弗洛伊德的精神分析学派阵营，他们认为，沃尔普的方法只针对了症状而并没有针对引起焦虑的根源。他们认为以这种方法治疗的症状消失后，一定会出现新的症状来取代它们。他们把这比喻为一个有漏洞的大堤，一个洞被堵住了，另一个漏洞最终又出现了。沃尔普通过不同时期的跟踪报告，对这些批评和质疑作出了回应，他对接受治疗并获得成功的35例病例中的25例进行了4年多的跟踪。通过对这些报告的研究，他写道：“没有一例病例报告复发，也没有出现新的恐惧症症状或其他神经症症状。当系统脱敏治疗完成后，我再也没有观察到神经焦虑的再次出现，或许事实就是如此吧！”（P.200）

讨论

在沃尔普的文章中，他把讨论的焦点集中在反击精神分析学家对他的怀疑上。在20世纪50年代，精神分析仍是一种非常普遍和流行的心理治疗形式。当行为疗法刚刚开始进入临床心理学的主流时，它引发了大量争论。沃尔普指出，脱敏疗法与传统的心理分析相比有以下几大优势（参见研究报告原文，P.202）：

1.在每一个案例中，心理治疗的目标都可被明确地陈述出来；

2.焦虑的来源可被清楚且迅速地确定；

3.在根据焦虑层次表对场景进行描述时，病人反应上的变化在治疗的每一时期都可测量。

4.治疗可以在有其他人在场的情况下进行（沃尔普发现，在治疗期间如果有他人，如见习治疗师在场，并不会影响疗效）；

5.如果愿意或需要，可更换治疗师。

后续研究和近期应用

自从沃尔普发表了这篇文章并出版了一本关于在心理治疗中应用交互抑制方法的书（Wolpe，1958）以来，系统脱敏疗法的应用发展到了顶峰，现在它常被认为是治疗焦虑障碍，特别是恐惧症的首选。这种发展大部分应归功于对这一方法疗效更新、更科学的研究。

保罗（Paul，1969）完成了一项著名研究，他针对那些对公开演讲感到特别恐惧的大学生进行了治疗。首先，要求所有被试在一名不熟悉的听众面前做一小段即兴演讲。以观察者的评定、生理指标和自陈问卷来测评被试的焦虑程度。然后，将被试随机分配到三个不同的治疗组：（a）系统脱敏治疗组；（b）顿悟治疗组（与精神分折相似）；（c）无治疗组（控制组）。有经验的治疗师将所有治疗分为5个疗程，然后将所有被试安排在相同的公开演讲场合，并测量所有焦虑指标。图9—3展示了研究结果。显然，在所有治疗方法中，系统脱敏治疗对减少焦虑明显更有效。更具有说服力的是，两年的跟踪调查显示，系统脱敏组中85%的人仍有明显改善，而顿悟组只有50%。

图9—3 焦虑治疗的结果

资料来源：引自Paul，1969。

众多有关行为治疗的研究仍然引用沃尔普早期的著作作为他们理论支持的一部分。他将经典条件反射概念应用在心理疾病治疗中，使之成为普遍情况下干预策略的一部分。例如，有一项研究（Fredrickson，2000）以沃尔普的交互抑制概念为理论依据，发展了一种新的治疗策略，专门治疗由焦虑、抑郁、攻击和应激等消极情绪引起的健康问题。弗里德克森（Fredrickson）提出，应帮助和教会那些有这类心理问题的病人产生更多和更强烈的积极情绪，如爱、乐观、快乐、兴趣和满意，这将直接抑制消极思维。他认为：

积极情绪通过消除由特殊因素引起的不良身心状态，来解除消极情绪对个体思维和机体的束缚……治疗使人的健康状态更趋完善，并培养了人的积极情绪。这种积极情绪不仅可抵制消极情绪，而且拓宽了个体惯常的思维模式并建立了个人的应对策略资源（P.1）。

另一篇以沃尔普的研究为依据的文章，探讨了系统脱敏疗法治疗数学焦虑症的有效性（Zettle，2003）。对于这种恐惧症，相信很多学生都不会陌生。在这项研究中，沃尔普的治疗技术被用来帮助学生克服极端的数学焦虑水平。研究者给被试提供渐进式肌肉放松训练的指导语和一盘每天在家练习放松的磁带。研究者和每一名学生共同商讨列出一个有11项条目的数学焦虑层次表，包括诸如“被数学老师点名在黑板上解题”或者“在期末考试中遇到一道不会做的应用题”这样的条目（P.205）。然后，如前面所描述的，给每一名学生呈现焦虑层次。简言之，的确有效！治疗结束时，12名学生中有11名“显示他们的数学焦虑水平恢复正常或得到改善……而且，在治疗结束后的两个月间，对被试数学焦虑的治疗仍显示出显著的效果”（P.209）。

结论

沃尔普在他的文章中随即指出，克服恐惧和焦虑的想法并不新鲜。“其实人们很早就知道，增加与恐惧物体的接触机会会使恐惧渐渐消失”（P.200）。事实上，即使你在读这一项研究之前，从来没有听说过系统脱敏治疗，但这些道理也可能是你早已知道了的。例如，假设一个13岁的男孩有一种对狗的恐惧，这种恐惧可能是由于在男孩更小的时候，曾有过与狗有关的可怕经历，如被大狗攻击、被任何一只狗咬伤，甚至是父母亲中有一人怕狗（通过模仿机制，恐惧症可以由父母传递给孩子）。由于这样的经历，男孩在狗与恐惧之间形成了联系。如果你想治疗男孩对狗的恐惧，你会怎么切断这种联系呢？多数人对这个问题的第一反应是：“给这孩子买一条小狗！”如果你也是这么想的，那你就使用了系统脱敏疗法。

研究35 投射出真正的你

Rorschach, H.(1942).Psychodiagnostics: A diagnostic test based on perception.New York: Grune & Stratton.

在一个温暖的夏日，你和你的朋友躺在一片绿油油的草地上休息，蓝天上飘着几朵棉絮般的白云，你指着其中一朵白云对朋友说：“看，那朵白云多像一个穿着婚纱的新娘，拖着长长的裙摆。”你的朋友回答说：“哪儿？我看不出来。在我看来，那倒像一座火山，有一缕轻烟从它的顶部升起。”当你们试图劝说对方接受彼此对于同一形状的不同知觉时，气流的变化又将云朵变成了完全不同的样子。但是，为什么你们俩看到的东西竟然会如此不同？你们面对的是同样的形状，而对它的解释却是两种完全不相关的物体。

由于每个人的知觉都受心理因素的影响，因此从云的形状里看出来的不同物体或许代表观察者人格的某些方面。换句话说，就是你和你的朋友把自己心里的某些东西投射到了天空中的这些形状上。这就是赫尔曼·罗夏（Hermann Rorschach，1884~1922）构建其“图形解释测验”（form interpretation test）的理论基础，也叫“墨迹测验”（the inkblot test），它是投射技术这种心理测验工具的最早版本之一。

最著名且应用最广泛的两个投射测验是罗夏墨迹测验（本研究中将讨论）和主题统觉测验（简称TAT，见研究36）。这两个测验在临床心理学的历史上占有重要位置。罗夏墨迹测验在1921年第一次出版，其中涉及对多组精神病患者的直接比较，常用于有关心理疾病的诊断。

投射测验就是给被试呈现一个模棱两可的图形，并假设被试在描述这个图形时会把自己内部的或无意识的心理过程投射其中。在罗夏墨迹测验中，刺激只不过是一幅对称的墨迹图，它是如此模棱两可，以至于几乎可以被知觉为任何事物。罗夏认为，一个人把墨迹看成是什么东西常常在很大程度上揭示了他或她真实的内部心理加工过程。他称之为“对随机图形的解释”（the interpretation of accidental forms）。有一个常被提到的有关罗夏墨迹测验的故事，讲的是一个心理治疗师给一个病人做罗夏墨迹测验，在呈现第一张图片时，心理治疗师问：“这卡片使你想起了什么？”病人回答：“性。”呈现第二张图片后，治疗师问了同样的问题，病人又回答：“性。”当第一组的5张图片都得到了同一个答案时，心理治疗师评论道：“看来，你的大脑已经被性占据了。”对此，病人吃惊地回答道：“我？医生，是你呈现了这些有关性的图片！”当然，这个故事把罗夏墨迹测验过分简单化了，而且通常来讲，性方面的含义不应该比其他方面更多。

罗夏相信，他的投射技术可以用作两个主要目的：一是它可以作为一种研究工具，以揭示人格的无意识方面；二是罗夏稍后提出的，他希望这个测验可用于各种类型的精神病理学诊断。

理论假设

罗夏技术的理论基础是，在对随机墨迹进行解释时，被试的注意力被转移，使得其惯常的心理防御相对减弱。进而，深藏于心中的想法慢慢浮现。倘若被知觉的刺激是模棱两可的（也就是说，没有多少线索能说明它是什么），那么对刺激的解释就必将来自于个人的内心深处（与此概念相关的讨论参见研究36中默瑞的TAT测验）。在罗夏的概念中，墨迹要尽可能地模棱两可，才能使人最大限度地投射自己的无意识。

方法

罗夏形成墨迹测验的方法可分为两个主要部分：一是他编制原始图形的过程。二是对被试或当事人的反应进行计分和解释的方法。

测验的发展

罗夏对于墨迹图形如何制作的解释，听起来很像是创作有趣的儿童艺术作品：“制作这种随机图形非常简单：把少许大滴墨水滴在一张纸上，将纸对折，墨水就会在纸的两半对称地扩散。”（P.15）然而，简单的部分到此为止。罗夏进一步解释说，只有那些满足一定条件的图形才能使用。例如，图形必须相对简单，并对某些含糊的物体有适度的暗示。他还提出，图形必须是对称的，因为不对称的墨迹会由于难以解释而为被试拒绝。经过大量测试，罗夏最终确定了10个图形，组成了最早的罗夏墨迹测验。其中，五张图是黑白色，两张是黑色和红色，三张是彩色。图9—4呈现了罗夏所用图片类型的四张图形。

施测和计分

罗夏图形解释测验的施测非常简单，即每次呈现给被试一张图片，并提问：“这可能是什么？”被试可自由地改变图片的方向，也可以按自己的喜好将它放得离眼睛远点儿或近点儿。施测人员或治疗师不给被试任何提示或建议，而是只记录被试对每个图形的所有反应。测验没有时间限制。

罗夏指出，被试几乎都会认为这个测验是用来测试人的想象力的。然而，他非常认真地解释说，它不是一个想象力测验，并且人想象力的创造性高低不会明显改变测验的结果。罗夏认为，这是一个知觉测验，并涉及感觉、记忆、无意识和意识的过程，这些刺激图形与个体内心的某种力量联系在一起。

图9—4 与罗夏图形解释测验中使用的图片类似的一些随机图形示例

资料来源：Science Museum/SSPL/The Image Works。

罗夏列出了被试对10张墨迹图回答的几条计分规则（P.19）：

1.总共作出多少次反应？反应时间，即在回答之前被试花了多长时间看图片？被试拒绝解释卡片的次数有多少？

2.被试的解释只取决于图形的形状？还是也包含了颜色？或在知觉中是否包含了运动？

3.图形被看成是一个整体还是几个部分？哪些部分被分离出来？被试对此如何解释？

4.被试看到了什么？

有趣的是，罗夏认为在被试对墨迹做出的回答中，对图形内容的解释是最不重要的。以上我们总结了罗夏依据这四条计分规则，对众多有不同心理症状的被试进行观察的结果。

结果

为了解不同人群在墨迹测验中可能做出的不同表现，罗夏和他的同事对来自不同群体的被试进行了施测。这些群体不仅包括受过不同教育的正常个体，还包括精神分裂症患者及躁狂抑郁症患者。

表9—2列出罗夏所报告的对10张墨迹图的典型反应类型。当然，这些反应会因个体或群体的不同而发生变化。在表中列出的仅是一些例子。

表9—2 一般正常被试对墨迹图的典型反应

罗夏发现被试通常对10个图形共给出15到30个反应。抑郁的被试一般给出的答案较少；快乐的被试给出的答案较多；精神分裂症病人的答案数目在个体间有很大的差异。全部测验通常需要20分钟~30分钟完成，精神分裂症患者所用时间平均较正常人少很多。正常被试几乎从不拒绝对所有图形做出回答，但精神分裂症患者常常拒绝回答。

罗夏认为，被试关注图形的哪一部分、解释中是否包含运动、反应中有多大程度涉及颜色等对分析被试的测验结果都是非常重要的。这些常常比被试具体看到了什么更重要。他关于这些因素的计分方案是非常复杂的。而且临床医生需要经过训练和体验，才能熟练恰当地分析被试的回答。不过，格莱特曼（1991）已经为我们提供了关于计分过程的有效而简洁的总结：

使用整个墨迹图进行解释显示了被试综合思维和抽象思维的能力，而解释细节部分的频率很高则意味着被试有强迫性的固执。相对较多地使用白色部分是叛逆和消极的信号。描述人在运动的回答显示了被试的想象力和丰富的内心生活；在回答中颜色占主导地位说明被试较感情用事和冲动（P.684）。

罗夏发现，关于被试实际上在墨迹中看到了什么，最常见的回答为动物类和昆虫类。回答中涉及动物的反应比例占25%~50%。有趣的是，抑郁症患者回答动物的比率最高，而艺术家回答动物的比率却最低。

罗夏提出的另一类型的反应是“独创性回答”（original responses）。这指的是那些在每100次测验中发生的概率少于1次的回答。独创性回答在被诊断为精神分裂症的被试中最为常见，而在中等智力水平的正常被试中最为少见。

讨论

在对图形解释测验所进行的讨论中，罗夏指出，测验的最初目的是为研究一些有关人脑和心理无意识方面的理论问题，而发现该测验有作为诊断工具的潜力纯属偶然。罗夏认为，他的测验常常可以预示精神分裂症倾向、隐匿性神经症、潜在的抑郁、内向或外向性格和智力。但他的意思并不是说墨迹测验能取代通常的临床诊断技术，只是可以对诊断过程有所帮助。罗夏也警告说，虽然测验可显示一定的无意识倾向，但不能详细探明无意识的内容。他认为其他当时的常用心理学技术，像弗洛伊德梦的解析和自由联想是解释深层无意识的更好方法。

批评和后续研究

自从罗夏编制了墨迹测验后，几十年以来大量研究都对罗夏的许多结论提出了质疑。最重要的批评之一与测验的效度有关——测验是否测量到了罗夏所要测量的东西，即潜在的无意识的心理问题。有研究证明，许多罗夏归因于心理人格反应差异，可以很容易地为下列因素所解释：如言语能力、被试的年龄、智力水平、受教育程度甚至是施测者的人格特征（关于这些问题更详细的讨论参见Anastasi & Urbina，2007）。

科学研究显示，从整体上讲，罗夏墨迹测验作为一种人格测验或诊断工具，其准确性并不令人满意。尽管如此，该测验在临床心理学家和心理治疗师中仍应用甚广。这种明显的矛盾可以这样解释：罗夏墨迹测验技术确实常在临床中应用，但它并不作为正式测验使用，而只是作为治疗过程中，治疗师增加对当事人的了解以及打开话题开始交流的一种手段。其实质是延伸了治疗师和当事人之间的言语交流。测验中对反应的用途较少受严格限制，一些治疗师认为这为有效的心理治疗提供了有帮助的见解。

近期应用

对最近的心理学相关文献进行回顾发现，罗夏评定量表的效度仍然是人们研究和争论的焦点（关于这一争论的全面概述参见Woodet al.，2003；Exner & Erdberg，2005）。从精神分析研究前沿得到的几项研究结果表明，新的施测和计分方法可提高量表的评分者信度，且可增进诊断和鉴别各种心理障碍的能力。例如，阿瑞拉和（Arenella）和奥杜夫（Ornduff，2000）采用罗夏墨迹法研究受性虐待女孩和其他应激情境中未受虐女孩在在身体意象方面的不同。研究者发现，前者在罗夏墨迹测验中的作答方式表明她们比后者更关注自己的身体。类似地，研究者得到了一组66名年龄在14~17岁之间的年轻的精神病男性罪犯的罗夏墨迹测验分数（Loving & Russell，2000）。该研究发现，至少罗夏墨迹测验的某些标准变量与精神病理学的各种水平存在明显联系。作者认为，罗夏墨迹测验可以预测哪些青少年正处于暴力犯罪的高危阶段，因此有助于人们进一步改进预防和干预策略。

一项研究推进了关于罗夏墨迹测验效度争论的有趣进展，该研究在对性犯罪者的心理评估中，将罗夏墨迹测验和客观性心理测验的明尼苏达多相人格调查表MMPI（Minnesota Multiphasic Personality Inventory）相比较（Grossman等，2002）。在评估性犯罪者是否患有心理障碍时存在一个常见的问题，那就是他们经常会否认有心理问题或将任何心理问题的严重性降到最低。这项研究发现，能够在MMPI测验中“装好”而得出正常的心理剖面图的性犯罪者，在罗夏墨迹测验中会作为心理异常者被曝光。“这些发现显示罗夏墨迹测验能够察觉‘装好’的企图，并因此可能在常有罪犯故意歪曲事实的法庭上提供有价值的信息。”（P.484）当然，经过改编的罗夏墨迹测验的效度与原始的罗夏墨迹测验存在同样的问题。

结论

这些研究连同许多其他的研究均证明了罗夏所作贡献的持久影响力。伴随着罗夏墨迹测验的改进和更广泛的应用，未来的研究可能会指向投射测验的开发与改进，使其能够提供更好的科学效度和更有价值的治疗洞察力。

研究36 编个故事吧

Murray, H.A.(1938).Explorations in personality (PP.531-545).New York: Oxford University Press.

在研究35中，我们结合罗夏墨迹测验介绍了一种叫作“投射测验”的方法，它常被一些临床心理学家用来揭示被试的某些人格特征。罗夏墨迹测验背后的思想就是让个体把自己的解释投射到客观上毫无意义、也没有任何结构的图形上。为了获知被试的人格特征，罗夏考察了被试对墨迹图中的特定部分及其各种具体细节的关注和对图形中运动的感知，从而得出关于被试人格特征的结论。虽然该测验也考虑被试解释的情节内容，但这不是最重要的。

在罗夏墨迹测验问世几年以后，亨利·A·默瑞（Henry A.Murray，1893~1988）和他的同事克里斯蒂安娜·摩尔根（Christiana D Morgan）在哈佛心理诊所合作编制了另一种完全不同的投射测验，称为“主题统觉测验”（Thematic Apperception Test，TAT）。该测验把注意的焦点全部集中在被试解释的内容方面。与罗夏墨迹测验无结构的图形不同，TAT测验由一套黑白图片组成，图片中人物所处的情境没有特定含义。该测验要求心理治疗中的当事人或被试看图来讲故事，然后治疗师或研究者将故事的内容进行分析，以期揭示被试隐藏在无意识中的冲突。

TAT测验的理论基础是，当你观察人的行为时，无论是在图画中，还是在现实生活中，你对该行为的解释将以情景中可获得的线索为依据。倘若行为的原因显而易见，那么你的解释将不仅仅是大致正确的，而且也会与大部分观察者相一致。然而，如果情景模棱两可且很难找到行为的原因，那么你的解释似乎将更多地反映出与你自身有关的某些东西——你的恐惧、愿望、冲突等。例如，假设你看到一个男人和一个女人的脸，他们仰望着天空，表情迥异：男的似乎受到惊吓，而女的正在开怀大笑。你觉得难以解释他们的表情，然而一旦进一步仔细观察，你发现他们正排队等着乘坐“京达卡”（Kinda Ka），它位于美国新泽西州六旗大冒险乐园，是世界上最高、最快的云霄飞车。现在，你觉得在该情景中推测这对夫妇的行为更为容易了，并且你的分析可能与其他观察者更为相似。现在假设你在孤立的、没有任何线索的情景下看到相同的表情，然后问你：“这些人在干什么？”你的回答将以你的内心想法为解释，并且它会更多地揭示你的内心世界而不是你观察的对象。此外，由于孤立行为的意义模棱两可，因此不同观察者的回答将有很大区别（例如，他们正在看飞碟，或在看一场滑雪赛，或在看孩子们在玩攀高游戏，抑或是看一场逼近的暴风雨）。这些个人认知看法的差异形成了默瑞和摩尔根的主题统觉测验的理论基础。

理论假设

TAT测验的基本假设与罗夏测验相同，即认为人的行为是由无意识力量驱动的。这一观点隐含着最早由弗洛伊德发展起来的心理动力学的原理（参见研究30中有关弗洛伊德理论的论述）。该理论认为，为了准确诊断和成功治疗心理问题，必须揭示无意识冲突（通常形成于童年）。这是研究35中讨论过的罗夏墨迹测验的目的，它同样也是默瑞TAT测验的目标。

默瑞写道：“这一程序的目的就是刺激文学创作，从而激发幻想，以揭示在潜意识中的情结。”（P.530）他对这个过程的构想是，给被试呈现模棱两可的描绘人类行为的图画。为了解释图画，当事人的自我意识会有所下降，也不太会意识到治疗师正在观察他们。这将进一步减少当事人的自我防御，揭示出其内心的愿望、恐惧以及被压抑的过去经历。默瑞还指出，这一测验的理论基础的一部分是“大量的文学创作是作者自身的经历或幻想在意识或潜意识中的表现”（P.531）。

方法

TAT测验的最初设想是，让被试猜想是什么原因导致了画中描述的情景，其结果将会如何（如图9—5所示）。测验的结果显示，比起让他们猜想这幅画所描述的事实，让被试简单地就这幅画编一个故事能使主试获得更多的信息。

图9—5 一张TAT图片的样例。你会怎样解释这张图画呢？

资料来源：Van D.Bucher /Science Source。

莫瑞和摩尔根研发了一些图画，来激发人们产生关于其生活中的内心冲突和重要经历的幻想。因此，他们决定，每一幅图画必须至少包括一个易为被试辨认的人物。通过对几百幅图画的反复试误，最终选择了20幅图画。由于TAT测验现在已为人们熟知，许多人认为测验用图片的广泛传播会降低测验的效度。不过，如果你没有见过测验所选择的图画类型，就很难理解该测验。因此，图9—5呈现了最初备选图中的一幅图画，但它没能入选最终的20幅测验图画中。

默瑞对TAT测验进行了一项早期研究，并将研究结果收录在自己1938年出版的一本书中。这项研究的被试均为年龄在20~30岁之间的男性。每位被试坐在一张舒适的椅子上，背对着主试（这是心理治疗师施测TAT测验时的常见情景），以下是给每个被试的确切指导语：

这是一个测量你创造性想象力的测试。我将呈现给你一幅图画，希望你根据这幅画，编一个情节或一个故事。画中人物的关系如何？在他们身上发生了些什么事？他们当时的想法和感受是怎样的？结果会如何？请尽你的最大努力来完成这项任务。我要求你尽情发挥你的文学想象力，因此，你尽可以按照你希望的长度和详细程度编写这个故事（P.532）。

主试依次向被试呈现图画，并记录被试对每幅图画的描述，每个被试有一个小时的时间。由于时间的限制，大多数被试只能完成20幅图画中的15幅。

几天以后，被试被重新召回，并被问及与故事有关的一些问题。为了掩饰研究的真实目的，被试被告知该研究的目的是比较他们与著名作家的创造力。主试重复被试上一次对图画的反应，并要求他们解释故事的来源。而后让他们接受一个自由联想测试，在这个测试中主试要求被试在主试报出一串词以后，说出自己的第一反应。这些工作是用来判断被试依据图画所编的故事在多大程度上反映了他们的个人经历、冲突、愿望，等等。

结果和讨论

默瑞和摩尔根报告了他们从这项早期研究中所得出的两个主要发现。

第一是发现被试所编的故事有四个来源：（a）书籍和电影；（b）发生在朋友和亲属身上的真实生活事件；（c）被试自己的亲身经历；（d）被试意识或潜意识中的幻想（P.533）。

第二项发现，也是更重要的发现，即被试很清晰地把自己的人格、情感以及心理投射到他们的故事之中。作者报告的其中一个例子是，大多数学生被试会把一幅画中的主人公看作学生，而非学生被试就不会这么做。另一个例子中，一名被试的父亲是一名船工，并且被试有一种想去周游世界的强烈愿望，这种幻想出现在他对好几幅图画的解释中。

例如，对一幅描绘两名工人谈话的图画，这位被试的故事是：“这两个小伙子是一对冒险家，他们总是筹划在不同寻常的地方会面，他们现在正在印度，并已听说南美发生了一场革命，他们在商讨如何到那里去……最后，他们搭乘货船到达了那里。”（P.534）默瑞在报告中写到，无一例外，每一个参加研究的人都把自己人格的某方面投射到他们的故事中。

为了进一步说明TAT测验是如何反映人格特征的，作者对其中一个被试的情况做了详细报告。维尔特（Virt）在第一次世界大战期间，经受了迫害、饥饿、与母亲分离等这些恐怖的童年经历后，从俄国移民到了美国。默瑞这样描述TAT测验的第13张图画（这里没有画出）：“一个男孩儿坐在地板上，背靠着长沙发，头斜靠在右臂上，卷曲着身子。在他旁边的地板上有一个形似左轮手枪的东西”。（P.536）当维尔特看到这幅画时，他所编的故事如下：

可怕的事情发生了，他所爱的某个人——也许是他的妈妈自杀了。她可能因为贫穷而自杀。他已经是一个懂事的孩子，明白眼前发生的一切，他也想自杀。但他毕竟是一个孩子，并且没多久就振作起来。有一段时间，他一直处在不幸之中，最初的几个月他想到死（P.536）。

把这个故事与最近其他人就同一幅画所编的故事进行比较，你会有非常有趣的发现：

1.一名35岁的初中老师描述道：“我想这幅画的主人公是一个没有犯罪却被判坐牢的人。他否认自己犯过罪并在法庭上一遍又一遍地抗争。但最终他放弃了。现在，他已经精疲力竭、抑郁而绝望。他做了一支玩具手枪企图逃跑，但他知道这也没有用。”（引自作者的文件）

2.一名16岁的中学生描述道：“这个女孩可能正与她的兄弟玩捉迷藏游戏，她正在从1数到100。她很忧伤也很疲惫，因为她从来都没赢过但又不得不玩。在此之前男孩子们似乎在这儿玩过其他游戏，因为有一把玩具枪在那里。”（引自作者的文件）

你不必像一名心理治疗师那样去预测这三个人可能把他们的哪些内部冲突、动机或愿望投射到了这一幅图画上。这些例子也证明，对于TAT测验，不同的人可能会有明显不同的回答。

批评和相关研究

虽然TAT测验所使用的刺激与罗夏墨迹测验差异很大，但它也在信度和效度方面遭到同样的批评（参见研究35中罗夏墨迹测验中对该问题的有关论述）。TAT测验最严重的信度问题是，对同类反应，不同的临床医生会给予不同的解释。有人认为，治疗师可以在不经意间把自己的潜意识特性加入到被试对图画的描述之中。换言之，对TAT的解释可能会变成对实施该测验的临床医生的投射测验！

就效度（即TAT对其所要测量的东西测到什么程度）而言，人们会提出数种批评。如果该测验测量了基本心理过程，那么它就应该可以鉴别正常人和精神病人，或鉴别不同类型心理疾病。但研究显示，它不能进行这样的鉴别。在爱伦（Eron，1950）的一项研究中，对两组男性退伍军人实施TAT测验，一组是大学里的学生，而另一组是精神病院的病人。在对TAT测验结果进行分析后，研究者发现在这两组之间或在不同类型的精神病人之间均无显著性差异。

其他一些研究对TAT测验预测行为的能力提出了质疑。例如，如果一个人在其故事中涵盖了大量的暴力，这并不能区分这种攻击性只存在于其幻想中，还是真实暴力行为的潜在表现。有些人容易产生攻击性的幻想而从不表现出实际的暴力行为，而另一些人的攻击性幻想则预示着实际的暴力冲动。由于TAT测验的反应不能说明某一个体应归为哪一类，因此该测验在预测攻击倾向方面的价值很小（见Anastasi & Urbinai，1996）。

另一种对TAT测验基本的、也是非常重要的批评（批评内容之一也指向罗夏墨迹技术）是对投射假说本身的有效性提出怀疑。TAT测验依据的假设是，人们对图画所作的描述揭示了他们的基本人格特征，以及持续进行的潜意识心理过程。不过，有科学证据表明，对像罗夏墨迹测验和TAT测验等投射测验的反应，会更多受随机因素和情境因素的影响。这就意味着，假设你周一刚做完工作、与老板大吵一架后做一次TAT测验，然后周六从海滨轻松地玩了一天回来再做一次TAT测验，在这两种情况下，你依据图画所编的故事可能会完全不同。批评者指出，造成故事内容不同的原因是因为TAT测验只反映了你当前的心理状态，而不是你的真实的潜在自我。

作为该批评的一项证据，有研究已找到了各种与TAT测验结果相关的影响因素：饥饿、缺乏睡眠、药物使用、焦虑水平、挫折、语言能力、施测人员的特征、被试对测验情境的态度和被试的认知能力。依据这些发现，心理测验领域的权威人物之一安妮·安娜斯塔西（Anne Anastasi）曾写道：“许多研究倾向于质疑投射假说，有充足证据表明两选一的方式能更好地解释个体对无结构刺激的反应。”（Anastasi & Urbinai，1996）

近期应用

每一年，默瑞的研究和主题统觉测验仍然被众多的人格特征研究及人格测验的研究所引证和使用。一项研究将诊断为分离性障碍的患者，如创伤性遗忘和分离性身份识别障碍（以前被称为多重人格障碍）与精神病院的住院病人的TAT作答进行比较（Pica et al.，2001）。研究者们发现，在分离性障碍病人中，TAT图片的作答几乎不包含积极情绪。“分离性障碍被试的测验行为特征包括转换、恍惚状态、访谈中的遗忘（在访谈过程中对部分内容的遗忘）和对图片产生强烈的（激动的）抵制情绪”（P.847）。

默瑞1938年的研究也为不少有关人格障碍的研究所借鉴，这些研究涉及反社会人格（不顾及别人的权利；缺乏内疚感或良心）、回避型人格（长期的和持续的不恰当情绪）、边缘型人格（激愤，极不稳定的人际关系）和自恋型人格（极端的自我重要感，非常需要别人的赞美）。一些研究发现，TAT和测验可成功鉴别所有这些人格障碍并且TAT分数与MMPI（明尼苏达多相人格问卷）分数一致。MMPI是一个应用广泛并有较高效度的较客观的人格评定工具（Ackerman et al.，1999）。

人们对含义模糊图片的解释绝大多数是随着文化的不同而改变的，承认这一点非常重要。有研究证实了这一点。该研究分析了赞比亚青少年与德国青少年对TAT的反应（Renaud & Murry，1996）。如你所想，这两个被试组在文化、信仰、受教育程度和生活经历方面都非常不同。作者发现，两个被试组对研究中所使用的五张TAT图片的意象复杂性和解释有非常显著的差异，以至于作者指出，事实上使用TAT这个方法比较不同文化下人们的重要心理变量可能是无效的。

结论

像TAT测验和罗夏墨迹测验等投射测验最引人注目的一个方面是，尽管有大量的证据谴责它们信度、效度低，理论基础可能不正确，但它们仍在治疗师常用心理测验之列。事实上，临床医生仍然热衷于这些测验工具，而实验心理学家却渐渐对它们有了戒心，这成为两组不同专业的人群争论的焦点（关于此问题的综述，参见 Lilienfeld，Wood，& Garb，2000）。我们如何调和这一矛盾呢？对这一问题最普遍的答案是，TAT和罗夏墨迹测验通常用于心理治疗而非用作正式的诊断工具，更多的是作为临床医生与其病人早期访谈的补充。随后，治疗师们以非常个人化的方式使用这些测验以打开其与来访者的交流通道，并进入来访者若没有TAT的故事提示可能回避或隐藏的心理领域（参见Cramer，2006）。正如一名执业心理治疗师所说：“虽然我不给当事人对TAT的回答打分或用它做诊断依据，但是图画是一种奇妙而有效的工具，把我们带入当事人生活中受困扰的领域。这些问题从进行TAT测验的过程中流露出来，能使治疗更有针对性，也更有效。”

第十章社会心理学

社会心理学是心理学的一个分支，它主要探讨的问题是：别人怎样影响你的行为，而你又怎样影响他人的行为。简言之，社会心理学就是研究人与人相互作用的一门科学。心理学的这一分支内容很庞杂，范围涉及广泛，包括浪漫的爱情关系、集体行为，以及偏见、歧视、攻击行为等多种主题。这可能是很多非心理学家的人认为与自己个人生活最为相关的一个心理学研究领域。我们所有人大多数的清醒时间都在以不同方式与他人进行相互作用，所以我们自然想知道更多包含在我们的社会关系之中的心理学过程。而且，社会心理学包含大量具有里程碑意义的科学研究，其数量之多在心理学领域中也屈指可数。

本章所选取的四项研究以以下几种方式使心理学发生了明显的变化：（1）为人们提供了看待人类社会行为的全新视角；（2）激起新的研究浪潮，使人们或证实，或改变，或反对原有的研究结果；（3）引起了关于研究伦理的热烈争论，并最终促成了在本书前言中讨论的伦理守则。

第一项研究是心理学史上最为著名的研究之一：菲利普·津巴多的“斯坦福监狱实验”，这项研究产生了一些关于监禁心理学的惊人启示；第二项研究探讨了从众效应对行为的决定作用；第三项研究揭示了一个令人惊讶的现象，叫作“旁观者效应”，这种现象是指在危难时刻，旁观者越多，愿意伸出援手的人就越少；最后，我们所要接触的也许是心理学史上最闻名于世的研究（在某种意义上也可以说是名誉尽失的研究）——斯坦利·米尔格拉姆（Stanley Milgram）的“盲目服从权威的研究”。

研究37 斯坦福监狱实验

Zimbardo, P.G.(1972).The pathology of imprisonment.Society, 9(6), 4–8.

Haney, C., Banks, W.C., & Zimbardo, P.G.(1973).Interpersonal dynamics in a simulated prison.International Journal of Criminology & Penology，1, 69–97.

你曾经被监禁过吗？先假设你我的回答都是“没有”。那你认识在监狱里待过的人吗？可能吧。无论如何，我们大多数人都对在监狱中生活所产生的心理效应知之甚少。你可能读过一些关于监狱的文章、故事或者小说，而且几乎可以肯定你曾经在电影或电视中看到过描述监狱生活的场景。基于这些了解，大多数人都可以确定监狱一定不是我们愿意卷入的地方！我们知道坐牢是一种可怕的经历，犯人会产生一些激烈反应，甚至是病态的行为。而且我们中的大多数人还认为那些被选作监狱工作人员的人，例如看守和狱警，可能拥有一些独特的人格特征。但是，行为科学家们如何系统地研究对于监狱工作人员和犯人来说，监狱经历所产生的心理和情绪效应呢？

正如大多数复杂的现实生活情境，研究监狱生活的心理学对于研究者来说是个挑战，因为使用的方法必须是相关研究。这就是说，我们可以观察监狱环境，访谈犯人和看守，在犯人释放后收集他们的信息，然后试图基于这些分析形成假设。但是我们不能科学地控制监狱环境，因而对于我们所观察到的行为的真正原因无法得到清晰有效的结论。是监狱改变了人们，还是在监狱中的人原本就是与常人“不一样”？一种绕过这个研究困境的方法可能是创建一个模拟的“科研监狱”，然后把人们分为“囚犯”和“看守”置于其中。听起来不可能吗？如果现在来做一项这样的研究可能会很困难，但是在30年前，著名的心理学家菲利普·津巴多和他的同事克雷格·哈尼（Craig Haney）、柯蒂斯·班克斯（Curtis Banks）、戴夫·杰夫（Dave Jaffe）在斯坦福大学进行了这样的研究（在本节开头列出的两篇文章就是关于他们研究的最早论述）。他们想创建一个模拟的监狱，其中由一些大学生随机分配扮演“看守”和“囚犯”。他们的“监狱”建在斯坦福大学校园里心理学系大楼的地下室（有关细节稍后会详述）。

理论假设

津巴多在研究中验证的假设是，相对于你的内在性情和天性，周围的环境和情境会更强有力地影响你的行为。津巴多主张，尽管我们拥有某些特定的遗传或内在行为倾向，但是强大的环境会战胜这些内在倾向，并导致我们做出一些与平时的自己截然不同的行为。津巴多和他的同事们想要看看，如果把正常人置于一个对个人施加强大影响的情境中，即监狱中，会发生什么情况。

除了环境对我们的行为具有强大影响这一最初的信念以外，研究者们并没有建立其他特定的假设。为了检验情境力量的影响，他们将所有被试随机指派为“看守”或者“囚犯”。这种随机的指派会导致两种角色在模拟监狱环境中表现出显著不同的反应，例如，在交往方面的行为测量、在心境和病理学方面的情绪测量、对于自我的态度以及应对和适应这一新异情境的一些其他指标（Haney，Banks, & Zimbardo，1973）。

方法设置

津巴多的目标是创设一个尽可能类似于监狱的情境。他请来一位曾坐过15年牢的前罪犯作为顾问。尽管在这项研究中监狱并不是真实的，而且研究中的被试都知道这一点，但是津巴多希望确保这个过程模拟了真实的监狱体验。

图10—1 “斯坦福监狱”的一个典型“牢房”

资料来源：菲利普·津巴多公司。

津巴多监督着一组工作人员将斯坦福大学心理学系大楼地下室的一些房间和走廊改造为一所“监狱”。由于研究计划持续两个星期，所以这所监狱需要好好建设。走廊的两头都拓宽了，实验室的房间成为监狱的牢房。为了增强真实感，单个牢房的门都在小窗上装了竖栏并配有单独的牢房号码（见图10—1）。沿着牢房的封闭走廊是“监狱院子”，囚犯被试可以从他们的牢房里出来到那里吃饭和活动。在走廊的尽头，是一间设计成单独囚禁的小黑屋，用来禁闭那些惹是生非、反抗和不尊重看守的，或者其他一些不合作的囚犯。浴室就在大厅里，但是守卫会把囚犯的眼睛蒙上把他们带过去，所以囚犯们并不知道他们的方位（Zimbardo，2007b）。“监狱”里装了一个隐藏的摄像机和内部通话系统，这样实验人员就可以保持对看守和囚犯行为的监督。

被试

如果你之前不熟悉这个研究，那么你接下来读到的内容可能会让你觉得很惊讶甚至是震惊。在你往下读的时候，试着把自己置于那些被试的心态。首先，研究者在位于斯坦福大学附近的加利福尼亚州帕洛阿尔托县的当地报纸上刊登广告，以每天15美元的报酬来招募志愿者参与有关监狱生活的实验研究（现在相应的被试报酬大概是每天75美元）。为了保证被试知情同意，研究者告诉这些志愿者该研究的大体性质，而且告诉他们在研究中可能会有一些违背他们个人隐私和公民权利的情况，他们获得的食物可能仅仅达到满足基本营养需要的最低限度。所有的志愿者都同意了以上各项条款。

研究者进行了大量的测试以排除有心理问题和犯罪前科的志愿者，最终从将近100名志愿者中选取了24名大学生。之后，通过投掷硬币的方式随机将这些人分成了“看守”和“囚犯”两组。要记得，津巴多在这个研究中的目标是将决定行为的内在人格因素和外部情境影响分离开来。所以，有必要确保这两组被试在开始的时候是尽可能同质的（Zimbardo，2005）。然后，没有任何的指导语、训练、或是对于接下来研究的准备，所有的被试都直接回到了自己的家。

研究程序

本研究的目标是观察、记录和分析囚犯和看守的行为。正如之前提到的，津巴多和他的同事们在寻找一些迹象，来说明这些年轻人所置身的情境和角色强度足以胜过他们每个人的人格特征和行为倾向。

“囚犯”：在初步筛选几天之后的一个星期天早上，分派到囚犯组的被试在自己家中被“突然袭击”，帕洛阿尔托警察局的一名（真正的）警官出人意料地敲响了被试的家门。所有的被试都以“抢劫罪”被逮捕，所有人都被搜查过、戴上手铐，被响着警笛、闪烁着警灯的警车迅速带离。所有囚犯都被登记在册、采集指纹，然后被蒙着眼睛关到单人牢房。之后，他们被告知将要被转移到“斯坦福县监狱”（也就是心理学系大楼地下室的那个模拟监狱）。

当这些囚犯到达监狱后，那些被分派充当守卫的被试对他们进行了搜身（见图10—2），脱光他们的衣服并用气雾喷雾器进行除虱。守卫们给每个“囚犯”发了以下物品：一件类似于罩衫的囚服，囚服上分别有四位数字的号码（这些号码将成为囚犯们在整个研究期间的代号）；橡胶拖鞋；需要一直套在头发上的尼龙袜（用来模拟大多数监狱中给囚犯剃光头的样子）；缠在脚踝上的加锁铁链（铁链并没有真的锁在什么东西上，只是为了提醒囚犯的身份）。津巴多指出，尽管这些程序与现实中的真实程序相比有所变化，但是这些程序背后的思想就是模拟羞辱、镇压，以及在真实监狱中囚犯的体验。这些囚犯每三个人被分在一个小囚室中，每人有一张简易床和一个薄床垫、一条毯子。三张简易床填满了整个空间，囚室里再没有空余的地方了。

图10—2 斯坦福监狱的“守卫”在对新来的“囚犯”搜身

资料来源：菲利普·津巴多公司。

“守卫”：与囚犯不同，守卫们不需要一直待在监狱里（毕竟他们没有被监禁），他们分为每组三个人，每组值8个小时班，不值班的时候他们仍然过自己的生活。他们领到了相同的监狱守卫制服、警棍（虽然不容许他们击打犯人）、反光墨镜（让他们看起来更有威慑力，而且外貌不太明显）。津巴多解释说他关于反光墨镜的想法来自保罗·纽曼（Paul Newman）在1967年主演的一部电影《铁窗喋血》（Cool Hamd Luke）（Zimbardo，2007）。这些守卫没有受过任何关于他们所扮演的角色的专门训练，而且仅仅被告知他们的责任是让囚犯们守规矩和维持监狱的秩序。

结果

这是心理学史上被最多探究、讨论和分析的研究之一。守卫们和囚犯们身上发生的人格和行为变化是如此地意义深刻且令人震惊。为了在有限的篇幅内总结那些复杂的研究发现，在表10—1中简要列出了被试的一些典型行为。在这里更笼统地描述了接下来的几天里“斯坦福监狱”中所发生的事情。

出乎任何人的预料，这些囚犯和守卫身上的真正特性和人格似乎很快就消失了，取而代之的是他们被要求扮演的角色。在一天之内，“演戏”和现实生活之间界限就变得模糊，令人感到不安。正如津巴多在他的最初的研究中关于这些被试的描述（1972）：

大多数人真的变成了“囚犯”和“守卫”，不再能区分角色扮演和自我……在不到一周的时间里，监禁的体验（暂时地）破坏了一生的学习；人类的价值被搁置，自我概念受到挑战，人类本性中最底层、最丑陋的病态面显露出来。我们觉得非常恐怖，因为我们看到一些男孩们（守卫）把其他人当作是卑劣的动物一样对待并且乐于享受那些残忍的行为；而另一些男孩们（囚犯）变成了卑屈顺从、失去人性的机器人，他们只能想到逃跑、自己个人的生存，以及对守卫们越来越多的仇恨（P.4）。

要记得，这是一个由高水平的专业研究者开展的一项科学研究，而且它很快就有了自己的生命力。参与的被试们，尤其是那些扮演囚犯的被试，似乎忘记了他们是具有自由意志的大学生。他们随时可以直接退出研究，但是并没有这么做。在几天以后，许多被试申请假释或释放，但是当释放请求被驳回后，他们仅仅是沮丧而顺从地回到牢房。囚犯组的被试中有五个人的情绪崩溃和应激反应非常强烈，他们变得抑郁、无法清晰思考甚至绝食。因此，研究者不得不在研究开始的最初几天就让他们退出了研究（或更确切地说，是让他们离开了这个监狱）。

其中一些守卫开始折磨囚犯，显然他们很享受由自己的地位所带来的权力。有些守卫不那么严厉，并且努力去保持公平，但是他们也一直没有干涉那些残暴专横的守卫，而且更重要的是，他们也从未提示实验者其他守卫可能超过了其角色的分寸。甚至津巴多本人也时常忘记他在负责一项科学研究，而是发现自己不自觉地进入“监狱主管”的角色。

表10—1 “囚犯”们和“守卫”们在“斯坦福监狱”研究中的行为和反应

近期应用

如同米尔格莱姆关于服从的研究（详见研究40）一样，津巴多开展的监狱研究在这三十多年来产生了全面的社会影响和政治影响。即便这不是不可能，但是要脱离研究的政治属性来讨论津巴多的研究结果是一件困难的事情。在美国以及世界上其他大多数国家，监狱改革都是最受争议的热点话题之一。在历史上，针对囚犯的系统化虐待是有文件记录的，而且这一情况延续至今。从津巴多开展研究的那个年代到今天，美国关于监狱暴动、叛乱、反叛、绑架及谋杀的历史充满了大量与斯坦福大学地下室所发生的那些事件类似的事情。美国监狱和拘留所中囚犯的数量从20世纪80年代的50万左右增加到2006年的220万人，这进一步加剧了虐囚事件发生的潜在可能（Bureau of Justice Statistics，2007）。美国在监人员的数量位于世界之首。而且，20世纪70年代中期以来，监狱的教育改造目标基本上被废弃了（尽管罪犯教养所的名称还在广泛使用），取而代之的是惩罚目标和将罪犯与公众隔离的目标（称为剥夺其能力）。在1998年，津巴多和哈尼分析了自从他们在斯坦福的研究以来，监狱系统是如何变化的。这里呈现的是津巴多关于他们分析结论的表述：

监狱采用惩罚和将罪犯隔离的内在模式，而不是其他一些可能会降低高累犯率的基本改造措施，这仍然是失败的社会实验。我们的分析显示，监狱的条件在我们研究之后的几十年里显著恶化，这是监狱政治化的后果。媒体的夸大其词让选民们担心犯罪，而政治家、检察官、地方检察官及其他一些官员则对犯罪采取强硬立场，以此来获取选民的支持（Zimbardo，2005）。

阅读到这里，你可能在思考津巴多的监狱研究与过去15年中美国参与的中东战争中发生的一些事件之间的可能联系。一些高度报道的事件，尤其是伊拉克阿布·格莱布监狱虐囚丑闻和关于古巴关塔那摩湾拘留营虐待拘留者的报道（参见Hooks & Mosher，2005；Keller，200），将“斯坦福监狱研究”重新带回公众关注的焦点。津巴多在其最近的著作《路西法效应：理解好人是如何变坏的》（The Lucifer Effect.Understanding How Good People Turn Evil，2007a）中，回顾了监狱研究并把他关于囚犯虐待的研究和评论从监狱拓展到人类罪恶这一更大的概念。我们不相信类似阿布格莱布监狱事件可能会真实地发生，不相信任何人，尤其是自由、民主社会中的公民可能会对其他人做出如此残酷的虐待。怎么会发生这样的事情呢？像津巴多一样的心理学家和其他社会科学家们试图帮助我们理解这种现象。正如一位研究这些虐待事件的作者指出：

新闻记者们在寻找一些社会科学研究来理解在伊拉克、阿富汗以及世界上的其他地方发生的虐待事件。这些报告不再强调少数的“烂苹果”，转而质疑对于那些最底层士兵的惩罚。津巴多（1972）的研究在这些报告中很引人注意。他不同意“烂苹果”理论，而是主张是装苹果的木桶坏了。津巴多批评布什政府的“领导失败”，他着重指出那些对囚犯的虐待性审讯手段和严厉待遇得到了布什政府最高级官员和军队官员“由上而下的授权”（Hooks & Mosher，2005，P.1632~1633）。

从来自伊拉克、阿富汗、关塔那摩的一份份报告当中，我们听闻并从图片细节中看到守卫和审讯官对囚犯实施的可怕的虐待和折磨。而在所有的报告中，这些守卫和审讯官们就像津巴多监狱实验中的被试们一样，并不是虐待成性的、残忍的人。他们在本质上就是普通人，可能和你我并没有什么不同，而他们却发生了戏剧性的转变。这可能最终源于所有罪恶中最强大的情境力量——战争。

结论

正如之前提到的，津巴多原计划进行两周的研究，但是他在第六天的时候就终止了实验，因为这个模拟的监狱情境太强大了，而且以惊人的方式变成了现实。实验人员和随机指派的大学生们不复存在，他们逐渐成为自己所扮演的角色，变成囚犯、守卫和监狱长。这些角色的力量是那么地强大，以至于个人身份消失了，被试甚至是实验人员都难以意识到在“斯坦福”监狱中的行为是多么危险。以下是津巴多对于他叫停研究的决定的表述：

我终止实验不仅仅是因为暴力的持续升级和“守卫们”与“囚犯们”的敌对恶化，……而且是由于我自己意识到我自己所经历到的个人的转变。……我自己变成了监狱的负责人，而研究负责人的功能被置于第二位。我开始像一位严厉的机构负责人一样说话、走路和行动，我更多地考虑“我的监狱”的安全，而忽视了作为一位心理学研究者应当照顾的年轻人的需要。在某种意义上，我认为关于这个情境的力量的最深刻的评估正是它改变我自己的程度。

研究38 从众的力量

Asch, S.E.(1955).Opinions and social pressure.Scientific American，193, 31-35.

你觉得你是从众的人还是独立的人？我们大部分人更乐意别人认为自己是既从众又独立的，既不怪异、不叛逆，又有个性、有独立思考的能力。几十年以来，心理学家对从众这一概念始终非常感兴趣。如果你能想到心理学的研究不仅关注解释人类行为，而且更重要的是在于揭示其背后的原因，那么你也就理解为什么会这样了。人们愿意顺从他人的效应可以帮助我们理解人类行为的根源。

当心理学家谈到从众时，他们指的是当某一个体成为某个团体的成员时，其行为常追随团体的某种行为模式。通常，这种一个团体对其成员行为的不成文规定及约束被称为“社会规范”。认真思考一下，你或许会想起，在生活中有时你的行为与你的态度、信仰、道德并不同步或一致。很有可能，每当发生这种情况的时候，你正处于某一群体之中，群体中的每一个人都那样做，所以你也就跟随着那样做了。从众对于我们的行为而言是一种强大的力量，甚至可以说，这种力量在某些时候会使我们的行为偏离自身的内驱力，做出一些原本不可能做的事。所以，从众非常值得行为科学家投注兴趣并开展研究。然而，直到20世纪50年代初才有人对从众进行科学的研究，这个人就是所罗门·阿希（Solomon Asch）。他关于从众的系列实验为我们提供了有关从众行为的大量新信息，而且为未来的研究开辟了许多道路。

理论假设

假如，你与一群经常见到的人在一起，比如你的朋友或同事。他们正在讨论一些有争议的问题或政坛候选人。你很快发现，在这个群体中，其他人观点一致，而唯独你的观点与别人的恰恰相反。当他们询问你的意见时，你会怎么做呢？或是选择冒着被排斥的风险，不顾后果地坚持说出自己的真实想法；或是选择和群体保持一致，即使你并不同意这种观点；或者，如果有可能的话，你会完全回避这个问题。

阿希想要了解从众的需要对我们的行为到底有多大影响力。虽然从众经常会涉及一些笼统模糊的概念，如认同他人的态度、伦理、道德和信仰体系等，但是，阿希选择了集中研究一种更加显而易见的从众类型——知觉从众，即人们倾向于在多大程度上遵照他人关于世界的知觉（所看、所听、所尝、所闻和所触）。阿希通过一个简单的视觉比较任务来检验从众行为，这样他就可以在一种受控制的实验情境中研究这一现象。

如果从众所具有的影响力真如阿希以及其他一些人所认为的那样强大的话，那么研究人员就可以通过让群体给个人施加压力来操纵一个人的行为，这就是阿希所从事的研究。他设计出一系列非常巧妙的实验，采用相似的方法来验证从众的力量。

方法

视觉材料由成对卡片组成，每对卡片的其中一张上画有三条不同长度的垂直线（称为比较线）；另外一张卡片上画有一条垂直线（称为标准线），其长度与前一张卡片中三条线中的一条等长（见图10—3）。接下来，便是实验的具体程序：假如你是自愿参加“视知觉研究”的一名被试，你到达了实验室，发现其他七名被试已经坐成一排。你坐在这一排的最后一个空位上。实验者呈现出一对卡片，要求你判断三条比较线中的哪一条与标准线的长度相等。你观察了一下卡片，并很快做出了正确的回答。从离你最远的那个被试开始，主试要求他们回答同样的问题。每个被试都给出了正确的答案，轮到你的时候，你也很清楚地给出了正确的答案。然后主试更换了卡片，又进行了同样的过程。毫无问题，你与其他成员一样，又一次给出了正确的答案。然而，在下一轮测试中，奇怪的事发生了——主试呈现卡片后，你立即想好了正确答案（毕竟，这并不困难），但是在其他被试回答这一问题时，他们却都选择了错误的答案，而且他们竟都选择了同样的错误线条。现在，轮到你作答了，你犹豫了，你简直不能相信眼前发生的一切。难道所有的人都瞎了眼吗？正确的答案是显而易见的，难道不是吗？你们到底是瞎了，还是疯了？现在你必须做一个决定。你是继续坚持你的观点（毕竟，正确的线条就在你的眼前），还是顺从其他人的意见？

图10—3 阿希线条判断任务卡片的一个例子

资料来源：引自P.32。

现在你可能已经意识到了，在实验室中的其他七个“被试”根本就不是真正的被试，而是实验者的助手。他们从开始就知晓实验内容，而且回答也是规定好的，当然，这也是从众研究的关键。那么，在这项研究中，真正的被试是如何回答的呢？

结果

每位被试测试数次，其中约有75%的人至少有一次与团体的不正确共识保持了一致。综合所有实验结果，被试服从于团体做出错误回答的次数约占1/3。为了确保线条的长度可以准确判断，主试要求控制组中的被试单独写下他们对线条比较问题的判断，这些被试的正确率为98%。

讨论与相关研究

在阿希的研究中，团体压力对从众行为的有力影响得到了清楚的体现。如果个体愿意服从于团体，那么他们对明显的错误有时也不具判断力，而这种影响力在现实生活中究竟有多大？团体在何时会发挥更强大的作用？问题在何种情况下会变得更模棱两可呢？从众效应是影响人类行为的一个重要因素，这个多年来人们一直反复思索的问题现在已得到了科学证实。

在心理学领域中，阿希的研究结果在两个方面显得极为重要和关键。首先，如前所述，他首次清楚而科学地证明了社会压力对从众行为的影响力；其次，或许也是更重要的，即这项早期研究引起了大量后续研究，其作用持续至今。自阿希的早期研究开始，该类研究的数量急剧增加，它们极大地丰富了我们对从众效应的了解，也使我们明白究竟是哪些因素决定了从众效应对人类行为的影响。下面是其中的一些研究发现。

1.社会支持。阿希在同样的实验上做了细微的变动，他对七名助手的回答进行改变，使其中一名助手在测试条件下给出正确的回答。在这种情况下，仅仅有5%的被试同意团体的一致性意见。很明显，你只需要一个同盟者就能“坚定立场”并抵抗从众效应的压力。这项研究发现还得到了后来几项研究的支持（例如，Morris & Miller，1975）。

2.团体的吸引力及成员的归属感。后来的一些研究证明，个体越为某一团体所吸引，对这一团体越有归属感，那么他就越有可能顺应该团体的态度与行为（参见Forsyth，1983）。如果你喜欢某一团体而且觉得自己是他们的一员（他们是你的参照群体），那么你顺应于该团体的倾向性将是非常强烈的。

3.团体的规模。首先，阿希和其他研究人员的研究都证明，从众的倾向性随团体规模的增加而提高。然而，进一步的研究发现，这种联系并非如此简单。确实，从众的倾向性随团体规模的增加而提高，但这仅限于人员数量为6到7人的团体。当其规模超出这个数字时，从众效应的水平不再增高，甚至在某种程度上有所降低。这一现象在图10—4中以图解的方式呈现出来了。阿希认为，这可能是由于随着团体成员数量的增多，人们可能会开始怀疑其他成员是有目的地合起伙来影响他人的行为，作为回应，他们开始抵抗这种显而易见的压力。

图10—4 团体规模与服从的关系

注：引自P.35数据。

4.性别。你认为男人和女人在从众的倾向性和自发性方面会有不同吗？继阿希的工作之后，有早期研究指出，女人似乎比男人更愿意从众。这种性别差异成为一种强有力的证据，频繁地出现在心理学文献之中。然而，近期的研究对这个结果提出了质疑。现在看来，许多早期研究（多由男性实施）无意中创造的一些实验条件，在当时对于男性比对于女性来说更熟悉、更舒适。心理学家明白，当人们处于那些不知如何表现才恰如其分的情境中，会表现出更多的从众倾向。因此，关于女性有较强从众倾向的结论也许只是一种系统误差，由方法上微小（且无意识）的偏差所致。在更好的控制条件下进行的一些研究并未发现从众行为有性别差异（关于性别问题的讨论参见Sistrunk & McDavid，1971）。

有关从众问题的研究还涉及其他众多领域，其中包括文化影响、在做出与从众相关的决定时的信息总量、社会规范、个人隐私，等等。

批评

阿希对从众效应的研究工作得到了广泛的支持和认可，此外该研究也在多种条件下被重复进行。对于这项研究的质疑则关注阿希的研究发现能否推广到实验室以外的现实生活中。换句话说，被试在实验室里对一些线条的回答与现实生活中的从众行为是否存在显著相关呢？这是对于所有在实验室控制条件下研究人类行为实验的效度的质疑。这种质疑的理由是：“也许被试可以在线段长度这种并不重要的琐事上与团体成员保持一致。但是，在现实生活中，特别是在重要事情上，他们不会那么轻易地表现出从众行为。”然而，虽然现实生活中的从众事件更有意义，但现实群体在从众事件上给予个体的压力也会相应增加。

近期应用

我们从以下这项研究中可以看出，阿希的工作对有关重大社会问题的研究依旧产生着重要影响。该文调查的是年轻人卷入不安全的性行为的原因（Cerwonka，Isbell & Hansen，2000）。大约有400名年龄在18~29岁之间的学生接受了不同方式的测验评估。测验内容包括AIDS/HIV高风险性行为知识（例如未使用安全套、多位性伙伴、酒精和其他药物滥用以及性经历等）。研究显示，众多因素能预测高风险性行为，其中包括基于同辈群体压力的从众。可以看出，对于从众如何影响人们选择性行为的理解可能成为我们对抗HIV持续传播的颇具价值的工具。

另一项引人关注的研究与阿希1955年发表的文章一脉相承，该研究考察为什么男性比女性更少寻求帮助，即使他们急需得到帮助（Mansfield等，2003）。这篇文章以下面这个（老）笑话引出：“为什么摩西用了40年时间在沙漠中徘徊，因为他不愿意问路（P.93）”。这个笑话之所以有趣，是因为它触及有关男性和寻求帮助行为的刻板印象。当然，不问路通常不会造成严重的问题，但是男性也倾向于拒绝寻求医疗和心理健康救助，这可能是危险的，甚至是致命的。作者指出，阻止男性寻求帮助的一个主要因素就是从众。“在需要帮助的情境中，男性可能会不愿意寻求帮助，如果他们认为这样做会受到羞辱……如果一个男性在生活中非常钦佩对寻求帮助持不赞成或者贬低观点的人，那么他自己就不太可能寻求帮助”（P.101）。

最后提到的一点是，文化在从众中起着特殊的重要作用。在具有集体主义文化的国家，比如日本、印度，所进行的从众研究发现，人们的从众行为都远远多于具有个人主义文化的国家的人民，如美国（参见研究28中川迪斯对集体主义和个人主义文化的研究）。这些发现再次证明心理学研究决不能忽视文化对人类行为的实际影响。

研究39 你会伸出援手吗

Darley, J.M., & Latané, B.(1968).Bystander intervention in emergencies: Diffusion of responsibility.Journal of Personality and social Psychology, 8, 377-383.

在心理学研究的历史上，最有影响的事件之一并不是某项研究，而是由美国新闻媒体所报道的一则发生在纽约市的暴力悲剧事件。1964年的一天，一位年轻女士凯蒂·吉诺维斯（Kitty Genovese）在她经营的曼哈顿酒吧营业结束后返回公寓，她的公寓在皇后大街的一个安静的中产阶层居住区内。当她下车朝公寓方向走去的时候，她遭到一个持刀男人的恶意袭击。那男人刺了她好几刀，她大声喊救命。一个邻居从窗口大声警告那男人：“放开这个女孩”，歹徒正欲图逃走，但后来他又返回来将吉诺维斯击倒在地，并继续刺杀她。袭击仍在继续，女孩一直呼救直到最后有人报警。警察接到报警后两分钟便赶到了现场，但吉诺维斯当时已经死了，袭击者也不知去向。袭击行为持续了35分钟。警察在调查这一事件中发现，公寓周围共有38个人目睹了这一袭击事件，但最终只有一人报了警。一对夫妇（他们说他们以为已经有人报了警）把两把椅子移到窗前去观看这一暴力事件。杀害吉诺维斯的人温斯顿·莫斯利（Winston Moseley），现年将近70岁，至今被关押在位于纽约北部戒备最森严的监狱里。在他47年的牢狱生涯中，他提请的14次假释都被否决了。在最近的2011年假释听证上，他的假释再一次被否决，直到2013年他才能再次提请假释。

如果有一个人能早些向吉诺维斯伸出援手的话，她也许就能幸免于难。这看上去似乎是邻居们漠不关心，没有试着阻止这场暴力事件，这令纽约市民和全体美国人感到震惊。人们想知道这其中的原因，同时他们谴责居住在大城市里的人们情感淡漠，谴责皇后大街的居民们，谴责人类的本性。

吉诺维斯的悲剧激发了心理学家的研究兴趣。作为科学家，他们不打算谴责谁，而是试图理解阻止所有的人对受害人伸出援助之手的心理因素。在心理学研究领域中有一个概念，行为科学家称之为“亲社会行为”，或者说是产生积极社会后果的行为。这个研究领域的内容包括利他、合作、抵御诱惑以及帮助行为。如果你目睹了某人需要帮助的紧急情境，有许多因素会影响你做出挺身而出并提供帮助的决定。纽约大学的约翰·达利（John Darley）和哥伦比亚的比勃·拉特内（Bibb Latané）就是两位研究这些影响因素的社会心理学家。他们把这种在突发事件中的帮助他人行为称为“旁观者干预”行为（而在吉诺维斯的案件则叫未干预行为）。

你曾经遭遇过真实的突发事件吗？与你在电视中看到的、报纸中读到的相反，突发事件并不常见。达利和拉特内估计，平均每个人一生中遇到的突发事件不多于六件。这既是好事，也不是好事，好的原因显而易见，不好的原因是因为当你发现自己正面对一个突发事件，而你又必须做出决定时，你却没有任何可利用的经验。社会要求我们在遇到突发事件时要伸出援手，但通常的情况就像著名的吉诺维斯事件那样，我们没有这么去做。是因为我们经历那样的事件太少，以致使我们只是不知道该做什么？是因为居住在城市里的人感情冷漠吗？或者是因为人的本性本身就是冷漠的？

自吉诺维斯谋杀事件发生之后，达利和拉特内分析了旁观者的反应。他们提出的理论是：正是由于观看事件的目击证人太多而降低了任何一个个体提供帮助的意愿。他们决定用实验的方法来验证这一理论。

理论假设

常识可能会告诉你，在一件突发事件发生时，在场的旁观者数量越多，他们干预的可能性就越大。达利和拉特内却提出了相反的假设：他们认为没有人前去帮助凯蒂·吉诺维斯的原因是存在一种被他们称为“责任扩散”的现象。也就是说，在突发事件中，旁观者越多，人们心里的某种想法就越强烈，即“有人会去帮助他（或她）的，我就不必去了。”你是否曾在繁忙的街道上看见过车祸，或者当车祸发生不久你恰好到达了出事地点？你很可能驾车驶离现场，并认为现在一定已经有人叫了警察或救护车，所以你不觉得自己有责任也这样做。但是，想象一下，假设你在荒郊野外，周围没有其他人，你遇到了同样的事件，此时你会有不同的反应吗？我们中的大多数人会回答“是的”。

责任扩散的概念是本项研究的理论基础。研究的挑战在于在一个可控的实验室情境中重新创设类似吉诺维斯事件情境，这样就可以操纵和系统检验各种变量。达利和拉特内精心设计了一系列实验来验证其理论观点。

方法

很显然，研究者不可能为了进行实验而重新创设一种与凯蒂·吉诺维斯谋杀案完全相同的情境。因此他们必须设计另一种与真实的突发事件非常相似的情境以便观察旁观者的干预行为。在这个实验中，达利和拉特内告诉纽约大学选修心理学课程的学生，他们两人对一些与大学生有关的话题非常感兴趣，想了解大学生是如何在激烈的竞争中适应大学生活、城市环境以及他们正面临着什么样的个人问题。他们要求学生坦诚地与其他学生讨论自己的问题，但为了避免难堪和不愉快情况的发生，学生们单独待在相互隔离的房间里，彼此之间通过内部通信联络系统进行交谈。研究者还告诉他们，这种内部装置每次仅允许一名学生讲话。每位学生有两分钟的讲话时间，之后下一位同学的麦克风就会开启。

所有这些隐藏了真实实验目的的设计，是为了能够从被试那里获得真实、自然的行为反应。这其中最主要的方法就是把这些参与研究的学生分在三种不同的实验条件下。第一组的被试相信他们仅仅能与另外一个人交谈；第二组的被试相信他们可以通过内部通信系统与另外两个人交谈；第三组的被试被告知，他们可以与线上的另外五个人交谈。事实上，每个被试都是独自一个人，他们从“内部通话系统”中听到的其他的声音都是事先准备好的录音。

现在，实验组的人数已安排好了，接下来就是要设计一些突发事件。研究人员决定非常逼真地设计一个被人们普遍认为是突发事件的癫痫发作场景。当被试们与其他“学生”在内部通信系统开始讲话时，被试听到的第一个说话者是男性，他提到他的困难主要集中在学习和适应纽约的生活氛围方面，然后他又尴尬地补充说，自己有时候也会发作严重的癫痫，特别是在压力过大的时候。然后，便轮到下一个学生讲话。在第一组中，被试听完第一个学生的谈话后，就立即开始讲话。而在其他两种条件下，被试在讲话之前会听到一个或多个其他学生的说话声。被试说完后，又轮到第一个学生。这时候突发事件发生了。第一个学生一开始声音很正常，不久癫痫开始发作（记住，这完全是录音机里发出的声音）。达利和拉特内在后来的报告中引用了“癫痫发作”的全部内容：

“我、我……想，我需要……有……如果有人……能给我一点给我一点帮助的话……因为我……现在真的有麻烦，如……果有人能帮助……我的话，那……太感激……了。我的癫痫就要发作……我需……要一些……帮助，如果有人愿意帮助我……（哽咽声）我要死了，帮……助癫痫……（哽咽，然后就无声了）。”（pp.95–96）

对于被试来说，这很显然是一个突发事件。毫无疑问，那名“学生”正处在危难之中，需要立即得到帮助。为了分析被试的反应，达利和拉特内测量了每一种实验条件下被试帮助危难学生的百分率（帮助行为指的是离开小房间，通知实验者有学生癫痫发作）。他们还测量了被试对突发事件的反应时间和提供帮助所花的时间。研究者给被试4分钟的时间作反应，之后实验停止，研究者询问被试相关情况。

结果

这项研究的结果对研究者的假设提供了强有力的支持。随着被试认为共同在场人数数量的增加，能够迅速向研究者报告癫痫发作的人数百分比大大减少（见图10—5）。而在所有最终提供帮助的人中间，时间拖延总量也随旁观者人数的增加而增加。第一组被试平均的反应时间不到一分钟，而第三组被试的平均反应时间却超过了三分钟。报告突发事件的被试总人数在各组间也有显著的变化。在四分钟内，第一组被试百分之百地报告了突发事件，第二组被试中只有85%的人报告，而第三组被试中只有60%的人作了报告。

图10—5 在当事人癫痫发作时，各种实验条件下迅速提供帮助的被试人数

资料来源：引自P.380数据。

讨论

就像凯蒂·吉诺维斯谋杀案这一现实生活事件一样，你也许会认为这项研究中的被试对癫痫发作者非常冷漠、令人心寒。然而达利和拉特内很快指出，第二组和第三组被试（或吉诺维斯的邻居们）实际上并不是这样的。所有的被试都报告了在事件发生时，他们感到极度的焦虑和不适，还有人出现了紧张的躯体症状（如手发抖、掌心出汗）。研究者得出的结论是，被试行为结果的不同一定与被试认为的在场人数的不同有关。别人的在场改变了你的行为，这就是大家所知道的“社会影响”心理学原理的作用。很显然，社会影响在本研究中扮演着一个重要的角色。但是，我们仍然有疑惑，为什么其他人的在场会对我们有如此巨大的影响？

达利和拉特内声称已有证据支持他们的“责任扩散”理论。随着团体内人数的增多，被试在突发事件中采取行动的个人责任就减少了。对于第二组和第三组的被试来说，他们很可能会认为有人已经解决了这个问题。此外，当其他人在场的时候，人们不仅仅感觉到责任的分散，而且会觉得如果不提供帮助所带来的内疚和良心责备也更少一些。在我们的文化中，帮助别人是积极的行为，拒绝或不肯帮助别人会带来羞愧感。如果在突发事件中只有你一个人在场，那么你不提供帮助所要承担的后果要比有其他人在场时大得多。

对这类社会影响的另一种解释是心理学家称之为“评价恐惧”的现象。达利和拉特内认为，当别人在场时，我们没有去帮助当事人的部分原因是我们害怕难堪或被嘲笑。设想一下，如果你有帮助别人的愿望，而别人并不需要或不想让你帮助时，你将感到多么尴尬。我记得在我年轻的时候，有一次我与一帮朋友在邻居家的游泳池内游泳，当我正准备从跳板上跳水时，我看见邻居13岁的女儿正躺在泳池的底部，我看了一下四周，似乎没有一个人意识到这个显而易见的紧急状况。她是溺水了还是在开玩笑？我无法确定。正当我准备大声呼喊并跳下去营救时，她懒洋洋地游出了水面。因为担心自己出错、害怕过度反应的尴尬，我犹豫了整整30秒。我们许多人都经历过这类事情。问题是这些经历教给我们的是一种错误的东西：帮助他人的行为很可能使你看上去很愚蠢。

研究发现的意义

由于本项研究以及一些其他研究，达利和拉特内在助人行为和旁观者干预领域内成了开创性的研究者。他们早期的大量研究收录在他们的著作《反应冷漠的旁观者——他为何不帮助？》（The Unresponsive Bystander：Why Doesn’t He Help）一书中（Latané和Darley，1970）。在该书中，他们所描绘的助人行为模型在被有关助人研究的心理学文献广泛认可。他们提出大多数人介入某一突发事件前一般要经历5个步骤。

1.你——一个潜在的帮助者——必须首先意识到某一紧急事件正在发生。在本章的研究中，紧急情况的产生是毫无疑问的。但在真实的生活中，你也许行色匆匆或将注意力集中在另一件事上，可能完全没有注意到紧急情况的发生。

2.你必须对情境作出判断，即某个人是否需要帮助。在这一点上，害怕难堪的心理发挥着作用。在本研究中，情境是清晰的，需要帮助也是非常明确的。然而，在现实中，大部分潜在的突发事件具有某种程度的不确定性和模糊性，如我在游泳池游泳的那个例子。或者想象一下，你看见一个人正步履蹒跚地穿过繁忙的人行道，你会想他是病了，心脏病发作，还是喝醉了？你对情境的判断会影响你对是否介入此事的决定。在吉诺维斯事件中，许多没有提供帮助的人声称，他们都以为这是情侣间的争吵而不想介入其中。

3.你必须承担个人的责任。如果在突发事件中，你是唯一的旁观者，那么你会立即承担这种责任。然而，如果有其他人在场，你也许会让他们替你承担责任。这一步是本项实验所关注的重点。在突发事件中，在场的人越多，责任扩散就越严重，也就越有可能发生无人提供帮助的情况。

4.如果你承担了责任，那么你必须决定你该采取什么行动。如果你不知道该做什么或者觉得自己没有采取适当行动的能力，你将不会提供帮助。在达利和拉特内的研究中，被试只需要向研究者报告有学生癫痫发作，完全不涉及能力问题。但如果有一群人看见一辆车撞倒了一个行人，这群人中有医生、护士或是其他护理人员，那么他（或她）比其他人更有可能介入其中，因为他们会更知道自己该做些什么。

5.当你决定该采取什么行动之后，你必须去做。仅仅知道自己该做什么并不能保证你就一定会去做。现在，你必须掂量帮助别人的利与弊。你愿意独自介入有一人持刀或两个人都持刀的打斗中吗？对于车祸中的受害者，你是否能帮助他们还是可能会把事情弄得更糟呢（又是一个能力的问题）？如果你介入了，你会被起诉吗？如果你本想努力去帮助别人，但结果却像个傻子，又将如何？许多问题取决于情境，在你采取真正的行动以前，这些问题会在你的脑海里一一闪现。图10—6说明了助人行为是如何被中断的或在某一阶段被阻断的。

图10—6 拉特内和达利的助人模型

后续发现与近期应用

在凯蒂·吉诺维斯谋杀案和我们在这里讨论的这个实验中，所涉及的旁观者都是彼此无法交流的。如果这些旁观者彼此能相互看见，并且可以相互交流的话，你认为后果会怎样？当他们可能被其他人评价时，是否会更可能介入其中？达利和拉特内认为，在某种情况下，即便是关系很近的群体也不比个人更乐意提供帮助。他们的理论认为，当突发事件在某种程度上比较模糊时，这种情况就更有可能发生。

举例来说，设想一下，你正坐在候车室里，然后通风口开始冒烟。你忧心忡忡地看了一下房间里的其他人。他们显得出奇地平静，对此毫不在意。你会觉得自己对冒烟的反应一定有些夸张，所以决定不采取任何行动。因为你若采取了行动，而却错了（也许它不是烟，而是从隔壁房间里冒出来的水蒸汽或其他什么东西），你将会感到羞愧和尴尬。然而，你并不知道，房间里的每一个人其实与你有同样的感受，并且他们也试图把这种感受隐藏起来，像你一样在避免难堪！而对于冒烟，却没有一个人采取任何行动。这听起来有些不可信，对吗？但事实确实如此。

拉特内和达利（1968）在随后的一项研究中设计了一个类似上述的情境来验证这一观点。一些心理学系的学生自愿来参加一项访谈，他们被告知将共同“讨论在城市大学中的一些生活问题”。他们为接受访谈来到预先约定的地点，并被安排在一个房间里等候，填写一份预备问卷。几分钟后，烟雾开始从某个通风口进入房间，研究中使用的烟雾是一种特殊的化学混合物，对被试不造成任何危险。不久，烟变得越来越浓，以致于房间里的视线开始变得模糊。主试开始计时，看被试会过多长时间才把冒烟的情况报告给主试。一些被试被安排在单独的房间里；还有一些被试与另外两个人（主试的助手）在一起，被试认为这两个人也是被试，当烟出现时，这两个人表现得若无其事；其余的被试则三人一组待在房间里。拉特内和达利的研究结果又一次支持了他们的理论：在单独组中，有55%的被试在两分钟之内报告了冒烟的情况；其余两个组仅有12%的被试报告了情况；另外，四分钟之后，单独组有75%的被试开始行动，而在其他组中，仍然没有被试报告冒烟一事。

关于害怕尴尬让人们对帮助他人犹豫不决的更多证据来自另外一项研究，在这项研究中综合考察了害羞人格测量、对负面评价的恐惧（FNE），以及被试帮助他人的意愿（Karakashian et al.，2006）。被试先填写测量害羞和恐惧负面评价的问卷。然后，他们会面临着帮助一位女性同伴的机会，有些被试是与这位女士单独在一个房间，另一些被试则除了这位女士以外还有另外两个同伴（研究助手）在一起。根据达利和拉特内的研究结果，无论被试人格测量的分数如何，与没有其他旁观者在场的条件相比，有两位旁观者的情境中被试的帮助行为会显著地减少。除此以外，在无旁观者条件下，那些在恐惧负面评价和害羞测量上得分高的被试比其他被试更少地提供帮助；而在有两位旁观者在场的条件下，不同被试提供帮助行为的可能性相同。这可能看起来与你的直觉相悖。通常人们直觉认为害怕被负面评价的或者是害羞的人在有其他人在场的时候可能更少会提供帮助，是吧？事实上并不完全如此。让我们这么考虑：当其他人在场的时候，一个害羞的人觉得提供帮助的压力更小（由于责任扩散），所以他（或她）其实有“理由”像其他旁观者一样避免提供帮助；另一方面，如果没有其他旁观者在场，对于（潜在的）负面评价的恐惧就生效了，害羞的人比不害羞的人提供帮助的可能性就更少。研究者对于此项研究的说明如下：

由于在社会条件下（有其他人在场）存在责任扩散，被试面临较少的是否提供帮助的决策。这时，由于提供帮助的想法本身不多，也就不用担心受到糟糕的评价，那么恐惧负面评价就不成问题了。而在非社会条件下（没有其他旁观者），被试是单独一个人，具有提供帮助的全部责任，这样他就必须要决定是否采取行动（Karakashian et al.,2006，P.30）。

另一项研究揭示了在我们的想象中（而不是现实生活中）旁观者效应和责任扩散的力量。包括达利在内的一个研究小组进行了一项题为《群体思维：固有的旁观者效应》的研究，结果发现，仅仅是设想自己是群体的一员就会改变帮助行为（Garcia et al.，2002）。在这项研究中，要求被试将自己设想为群体的一员，或者是与另外一个人在一起。然后要求所有的被试为一个慈善机构捐款。想象自己是群体一员的个体比想象和另外一个人在一起的被试捐出更少的钱，而且感觉自己的个人责任更少。这些结果显示，当我们作为群体一员的时候，我们的大脑会立即把握机会，认为自己的个人责任变少。

结论

虽然，这项研究的结果看起来确实让我们对帮助他人的内在倾向有些悲观，但是你应该认识到，这些所涉及的都是人们未能伸出援手的一些极端特殊情况。生活中每天都会发生人们去帮助他人、利他甚至是英雄主义的行为。这项研究之所以重要，是因为它不仅解释了使人困惑的人类行为，而且还有助于改变这种行为。当人们更多地认识到旁观者效应的时候（正如你现在已经知道其中原理），即使有其他人在场，他们也会作出更多的努力去干预危急情况。事实上，有研究已经证明，当人们了解了旁观者效应后，他们会更乐意向危难中的人们伸出援手。关键在于，危急时刻，千万不要以为已经有人提供了帮助或者一定会有人提供帮助。我们应该永远像自己是唯一的旁观者一样去行动。

研究40 无条件服从

Milgram, S.(1963).Behavioral study of obedience.Journal of Abnormal and Social Psychology, 67, 371-378.

如果一个在你之上的权威人士命令你对另一个人施加电压为350伏电压的电击，原因仅是因为这个人在回答多项选择问题时答错了，你会听从命令吗？没有人会这样做。如果有人愿意去做这件事，你会认为他或她是一个残酷的人或是虐待狂。耶鲁大学的斯坦利·米尔格拉姆（Stanley Milgram）所做的这项研究，试图检验服从权威的想法，并得出了一些令人深感不安的结果。

米尔格拉姆的服从研究和津巴多的监狱研究（见研究37）在整个心理学史上极负盛名，受到人们的广泛认可。几乎在每一本普通心理学和社会心理学的教科书中都会提到该项研究。如果你与心理学专业的学生交谈，他们中的大多数人对这些研究要比对其他研究更熟悉。由这项研究引发米尔格拉姆写了一本关于服从心理的书，拍了一部与此相关的专题片，该片在大学心理学课上反复放映。这个实验不仅涉及有关服从行为的讨论，而且还影响了关于在心理学研究中采用人类被试的伦理问题的全部讨论。

米尔格拉姆的这项研究方案来自于他的一个想法，即他想用科学的方法调查人们怎么会仅仅因为别人的命令而对他人施加巨大的伤害。米尔格拉姆特别提到纳粹在二战期间犯下的可怕暴行，也在更广泛的意义上提及此前及现在因服从命令而发生的不人道行为。米尔格拉姆认为，在某些情况下，人类服从倾向是如此强烈而根深蒂固，它抵消了个人的道德、伦理，甚至是同情。

在行为科学家决定要研究某些人类行为复杂面的时候，他们的第一步就是要对发生行为的情境进行有效控制，以便能用科学的方法对它进行研究。这对于研究者而言是一个极大的挑战，因为要在实验环境中模拟现实生活是一件非常困难的事情。米尔格拉姆的问题是如何创设一个受控制的情境，在这个情境中一个人可以命令另一个人去体罚第三个人，且实际上并没有人真的受到伤害。这就是对研究者的一个挑战！

理论假设

米尔格拉姆最初的理论假设是，人类有一种服从权威命令的倾向性，即使这个命令违背他们自己的道德和伦理行为准则。例如，米尔格拉姆认为，虽然许多人从未有意伤害过别人，但在他们认为是权威人士的命令下，他们很有可能会对受害人做出伤害行为。

方法

也许这项研究最巧妙的部分就是米尔格拉姆开发的在实验室里验证服从力量的技术方法。米尔格拉姆设计了一个看起来非常骇人的电击装置，一个电子设备有30个调节开关，每个开关上贴着标签表示不同的电压，电压从30伏开始，每次以15伏为单位递增，一直增加到450伏。这些开关被分成三组，分别标着“轻微电击”、“中等电击”和“高压危险电击”。主试欲用这个装置让权威人士命令被试不断地增加电压去电击另外一个人。在你得出米尔格拉姆是一个施虐狂的结论前，请注意，那是一个非常逼真的模拟电击装置，它并不会让人真的受到任何痛苦的电击。

这项研究中的被试是40名年龄在20~50岁之间的男士，其中15人是熟练工人或不熟练工人，16人是售货员或商人，9人是专业人员。研究者通过报纸广告或直接发信的方式征集志愿者，邀请他们参加耶鲁大学的一项关于学习与记忆的有报酬研究。每位被试都是单独参加实验。为了获得较多的被试，研究者付给每位被试4.5美元（记住，这是1963年的美元，相当于现在的30美元），并清楚地告知所有被试，报酬在他们来到实验室后便付清，而且不管在他们到来之后发生什么事情，这些报酬都是他们的。这就确保被试知道他们可以随时退出研究，而且不会因担心得不到报酬而感觉被强迫以某种方式行事。

除了被试之外，研究中还有两位关键人物：一位是研究者的助手（一名47岁的会计），扮演另外一名被试；另一位是演员（穿着一件灰色的实验室工作服，看上去非常正式），扮演主试的角色。

当被试到达耶鲁大学社会互动实验室时，工作人员安排他坐在另一名被试（研究者的助手）的旁边。很明显，实验的真正目的是不能告诉被试的，因为那样将会彻底改变他们的行为。所以，实验者给被试讲了一个假故事，解释说这是一项对“学习中的惩罚”效应的研究。然后让被试通过从帽子里抽签来决定谁当老师，谁当学生。这个抽签是事先安排好的，因此真正的被试总是抽到老师，而研究者的助手则总是抽到学生。请记住，那名“学生”以及“主试”都是研究者的同伙。

然后，“学生”被带到隔壁房间，被试看到工作人员将他绑在椅子上，缠上电极（加入电极胶以“避免皮肤起泡或烧伤”），这些电极和邻近房间里的电击装置连在一起。虽然学生的手臂被绑着，但是他仍可以够得着标有A、B、C、D符号的按钮，并以此来回答隔壁房间里教师提出的问题。

主试向“老师”和“学生”清楚明了地交代了学习任务。简单地说，该任务是让学生对各种各样的单词配对进行联想记忆。单词表很长，因此这是一个并不简单的记忆任务，扮演老师角色的被试把每对单词读给学生听，然后检查学生的记忆情况。主试要求这些被试在学生作出错误的反应时给予电击惩罚。最重要的是，每增加一次错误反应，“老师”就要将电压强度提高一级。所有的这一切伪装得极为逼真，没有一名被试对电击的真假表示怀疑。

扮演学生的助手的反应是预先安排好的，所有的被试都以相同的顺序作正确或错误反应。而且，当电击总量随着错误的反应增加时，“学生”开始从另外一个房间发出痛苦的叫喊（这也是预先安排好的，包括其叫喊的话语内容及其心脏不舒服的事实）。当电压达到300伏时，“学生”会猛撞墙壁，要求工作人员放他出去。超过300伏电压之后，他变得完全沉默，拒绝回答任何问题。主试告诉“老师”，用对待错误反应的方式来处理不反应的情况并继续进行应有的电击程序。

大部分被试在电压达到某一点时会转向主试询问是否继续进行电击。当这种情况发生时，主试会命令被试继续，且在此过程中很有必要向被试发出一系列语气渐重的命令。

命令1：请继续。

命令2：实验需要你继续。

命令3：继续进行是绝对必要的。

命令4：你别无选择，你必须继续。

通过记录每位被试拒绝继续进行的电压水平，就可以对服从行为进行测量。在这个电击装置上有30个开关，每位被试的得分在0~30之间。进行完全部过程，获得满分的被试被称为“服从的被试”，而在较低电压水平就中断的被试被称为“对抗的被试”。

结果

被试会服从主试的命令吗？他们最多会用多高的电压？你预测的结果是什么？想想你自己、你的朋友和一些普通人。你认为有多少人会使用所有30个电压水平，达到最高的450伏——高压危险电击呢？在讨论这个实验的真正结果之前，米尔格拉姆让一组耶鲁大学心理学专业的四年级学生以及许多其他同事预测结果。人们的估计最低是0%，最高是3%，平均为1.2%。也就是说，一百个人中会对“学生”施加最高电压电击的不足三人。

表10—2展现了令人惊讶的实验结果。在主试的命令下，几乎所有被试都将电压提升到了300伏的水平，直到“学生”猛击墙壁，要求离开实验室，并拒绝回答问题为止。但是，最令人吃惊的是使用全部30个电压水平并使电压达到最大值的被试数量。

尽管有14名被试不服从命令，在达到最高电压之前中断了实验程序。但40名被试当中仍有26个，也就是65%的被试按照主试的命令继续进行实验，并使用了最高电压。这并不是说被试能心平气和或很高兴地去做这些事情，许多人表现出了极大的心理压力，并为受电击者的境况而担忧，甚至对主试非常愤怒。然而，他们还是服从了命令。

表10—2 被试执行的电击水平

（引自米尔格拉姆，1964年，P.376）

研究者担心一些对他人施加电击酷刑的被试可能在心理上也遭受痛苦，尤其是在最后三次电击中，“学生”不再作出任何反应。为了帮助他们缓解这种焦虑，在被试完成实验后，研究者将这个实验的真正目的以及全部的实验程序，包括对他们的欺骗手段原原本本地告诉了他们。此外，研究者还对被试进行了访谈，了解他们在实验过程中的感受和想法。作为助手的“学生”也来与每位被试见了面。

讨论

米尔格拉姆对研究结果的讨论主要集中在两点上：首先是被试惊人的服从倾向。这些被试是同意参加一个关于学习的实验研究的普通人，绝不是冷酷的虐待狂。米尔格拉姆指出，从童年开始，他们就知道昧着良心去伤害别人是不道德的。那么他们为什么要那样做呢？主试是一个处在权威地位的人，但是你仔细想想，他到底有多少权力呢？他没有任何权力发号施令，被试若拒绝执行命令也不会有任何损失。很显然，是情境本身有一种力量，在一定程度上创设了服从的氛围。

第二个值得注意的关键是，在整个实验过程中，被试因执行了主试的命令而表现出极度的紧张和焦虑。研究者猜测，被试只要拒绝继续进行实验，这种不适感就会减轻。然而，这种情况并没有发生。米尔格拉姆引用了一个观察者的话（此人通过单向玻璃观察被试）：

我看到一位成熟稳重的商人进入了实验室，他面带微笑，充满自信。但在20分钟内，他就变得痛苦不堪，说话结结巴巴，很快就近乎于一种神经崩溃的状态……有时候，他用自己拳头敲着自己的前额，喃喃自语道：“噢，上帝！让我们停止吧！”然而，他还是按主试的要求继续进行，直到进行完所有电压等级。”（P.377）

在文章的结尾，米尔格拉姆列举了几点理由来解释为什么这种特殊的情境会产生如此强烈的服从倾向。从被试的角度来看，原因主要有以下几点：（a）如果这项研究是由耶鲁大学发起的，那它一定是好事情，没有谁会怀疑这样的著名学校；（b）实验的目的似乎很重要，因为我是志愿者，所以我会尽力完成我的任务来配合研究者实现这些目标；（c）毕竟，“学生”也是自愿来这儿的，他对这项工作也有责任；（d）嘿，我是老师，他是学生，这纯属巧合——我们是抽签决定的。其实另一种情况也很有可能出现，即我是学生，他是老师；（e）他们为这事给我报酬，我要尽力做好；（f）我完全不知道心理学家以及被试的权力，所以我将屈从于他们的安排；（g）他们告诉我们，电击是痛苦的，但没有危险。

研究发现的意义

自从这项研究发表后的40多年以来，米尔格拉姆的研究仍占据着很重要的位置。米尔格拉姆本人用耶鲁大学以外的其他类似被试重复了这一实验过程，他们是义务参加实验的大学生志愿者和一些女性被试，每次得出的结果都是相似的。

另外，通过实施一系列的相关实验设计，米尔格拉姆进一步拓展了他的研究发现以揭示促进服从行为或限制服从行为的原因（参见Milgram，1974）。他发现，受害者（指“学生”）与“老师”的身体和情感距离的改变制约着服从倾向的强烈程度。当“学生”在另外一个房间，他与“老师”在彼此不见面也听不见对方的声音的情况下，出现了最高的服从率（93%的被试用了最高电压）。当“学生”与被试同在一个房间内，主试要求被试强迫“学生”把手放在电击板上，此时的服从率最低，只有30%。

米尔格拉姆还发现，权威人物（指主试）与被试的身体距离也会影响服从行为。被试离主试越近，其服从倾向越强烈。在一种实验条件下，主试离开房间，并用电话对被试发出指令，结果被试的服从率仅为21%。

最后，有一个现象较为令人乐观，即当主试允许被试用他们想用的电压水平惩罚“学生”时，没有一名被试使用的电压超过45伏。

批评

米尔格拉姆的研究不仅影响着我们对服从行为的理解，而且使人们对用人类作被试的道德问题进行深刻的思考。即使没有一个人受到电击，但当你认识到自己仅是因为一个身穿实验室工作服的人的命令而去残酷地电击别人（很可能致死），你会作何感想？人们对米尔格拉姆研究方法的批评主要是（参见Baumrind，1964；Miller，1986）在实验期间，被试所承受的压力是让人无法接受的。此外，他们还指出，这种潜在的消极影响可能会长期存在。当被试经历内心折磨后，主试告诉他们这是个骗局，他们会怎样？也许他们会感到自己受人利用，感到难堪，而且有可能在他们未来的生活中不再相信任何心理学家或是合法权威。

另外一种批评意见主要集中于米尔格拉姆研究结果的效度方面（如，Brief et al.，1995；Orne & Holland，1968）。这一批评经常被引用的基础是认为，被试与主试间的关系不仅有信任的成分，还有依赖的成分，并且实验室对于被试来说也是一种陌生的环境，在那里表现出的服从行为并不代表现实生活中的服从行为。因此，批评者声称米尔格拉姆的研究结果不仅效度低，而且由于其效度低下，实验对被试所实施的处理也就是不适当的。

通过在被试参加完实验后对他们进行的调查，米尔格拉姆对这些批评意见作出了回应。他发现84%的被试很高兴参加了这次活动，而只有1%的人对这次经历表现出后悔。另外，一个精神病专家访谈了40名被认为是在实验中感觉最不舒服的被试。他得出的结论是，这些人当中没有一个人遭受长时间的心理折磨。因批评者认为实验室并没有反映现实生活中的行为，米尔格拉姆的意见是：“来到实验室的被试是主动的、有选择权的成人，他有能力接受或拒绝在实验中给予他的命令。”（Milgram，1964，P.852）

这里所报告的米尔格拉姆的研究，引起了人们对以人类为被试的实验中道德问题的深刻思考。事实上，该研究是对心理学服从行为研究领域的影响更大，还是对心理学研究以人类为被试的道德政策问题影响更大，仍是极具争议的（正如在本书前言中所讨论的）。

近期应用

米尔格拉姆的服从研究继续对目前的研究发挥着广泛的影响，这一点可以在近期研究的不少注解中得到证明。这些研究主要是在米尔格拉姆早期实验方法和结果的启发下进行的。从20世纪60年代早期米尔格拉姆从事他的研究以来，每年都有与此有关的研究出现，这些研究可分为两类：一类是对米尔格拉姆理论的完善以及关于对权威人物服从倾向的详细阐释；另一类是关于在实验中对人类被试施行欺骗手段的道德问题的争论。

作为斯坦利·米尔格拉姆的研究和职业生涯的权威评述者以及米尔格拉姆传记《电醒人心》（The Man Who Shocked the World）的作者，托马斯·布拉斯（Thomas Blass）回顾了源于米尔格拉姆早期服从实验的所有研究及其社会意义（Blass，1999；2002）。总体上来看，布拉斯发现各种研究普遍支持米尔格拉姆最初的研究结果。更重要的是，在米尔格拉姆第一次发表他的结果之后的40多年里，服从率似乎并没有发生显著的改变。这与美国人的直觉判断相矛盾，一般而言，他们会认为自己已经不像40年前的美国人那样敬重权威，当权威人士命令他们做自己不同意的事时，他们会做出反抗。

另一个经常出现的问题是对米尔格拉姆早期研究中性别问题的关注。事实上以前所有的研究对象都是男性。仔细想想，总体而言，男性与女性谁更倾向于服从权威？布拉斯从米尔格拉姆的后期研究和其他人的研究中发现，男人和女人在服从率上并没有什么区别。（想要更详细地了解米尔格拉姆的研究工作所产生的历史影响，请参见布拉斯的网站，网址为：www.stanleymilgram.com。）

与米尔格拉姆的发现紧密衔接的一个研究，调查了路易斯安那州监狱负责执行死刑的“行刑小组”成员的心理体验（Osofsky & Ososky，2002）。研究者访问了50名直接参与行刑的警官，结果发现，尽管比大多数人更多地面对痛苦和死亡，这些被试并没有出现临床上的抑郁症状。被试报告说他们依靠宗教信仰、对同行群体的认同和对责任进行扩散的能力来应对痛苦情感。“然而，这些警官体验到矛盾的情感并且时常报告在执行社会‘终级处罚’时感觉很糟糕。”（P.358）

在伦理方面，一项研究使用米尔格拉姆的研究范式考察在互联网上进行的社会科学研究潜在的棘手的伦理问题（Pittenger，2003）。今天，大量的研究是通过国际互联网进行的，而且此类研究的数量在将来还会显著增加。皮滕杰（Pittenger）主张，研究者必须警惕侵犯隐私、未获得被试的知情同意，使用欺骗手段等潜在的违背道德伦理规范的情况。“互联网为研究者提出了独特的挑战，”皮滕杰写道，“其中包括需要清楚地界定在网上进行的个人行为与公众行为的区别，确保获得被试有效知情同意的机制以及对被试进行调查询问的机制，核实所收集到的数据的有效性。”（P.45）

一个重要的问题是，我们该如何保护被试在心理学研究中免遭不合理的欺骗手段的伤害，而又同时允许某些科学研究进行所必要的欺骗继续存在？温德勒（Wendler，1996）建议在研究涉及欺骗手段时，研究者应给予被试更高水平的知情同意权（参见本书前言部分对此概念的讨论）。这就意味着，在你同意成为实验被试之前，工作人员会告诉你在此实验中可能会用到欺骗手段，尽管你可能并不会意识到欺骗的确切内容。温德勒声称：“这种对于可接受的欺骗的二级许可给我们提供了最好的机会来协调二者的关系，即既要尊重被试，又要满足科学实验所偶尔需要的欺骗过程。”（P.87）

结论

研究米尔格拉姆的史学家托马斯·布拉斯（2002年）在其所著的关于米尔格拉姆生活和工作的传记中给本研究提供了一个适宜的结论：

我们不需要米尔格拉姆告诉我们自己有服从他人命令的倾向。在米尔格拉姆的实验前，我们不知道的是这种倾向的力量有多大。了解我们极强的遵从权威的倾向后，我们可以设法使自己提防不受欢迎或应受谴责的命令。

改变心理学的40项研究(改变心理学的40项研究pdf)

未经允许不得转载：考研培训网 » 改变心理学的40项研究(改变心理学的40项研究pdf)

改变心理学的40项研究(改变心理学的40项研究pdf)

作者：admin

相关推荐

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏