1、实验心理学经典范式整理潜变量分析(latent variable analysis)近年来提出一种新的研究方法,即潜变量分析。传统研究方法认为一个执行测验的成绩就能 够代表一种执行功能,而潜变量分析采用多个执行测验对同一执行功能进行测量,并从中提取它们的共性,形成该执行功能的潜变量。对测量同一执行功能的多个任务应涉及不同的实验刺激和实验程序,以避免在潜变量提取后的执行结构中仍含有非执行的成分。潜变量提取的方法在很大程度上缓解了诸如纯度,结构有效性等问题,有助于进一步探讨各执行功能间,以及执行功能与其他一些认知结构间的关系。Miyake 等报告的一项研究表明,虽然三项执行功能(对优势反应的抑制,
2、注意转换和记忆刷新 )间存在一定的相关,但也清晰地表现出相互可分离性;并且,这三种执行功能在一系列复杂执行任务( 包括神经心理学测验 )中的贡献是不一样的。然而,由于潜变量提取需要进行多项测验,结构方程建模还需要较大的样本量,使得这种研究方法在实施的过程中存在较大的困难。 n-back 范式n-back 范式 要求被试者将刚刚出现过的刺激与前面第 n 个刺激相比较,通过控制当前刺激与目标刺激间隔的刺激个数来操纵负荷。当 n=1 时,要求被试者比较当前刺激和与它相邻的前一个刺激;当 n=2 时,则比较当前刺激和与它前面隔一个位置上的刺激;当n=3 时,要求比较的是当前刺激和它前面隔两个位置上的刺
3、激,依此类推获得不同程度的任务难度。任务类型包括字母匹配任务,位置匹配任务和图形匹配任务三类。在位置匹配任务中,要求被试者判断两个刺激呈现的位置是否相同,而不管两者是否为同一个字母或图形;在字母或图形匹配任务中,则要求被试者判断两个刺激是否为同一字母或图形,而不管他们的呈现位置如何。该范式的优点在于将任务设计成在工作记忆上施加一连续的,参数可变的负荷,而其他任务需要保持恒定。P.O.Harvey 等(2004)用 n-back 范式评估年轻抑郁症住院病人的刷新加工,抑郁病人在 n-back 任务中显示了较差的操作。他们的结果说明:排除包括 2-back 和 3-back 条件的复杂信息管理,
4、1-back 条件是一个更纯的刷新加工测量方法。n-back 任务也被广泛用于工作记忆的神经成像研究中。神经成像研究应用 n-back 任务有如下几个理由(Braveretal,1997;Cohenetal,1997;Jonidesetal,1997): 首先,比较神经成像研究早期应用的任务,n-back 任务是一个更有代表性的工作记忆任务,包括维持少量信息,要求 n-back 任务操作工作记忆信息。其次,允许应用参数变量方法代替减法方法(themethodofsubstraction),因而避免了一些和后者相关的问题假设(Fristonetal,1996;Jenningsetal,1997)
5、 。第三,n 个任务允许系统操作工作记忆负荷。随负荷变化而变化的脑区被认为起到特殊的加工作用。活动记忆实验范式 这种范式要求被试听或看一系列未知长度的项目串,被试者在系列回忆时,有两种回忆方式,一是回忆出尽可能多的项目,二是只回忆最近呈现的几个项目。包括两项难度不同的分任务。在较易任务中,由计算机在屏幕中央以每 1。75 秒呈现一个数字的速度,随机呈现一系列的数字,要求被试者随时大声报告数列的最后 3 位。如呈现数字7, 6,2,1 ,4 ,被试者就应该依次报告:7,6,762,621 ,214。最终答案为 214,完全正确得 1 分,中途任何一次漏报或误报都不能得分。数列有 49 位 6 种
6、长度,在每一数列中没有相同的数字出现。在实验中数列长度随机安排,被试者不知道数列何时呈现完毕。练习 8 次,正式测验 24 次(每种长度各 4 次)。较难任务程序与较易任务基本相同,只是数字呈现的速度改为每 0。75 秒一个。 在活动记忆任务中,被试者要保持一个激活的项目串,在该项目序列的长度大于需要反应的项目序列长度时,每呈现一个新的项目,被试者要消除掉记忆中位于项目序列位置最前面的那个项目,并把新呈现的项目加到末端。在 Morris 等的动态记忆任务中,先在计算机屏幕中央以一秒一个的速度呈现一串辅音,要求被试者随时记住该串辅音的最后几个(如 4 和 6 个),直到呈现完毕。由于被试者不知道
7、该串辅音何时呈现完毕,因而辅音串越长,需要刷新的次数就越多,难度也就越大。Kiss 等人利用活动记忆范式研究执行功能的脑定位10,该实验利用 ERP 的方法对相应脑区的活动进行考察,发现对数字的控制与存储是相分离的。Oddball 实验范式 Oddball 实验范式的要点是,对同一感觉通道施加两种刺激,一种刺激出现概率很大,如 85%,另一种刺激出现的概率很小,如 15%。“ 两种刺激以随机顺序出现,这样,对于被试来说,小概率刺激的出现具有偶然性,因为它很少才出现一次,感觉有点怪(Odd) 。但实验任务却要求被试关注小概率刺激,只要小概率刺激一出现就尽快做出反应。可见这里的靶刺激是小概率刺激。
8、 Stroop 任务范式 Stroop 任务是研究反应冲突的一项常用范式.传统的 Stroop 测验采用色字和色块命名的方法来考察 Stroop 干扰效应量.在命名书写颜色字词所用颜色时 ,如果词义本身与颜色不符(如用绿色墨水书写“红“字时), 颜色命名时间要长于词义与颜色一致时(如用绿色墨水书写“绿“字)或其它中性条件( 如用绿色墨水书写一个与颜色无关的匹配字)。这之间的差异就是词义对颜色命名的干扰量。 Go No Go 任务范式 Go No Go 任务是研究反应停止能力的一种常用范式 .此任务通常是随机交替呈现两个不同的字母或图案,要求被试对其中的某个刺激作反应(所谓的 Go 反应), 而
9、对另一个刺激不反应(所谓的 No Go 反应) 。对 No Go 刺激的错误反应通常被认为是反应停止困难的一项指标。无意识知觉研究中的三种范式 1.Stroop 效应 2.错误再认 3.EXCLUSION 测验 1.Stroop 效应 (1) Stroop 效应 (2)意识知觉条件下的 Stroop 效应反转 (3)无意识知觉条件下的典型 Stroop 效应 Merikle 和 Joordensd 研究 目的:比较改变刺激特性( 呈现时间) 和改变注意方向所引起的类似的 Stroop 启动的质的差异。 2.错误再认 所谓错误再认是指,在进行再认测验的时候,那些实际没有学过的项目被给出“学过”的
10、反应。 方法:通过操纵背景刺激的特性和注意的方向,导致错误再认率的变化。 研究实例 Jacoby 和 Whitehouse(1989)的实验(操纵背景刺激的特性) Merikle(1997)的实验(操纵背景刺激的特性和注意的方向) 3.EXCLUSION 测验 Exclusion 测验的方法最早是由 Jacoby(1991)提出的,他在其过程分离程序中,将Exclusion 测验和 Inclusion 测验相结合,对意识影响和无意识影响的绝对量加以分离和计算。EXCLUSION 测验基本实验模式 每轮实验首先呈现一个 5 个字母的单词( 如,spice),然后加以掩蔽,紧接着呈现这个单词的头
11、3 个字母的词干(如,spi_) ,让被试用除了刚才呈现过的单词(又称“靶词”)之外的任意词进行补笔。 Debner 和 Jacoby(1994 )的实验结果 当靶词呈现 500ms(实验一) 的时候,被试能够按照指导语的要求在补笔中将靶词排除掉,表现为用靶字补笔的比率低于基线值;而当靶词呈现 50ms 时,被试较难遵从指导语的要求,他们在补笔中用了很多靶词、尽管指导语强调不要用靶词。实验结果表现为用靶字补笔的比率高于基线值。 Merikle(1995)的研究 方法:操纵刺激特性(时间)和注意方向 三种实验范式的讨论 通过 Stroop 效应、错误再认和排除测验 3 种实验范式得到的实验结果非
12、常一致,Merikle 和 Joordens 得出结论: 刺激特性的改变和注意水平的改变影响的是同样的内部过程,即激活(activation)和知觉。 意识知觉 vs 无意识知觉和注意知觉 vs 无注意知觉其实是描述了同一个内部过程的分离。 几个重要观点: 1 注意是从无到有、从低到高连续变化的; 2 知觉是一个多水平、连续的过程; 3 意识也可能是一个多水平的连续变化体; 4 刺激特性(知觉特性) 、注意、意识这 3 个概念是紧密联系、不可分割的 .质的差异的研究范式 主要考察意识知觉和无意识知觉存在怎样的差异 实验例证 Murphy 和 Zajonc 1993 年通过一个实验证明了,无意识
13、知觉到的刺激比有意识知觉到的刺激对情绪反应的影响可能更大。Groeger(1984,1988)提出了字词的不同编码依赖于对它们的知觉是有意识的,还是无意的。 MarceI(1980)假定背景对于知觉的影响仅限于有意识知觉到的信息,并针对这一问题进行了实验研究。 意识研究评价 过去研究无意识知觉总是试图要找到一个意识的阈限,在阈限以上是意识知觉,在阈限以下是无意识知觉。大部分的研究都是要确定一种刺激情景,这种情景或者总是导致意识知觉,或者总是导致无意识知觉。 但我们知道,要找到这祥一种情景几乎是不可能的,最有可能做到的是确立一些情景,在这些情景下或者意识影响占主导地位或者无意识影响占主导地位。任
14、务分离范式 既用于内隐记忆研究,又是研究意识与无意识的基本实验范式 基本逻辑:两种不同的知觉测验的比较 第一种测验被认为反映了有意识知觉到的信息,第二种测验被认为既反映了有意识知觉到的信息又反映了无意识知觉到的信息。建立一定的实验条件使意识知觉测验的敏感度为零,那么如果第二个测验的敏感度高于零,则反映了无意识知觉的影响。 两种测量方式 (1) 意识的内省测量: 特点 以被试对自身知觉经验的自我报告作为意识知觉的指标 (2)意识的行为测量: 以被试的分辨能力作为意识觉知的指标 。 两种最典型的测量方法 1、迫选性刺激有-无决策 2、在一系列备选项中做出迫选决策。基本假设是:所有正确的决策都是受有
15、意识知觉到的信息引导的。对一个特定行为的测量是否是对所有相关意识经验的充分测量仍然是一个值得怀疑的问题。 研究实例:Kunst-Wilson 和 Zajonc(1980)的实验。大量实验证明:视觉刺激即使在观察者不能觉察它们存在的情况下也能被知觉到。如果刺激有无侦察被认为是对意识知觉的充分测量,那么在不能进行刺激侦察的情况下发生的知觉就证明了无意识知觉的存在。 如果要说明刺激不被察觉和辨认情况下的知觉,所用的意识测量必须只受意识知觉的影响。但是,所有的行为测量可能既受意识知觉的影响,也受无意识知觉的影响。这样所测得的辨别能力就不知道是谁引起的。因为有意识的知觉加工和无意识的知觉加工都可能导致辨
16、别能力的提高。 总之,任务分离范式很难满足意识知觉测量的唯一性和充分性假设,难以证明无意识的存在和意识过程与无意识过程是否有本质上的差别。 研究语言产生的实验范式 现代西方语言产生的研究从研究范式上看,主要有 3 种类型,一种是继承前面通过语误和反应时等行为研究(包括采用 ERP)方法的传统,并发展出新的行为实验方法来进一步构建和检验所构建的语言产生模型。行为研究方法中除了继续采用自然和诱发语误推测语言产生的加工过程外,还在标准的词图干扰范式上发展出许多新的研究变式。一种方法是采用内隐启动的方法,这种方法通过学习词对的方式进行研究,词对中的前一个词为启动词,后一个词则为目标词,被试的任务是在见
17、到启动词后进行目标词的命名。一个反应序列中的目标词则分为同质类与异质类两种,同质类表示这个反应序列中的所有目标词均共有首音或者尾音,异质类则表示这一反应序列中的目标词之间没有上述关系。这种实验范式可以对语言产生中语音加工的方式进行研究,如 Meiyer 在实验采用词对 single-loner,place-local,fruit-lotusorcaptain-major,cards-maker,tree-maple,通过不同的组合可形成同质和异质两种反应序列。另一种类似的方法是采用符号命名,与内隐启动不同的是,在符号命名中学习的则是特定符号(如“”)与词(如“土地”)之间的联接。这两种方法虽然
18、突破了图片命名实验中图形实验材料的限制,但由于难以保证纯粹的语言产生过程(即语言产生应该是一个先有要表达的某种意图,然后找到相应的词条,最后提取相应的语音信息并组织发音的过程),而容易受到攻击。为了克服这一困难,一些研究者采用了翻译的方法,其中启动词是一种语言的词汇,而目标词则是另一种语言的对应词汇。因为双语研究发现熟练双语者进行语言之间的转换时需要有概念进行中介,所以通过选取合适的被试,可以获得相对有效的语言产生过程。如,Jescheniak 等人采用把英语启动词翻译成相应荷兰语的方法研究了语言产生中的频率效应。第三种研究式则是对词图干扰范式的改进,它不是对目标图形进行命名,而是对干扰字进行
19、命名。它是在目标图形呈现后的不同时间点上呈现干扰字或者“?”号,被试看到干扰字时命名字,看到“?”时则命名图。为了保证一个相对完整的语言产生过程,即被试不是消极等待干扰出现后才决定是否对图形进行语言产生的加工,而是一看到目标图形就进行图形命名的准备,这种实验范式一般要求被试在较短的时间内完成命名工作,如果被试等待干扰符号才决定的话,是很难达到这个要求的。如 Peterson 等人对语言产生中语义加工与语音加工阶段之间相互关系的研究就是采用这种研究方法。第二种研究范式的类型则采用认知神经科学对病人的研究,通过利用失语症病人出现的语言产生困难和各种表征与加工之间的分离现象来推断语言产生所需要的加工
20、过程,并用这些事实证据来支持或反对语言产生研究过程中建立起来的各种模型。在获得性语言障碍(失语症)的研究中发现了语言产生过程中大量不同类型的损伤与障碍,这些障碍不仅能够反映语言产生错误的类型,而且能够反映不同刺激特性(如词频、词长等)对语言产生的影响和语言产生中各种加工模块之间的分离。这些研究为语言产生模型的评估和发展提供了很好的手段。在失语症病人的研究中,其研究方法主要是通过各种命名、阅读和理解任务,观察不同病人在这些任务上表现出现出来的障碍状态,对语言产生中词汇系统的表征状态和加工过程进行推测。在这些任务中观察到的两种现象对语言产生的词汇表征状态有很大的贡献:通道特异性命名理解障碍和范畴特
21、异性命名理解障碍,前者是指在命令或理解任务中出现的通道选择性损伤现象,如视觉物体命名很好但触觉命名损伤或者刚好相反的现象;后者则指病人在不同类型词语中表现出来的选择性损伤问题,如命名有生命的物体感到困难,但其他类型的词词则没有问题。这些现象表明词汇系统中的语义、语音、词形、句法等信息的表征可能是相对分离的,而且在不同的通道上,还存在通道特异性的词汇表征系统。这使得语言产生研究中在构建相应的模型时,对语言产生所需要的词汇系统和加工阶段的考虑就不得不对这些事实材料进行整合。第三种研究范式的类型则是计算机模拟的方法,虽然计算机模拟的方式并不能够为我们的语言产生模型提供相应的经验证据,但是它可以通过对
22、现有经验证据的拟和来为各种复杂理论的正确性提供证据。在语言产生的研究中,一般不存在独立于产生理论的计算机模拟,相反,在语言产生的两个大的理论争论阵营都将计算机模拟作为一种重要的理论支持方法。如 Levelt(1999)构建的WEAVER+模型和 Dell(1997)的激活扩散模型。这些模型通过对语言产生不同表征层内部和表征层之间的激活或抑制以及联接之间的权重关系进行表示,来模拟现有的来自于语误、行为实验和认知神经心理学研究中得到的经验证据。RSVP 实验范式 RSVP 范式研究注意瞬脱现象实验范式。注意瞬脱现象是 Broadbent 等人发现的。该现象表明:被试对单词流中前一个目标词的准确辨认
23、使得他们很难辨认出在该词后约 500ms 内呈现的另一个单词。1987 年,Weichselgartner 和Sperling 也发现了类似的现象。注意瞬脱的研究把对注意研究的焦点转移到注意的时间维度上,通常采用 RSVP 范式。其具体方法如图所示,其中由字母、数字、单词、图形等组成的刺激流在同一位置以 620 个刺激/ 秒的速度连续呈现给被试,要求被试辨别或觉察刺激流中的目标刺激(Target ,以下简称 T)和一个探测刺激(Probe ,以下简称 P ,一般在 T 后的 18 个刺激中呈现) ;刺激流呈现完后要求被试报告 T、P ;刺激流中,T 或 P 后的第 i 个刺激通常简称为 T+
24、i 项或 P + i 项。 图画-词汇干扰实验范式 图画-词汇干扰实验范式是在呈现目标图画之前、同时或之后不同的时间内呈现一个与图片名称相关的词语。被试命名图片的时间可能受到干扰词语的影响,根据不同时间下不同的影响结果可以推断词汇产生的时间进程,并检验交互激活模型和独立两阶段模型对词汇产生中语义和语音激活时间进程的预测。这是研究汉字认识加工的一种实验范式。儿童博弈任务 (ChildrenS Gambling Task) 实验范式 Kerr 和 Zelazot 简化了 Bechara 等人研究中的爱荷华博弈任务 (Iowa Gambling Task),从而设计了儿童博弈任务来测量热执行功能,它
25、是热执行功能的研究方法中较复杂的一种。此任务运用了两副纸牌,一副纸牌的正面是竖条花纹,另一副的正面是圆点花纹。 将两副纸牌翻过来都能看见它们的反面有开心的脸和悲哀的脸。但不同的是,正面是竖条花纹的纸牌的反面总是有 1 张开心的脸,偶尔加上 1 张悲哀的脸;而正面是圆点花纹的纸牌的反面总是有 2张开心的脸,但有时会出现好几张 (如 4、5、6 张不等)悲哀的脸。开心的脸代表赢得糖果,其数量也代表赢得糖果的数量;悲哀的脸代表输掉糖果,其数量也同样代表输掉糖果的数量。每次试验只能选取一张纸牌。显然,选竖条花纹的纸牌虽然每次赢的糖果更少,只有 1 颗,但平均起来,输的糖果也更少;相反,选圆点花纹的纸牌
26、虽然每次赢的糖果更多,有 2 颗,但平均损失却大得多,一旦输,就会输掉 4 颗、5 颗或是 6 颗。因此,从长远来看,选竖条花纹的纸牌有利,反之,则不利。实验中,研究者告诉儿童 “游戏”结束时要赢得尽量多的糖果 (比如 50 次选牌后,这点儿童事先不知 )。开始的 25 次选择可以看作儿童对两种纸牌的尝试;后面的 25 次试验将被作为对情感决策的诊断。此实验的关键因变量为儿童在第 2650 次试验中做出不利选择的比例。这种研究方法主要是对儿童情感决策 的诊断,通过这种诊断可以推断出儿童的“热”执行功能发展与年龄有关的规律。它还考察 儿童控制受即时愿望支配的动作的能力和预测他们的动作将会产生的后
27、果的能力。它常用于 学前儿童,但对学龄儿童也适用。 延迟满足任务 (Delay of Gratification) 延迟满足任务是研究热执行功能的一项经典范例,它采用延迟任务和选择任务来评定满意的延迟 (如 Mischel,Ebbesen 和 Zeiss。研究者向儿童呈现一些小礼品 (如糖)并让儿 童选择是立即得到 1 颗糖还是过一段时间 (如游戏结束时)获得 2 颗糖 (此数量是可以改变的,如:现在 1 颗,游戏结束时 6 颗)。研究要测量的是儿童做出延迟选择的次数,并就此来考察儿童是否能够抑制即时的愿望去满足长远的愿望,即能否有着眼于将来。 使用这种方法的早期研究通常未在学前期发现年龄差异
28、,但在学龄期发现了年龄差异。 而且,这一研究确定了许多影响儿童选择等待的时间长度的注意和认知因素。例如,对想要的奖赏的抽象的、非唤醒的,而不是具体的、唤醒的特性的考虑积极地影响了儿童延迟满足的能力。这些结果说明了在这个任务上取得成功的一种方法可能是将它从一个“热”执行功能任务转变为一个 “冷”执行功能任务,强调了执行功能的两方面之间的密切关系。 近年来,有两个研究采用经过修改的选择任务,考察了年龄较小的儿童能否放弃自己当前的机会去满足自己将来的愿望或者能否帮助他人 (research assistant)放弃当前的机会去满足将来的愿望。儿童在研究中表现出了审慎和利他行为,并且这种着眼于将来的(future oriented)审慎和利他行为与年龄有关。Moore 还发现审慎和利他行为与心理理论测验中的表现相关。窗口任务 (WindowsTask) 这种研究方法来源于 Russell、Mauthner、Sharpe 和 Tidswell。研究者向儿童呈现开有窗口的两个盒子,将盒子上的窗口朝向儿童,以便让儿童看到盒子的内容。每一次试验中,主试在其中一个盒子里放上 “诱饵”,要求儿童告诉主试 (主试看不到盒子的内容)哪个盒子里有东西。接着,主试对儿童指出