B·F·斯金纳强化理论探析
谢应宽(贵州师范大学 教育系 , 贵州 贵 阳 550001)
摘要 :B·F·斯金纳是美国现代行为主义心理学派的主要代表人物之一 , 强化理论是他学习理论中最重要 的部分和基础 。本文在全面分析了斯金纳对强化类型 、强化在儿 童发展中的作用等方面的研究成果的基础上 , 结合其强化理论在教育 、教学实践中的得失 , 认为 , 其理论一方面创造性地发展了学习理论 , 对教育教学实践产生了重大的影响 , 并推动了相关学科的发展 , 但另一方面也存在着明显的机械论色彩 、忽视儿童心理发展内部矛盾 、人和动物的心理不分等不足 。
关 键 词 :B·F·斯金纳 ;强化理论 ;积极强化 ;消极强化 ;程序教学
中图分类号 :G44 文献标识码 :A
斯金纳的研究领域很广 , 著有10多部专著 ,110多篇论文 。他是一个彻底的行为主义者 , 也是一个激进的决定论者 , 并且具有明显的反理论化倾向 。但是 , 正如 1958 年美国心理学会授予他卓越的科学贡献奖时介绍他所说 , “ ……尽管他反对理论 , 人们仍然认为他是一个重要的系统化者 , 他发展了对行为的首尾一贯的描述 。这种描述极大地提高了我们预测和控制有机体(从老鼠到人)的能 力” 。所以 , 我们还是把他对强化的有关研究称为斯金纳强化理论 。
1 斯金纳的强化理论
强化(reinforcement)是斯金纳从巴甫洛夫那里借用来的一个概念 , 但是内涵发生了变化 , 在巴甫洛夫经典条件反射中 , 强化指伴随于条件刺激物之后的无条件刺激的呈现 ;在斯金纳的操作条件反射中 , 强化是指伴随于行为之后且有助于该行为重复出现的概率增加的事件 。
虽然巴甫洛夫用经典条件反射对强化作过部分研究 , 但斯金纳是对强化问题作比较全面研究的第一人 。在他的理论体系中 , 强化是主要的自变量 , 他认为行为之所以发生变化就是因为强化的作用 , 对强化的控制就是对行为的控制 。因此 , 强化理论是斯金纳学习理论中最重要的部分和基础 。
1.1 强化的类型
在斯金纳的强化理论中 , 他曾根据不同的标准 , 把强化分成不同的类型 。
1.1.1 按照强化物的性质来分
斯金纳根据强化物的性质 , 把强化分为积极强化(positive reinforcement )和消极强化(negative rein- forcement )(阳性强化和阴性强化或正强化和负强 化)。积极强化是指由于一刺激物在个体作出某种反应(行为)后出现从而增强了该行为(反应)发生的概率 , 该刺激物称为积极强化物 。例如 , 当个体作出某一行为后 , 给予他食物 、钱或者表扬 , 那么这 种行为就会受到积极强化 , 这些食物 、钱或者表扬就是积极强化物 。 消极强化是指由于一刺激物在个体作出某种反应(行为)后而予以排除从而增强了该行为发生的概率 , 该刺激物称为消极强化物 。例如 , 如果犯人立功后 , 就给他减刑 , 那么 , 犯人的 立功行为就会受到消极强化 , 而服刑年限则是消极强化物 。从中可以看出 , 不论积极强化还是消极强化 , 其结果都是一样的 , 即都可以增强该行为(反 应)再次出现的可能性 , 使该行为得到增强 。积极强化物同消极强化物在性质上的区别表现在 :两者的区分不能仅从字面意义去理解 , 而应从该刺激物的出现是增强了行为(反应)发生的概率还是降低了行为(反应)发生的概率这一结果上去判断 。如果该刺激物的出现增强了行为(反应)发生的概率或该刺激物撤消降低了行为(反应)发生的概率 , 则该刺激物为积极强化物 , 反之为 极强化物 。例如 , 一般而言 , 在课堂捣蛋被教师批评被认为是负面(消极)结果 , 但是 , 如果一个学生由于平时不受教师注意 , 而想通过上课捣蛋来引起教师的注意 (被教师批评也是一种引起教师注意), 那么 , 他会为了更多地被教师注意到而不断地捣蛋 , 这时 , 批 评就成了积极强化物了 , 而不是我们按日常所想的是消极强化物 。
1.1.2 人类行为受强化影响的程度
斯金纳根据人类行为受强化影响的程度 , 把强化分为一级强化和二级强化 。一级强化是指满足人和动物生存 、繁衍等基本生理需要的强化 。一级强化物如食物 、水 、安全 、温暖 、性等 。二级强化是指任何一个中性刺激如果与一级强化物反复联合 , 它就能获得自身的强化性质 。二级强化物如金钱 、学历 、关注 、赞同等 , 这些二级强化物初时并不具有 强化的作用 , 而是由于它们同诸如食物 、性欲之类 的一级强化物相匹配而具有了强化的作用 。例如 , 金钱是和许多生活必需品(一级强化物)的提供联系在一起的 ;学历虽然不如金钱那么直接 , 但也是和一级强化物的获得联系在一起的(通过考试就可以得到文凭 , 进而可以有利于找到工作 , 可以自立 门户 , 可以自己买食物和所需的其它东西 , 可以有吸引配偶的能力);来自他人的关注 , 赞同和关爱之所以成为二级强化物 , 也是因为它们与来自他人的 对一级强化物的满足联系在一起(那些给予儿童赞 同和关爱的成人也能够给孩子提供食物 , 温暖等一级强化物 。而且 , 来自异性的关注 、赞同和关爱的 信息是和性欲联系在一起的)。这里的关键是只要通过和一级强化物发生关联 , 各式各样的刺激都可以具有强化的作用 , 然后这些刺激就可以独立地运 转来控制行为 。
1.1.3 根据行为和强化间间隔时间来分
斯金纳和同事们在研究什么条件下强化能发挥最佳作用时 , 根据行为发生与强化物出现间隔的时间 , 把强化分为连续式强化(也称即时强化)和间隔式强化(也称延缓强化)。
连续式强化是指对每一次或每一阶段的正确反应予以强化 , 就是说当个体作出一次或一段时间 的正确反应后 , 强化物即时到来或撤去 。例如 , 当孩子扫地后 , 家长马上对他进行表扬 ;当孩子协助妈妈做饭后 , 家长也即时予以肯定 。长此以往 , 孩子就会形成爱做家务的良好习惯 。但 , 当按照连续式强化程序安排建立起了某种行为并将此行为保持下来之后 , 倘若不再给予强化时 , 这种行为就会逐渐消退 , 如当一个孩子已形成做家务的习惯后 , 家长对孩子做完家务后不再给予表扬 , 那么孩子做家务的习惯就会逐渐消退 。 间隔式强化是指行为发生与强化物的出现或撤去之间有一定的时间间隔或按比率出现或撤去 。间隔式强化分为时间式和比率式 , 时间式又分为定时距式强化和变时距式强化 , 比率式又分为定比率式强化和变比率式强化 。定时距式强化就是每次过一定时间间隔之后给予强化 。例如 , 每隔5min 或10min 强化一次 。实验表明 , 2 次强化的时间间隔越短 , 动物的反应就越快 。变时距式强化就是指每次强化的时间间隔不等 。例如 , 第一次隔 5min 进行强化 , 第二次隔 10min 进行强化 , 第三次隔 8min 进行强化 。定比率强化是指强化与反应次数之间呈一固定比例 。在这种情况下 , 强化不是在一 定时间间隔 , 而是在预定的多少次反应之后出现 。例如 , 动物必须在按 20 次横杆后才给予强化 。实验结果表明 , 动物在定比率强化中的反应比在定时距式强化中的反应快 , 并且这种现象在动物和人的活动中普遍存在 。他们认为这种强化式最符合实际 , 也最有效 。变比率式强化是指强化与反应次数之间的比例是变化的 。例如 , 第1次动物在按20次横杆后 , 给予强化 , 第2次动物需按30次横杆后才给予强化 , 第 3 次 … …。 这类强化有利于学习者向更高的目标前进 , 当然 , 如果这种变化是无规律 的 , 则容易引起学习者不知所从 , 从而影响学习效果 。
1.2 “ 强化”与“ 奖励” 、“消极强化”与“ 惩罚”的关系
1.2.1 强化与奖励
斯金纳认为 , 在“ 强化”和“ 奖励”之间必须作出 明确的区分 。受到强化的行为一定是得到了加强 , 而受到奖励的行为可能会也可能不会得到加强 。对此 , 斯金纳这样解释说 :我们称一种事物为强化物 , 是当它能够在现实中使某种行为得到加强时才这么称呼它 , 即我们是根据事物对行为的作用来定义强化物的 。而奖励一词不包括强化一词所包含的加强作用 , 像奖品 、金钱 、荣誉之类的奖励 , 有时确实可以加强它们所奖励的行为 , 在这时 , 它们可以被称为强化物 。但是 , 并不是所有的奖励都可以使行为得以加强 。而且 , 斯金纳还指出 , 奖励对行 为的加强作用并不是立即表现出来 , 而有效的强化物对行为的加强作用则是立即表现出来的 。 另外 , 他认为 , 奖励是对与愉快情景相联系的行为的主观解释 , 而强化则是一个中性术语 , 是要根据可观察和测量的事件来加以讨论的 。
1.2.2 消极强化与惩罚
斯金纳认为控制行为或试图控制行为的方法之一就是惩罚 , 他认为作为行为结果出现的惩罚有 2 种方式 :一种方式是在行为出现之后呈现消极强化物 , 另一种方式是行为出现后 , 撤走积极强化物 。前一种情况比较常见 , 如工作上出了差错的员工受到上级的责骂 , 对超速的驾驶员处以罚款 。
斯金纳认为 , 惩罚不是一种理想的控制行为的方法 , 其效果是有限的 。惩罚最常见的结果是使受到惩罚的行为(至少是暂时地)受到抑制 , 但是许多惩罚行为却并没有达到预期的效果 。例如 :那些受到过批评的学生仍旧在课堂上调皮捣蛋 , 一些因工作业绩不佳而受到训诫的员工并未因此而有所改变 。这些例子中所采取的措施并不见得有效 , 所以它们不能叫做“ 惩罚” 。事实上 , 有些行为表面上看好像是对不良行为的一种惩罚 , 而实际上却起到了强化的作用 。例如 , 一个学生因违反校规被叫到校长办公室受训 , 但这种行为可能被认为是“ 勇敢”或 “ 大胆”的表现 , 因而获得同学们的敬佩 。这样 , 那个学生违反校规的行为反而可能被强化 。
因此 , 斯金纳认为消极强化是不同于惩罚的 。前者是撤走一种消极强化物 , 使得在此之前的那种行为的出现概率增加 , 而后者是增加一种消极强化物或撤离一种积极强化物 , 引起的结果是先行行为的抑制(至少是暂时的)。
1.3 强化在儿童行为产生和发展中的作用
对儿童行为的强化控制 , 是斯金纳重点研究的对象 , 他认为 , 强化在儿童行为产生和发展过程中起着重要作用 , 主要表现在 :
首先 , 在他看来 , 强化作用是塑造儿童行为的基础 。只要了解了强化效应和操纵好强化技术 , 就能控制行为反应 , 就能随意塑造出一种教育者所期望的儿童的行为 。儿童偶然做出了某种行为而得到了教育者的强化 , 那么 , 这个行为就比其它行为更容易被重复出现 , 强化次数越多 , 其概率就越大 , 这便导致儿童行为的建立 。
其次 , 强化在儿童行为发展过程中起着重要的作用 , 行为不强化就会消退 。因此 , 如果要巩固儿 童的某种良好行为 , 就必须在其作出行为后予以强化 , 否则就可能消退 。在斯金纳看来 , 如果只是重复练习某种行为而不强化是不会巩固和发展起一 种行为的 , 因为练习的多少本身不会影响到行为反应的速率 , 它只是为儿童获得重复强化提供机会而 己 。也就是说 , 儿童练习某种行为的目的是为了获得强化物而不是别的 。
再次 , 斯金纳强调及时强化 , 如果强化不及时 不利于儿童行为发展 , 认为教育者要及时强化希望 在儿童身上看到的行为 , 否则 , 那种行为就不能持 久 。
2 斯金纳强化理论在教育教学中的 运用
理论和实践相结合 , 是其理论的显著特征之一 。斯金纳非常重视将其理论运用于社会实际生 活 , 他在发展儿童行为和提高儿童教育教学质量方面 , 运用其强化理论 , 做了不少工作 , 并取得了重大 成果 。
斯金纳的强化理论在教育教学实践中 , 主要运 用于 :
2.1 塑造新行为
斯金纳认为儿童新行为产生的基本前提是强化 , 即得到强化的操作行为倾向于重复出现 , 当操作行为得不到强化时 , 这种行为只能偶然出现或者不出现 。他认为“ 教育就是塑造行为” , 所谓塑造 , 就是通过小步反馈帮助学生达到目标 。为塑造儿童的新行为 , 斯金纳设计了一整套塑造行为和保持行为强度的新技术 、新方法 , 这就是对趋向于所要塑造的行为的方向的行为不断地给予强化 , 直到引出所需要的新行为 。 同时 , 他要求在塑造儿童行为时要注意这样一条原则 :学生必须在他们能力所及 的行为范围内得到强化 , 同时这些行为又必须向新 的行为延伸 。斯金纳这些新技术 、新方法被社会广泛地接受和运用 。他自己为抚养女儿 , 曾设计过一个被称为斯金纳“ 育婴箱”的改进摇篮 , 并取得满意的教育效果 。
2.2 行为矫正
斯金纳把他的强化理论成功地运用于对儿童不良行为的矫正工作 。这种矫正工作并不复杂 , 对 一般性的不良行为 , 只要成人注意不论何时何地以何种方式都不去强化儿童的不良行为 , 那么 , 这种不良行为就能得到矫正 。例如 , 一个孩子总是不好好吃饭 , 要家长追着喂或总是饭前饭后要零食吃 。如果家长在他不吃饭时不管他 , 饭前饭后也不给零食吃 , 每天总是按时进餐 , 那么 , 孩子由于受饥饿的驱使 , 就不得不按时好好地就餐了 , 这种方法同卢梭的“ 自然后果法”有异曲同工之妙 。
对较严重的不良行为的矫正 , 斯金纳采用他发展了的行为疗法来进行 。他用操作性行为技术补充了由华生和琼斯第一次使用的系统脱敏作用的方法 , 其典型的方法是模仿和随机强化法 。模仿疗法分两个阶段 , 首先 , 病人先观看别人的行为和行为的结果所带来的强化 , 这些行为都是病人所希望的 。其次 , 病人亲自实践这些行为 , 治疗者给予强化 。随机强化法是较为灵活的治疗方法 , 它包括各种操作学习技术 , 诸如积极强化 , 塑造 , 模仿等的随机应用 。 结果 , 精神分裂患者可以被训练去做有益工作 , 迟钝儿童也能在个人卫生和社交行为中受到训练 。
2.3 程序教学(procedural teaching)
斯金纳在他的《自传》中讲述了这样一个故事 : “ 1953 年 , 我的小女儿在剑桥的一所私立小学四年级上学 。那年11月11日 , 我以家长的身份 , 访问学校 , 坐在教室后面听算术课 。我忽然发现 , 整个教学情境显得十分荒谬 。那里坐着 20 个十分可珍爱的有机体 。 但是那位教师却违反了我们所熟悉的关于学习过程的几乎所有原理和做法 , 虽然这不能完全归咎于她本人 。”这对他的感触很深 , 于是 , 斯金纳根据其强化理论 , 开始对学校各科教学可能有的各种强化列联进行分析 , 想找出一种最有利于学生学习的强化列联 。由此 , 他提出了程序教学 , 在这种教学方式中将知识学习细分为一系列过程 , 每下一个过程的复杂程度都比上一个过程深 , 每一次学习的知识量都是比较合适的 。依照这种安排 , 学生每次学习的量不大 , 学习由易到难 , 学习内容环环相扣 , 这样循序渐进使得学生学习起来不会出现过多的困惑 , 对于和学习材 料对应的各种问题 (按照复杂程度的顺序编排), 学生作出正确反应的比率也会比较高 , 这样下去就可以逐步强化复杂的反应 。他还为编制程序教学制定了三条基本原则 : 第一 , 学生必须对问题随时作出积极的外显反应 ; 第二 , 在学生作出外显反应时 , 应立刻得到及时的强化 ;第三 , 学习进程的步子要小 。其中 , 中心的原则是强化 。并且他还专门设计了一种能帮助教师 安排这种强化列联的教学机器 , 通过实践 , 斯金纳认为教学机器的作用不亚于家教 。
1954 年春 , 斯金纳在匹兹堡大学一次关于《心 理学的当前动向》的会议上 , 做了用教学机器教拼 写和算术的演示 , 同年又发表了《学习的科学和教学的艺术》这篇重要论文 。于是在不到一年的时间 内 , 机器教学运动很快发展起来 , 形成当时美国教 育界的一股新力量 , 并波及全世界 。现在的计算机辅助教学(computer —assisted —instruction , 简称 CAI)就是一种发展了的机器教学 。
3 .对斯金纳强化理论的评价
(1)强化现象是人类行为中的一种普遍现象 , 斯金纳在对此进行系统研究的基础上 , 提出了强化 理论 , 这是对人类学习理论研究的创造性贡献 。
(2)斯金纳的强化理论中所揭示出的有关强化 的规律 , 对我们的教育教学工作具有重要的启示作 用 。
首先 , 他认为儿童作出良好行为后 , 要予以及时强化 , 否则 , 这种行为容易消退 。这就要求我们在教育教学中要贯彻及时反馈的原则 , 要敏锐地观察到儿童的进步 , 那怕是一小点 , 都应及时给予强化 , 使儿童的进步行为进一步发展起来 , 最终达到发扬积极因素 , 克服消极因素的目的 。
其次 , 他认为惩罚虽然是控制行为或试图控制行为的方法之一 , 但他认为惩罚只可能偶尔压抑住 某些行为 , 并没减弱反应的总倾向 。 因此 , 他坚决反对教育儿童时使用惩罚 , 甚至在他 1948 年的小 说《沃尔登第二》中 , 称惩罚是一种罪恶 。他鼓励人们大量运用积极强化来教育儿童 , 用积极强化物来使儿童形成和维持良好行为 。这对我们教育教学 实践的启示是 :要多鼓励儿童 , 不要滥用惩罚 , 更不用说体罚儿童了 。
总之 , 由于其理论的有效性和可行性 , 已被广泛地运用到当今教育教学实践的方方面面 。 只要合理地综合运用各种类型的强化 , 都将有利于教育教学质量的提高 。
(3)斯金纳的程序教学当时虽没有取得最终成 功 。但是 , 他用于教学机器中的程序设计 , 却已在日益流行的计算机辅助教学(CAI)和网络技术中被广泛地应用了 。
(4)现代认知心理学 , 20世 纪70 年代兴起的环境心理学 , 人工智能研究 , 临床收效较大的新行为疗法等 , 都受到了他的强化理论和实践的影响 。
(5)斯金纳的强化理论还丰富了现代管理科学 , 行为科学等的内容 , 并被广泛地运用于社会的各项管理中且取得了巨大的成就 。当然 , 斯金纳的强化理论也存着许多不足之处 , 首先 , 强化是不是学习的必要条件 , 学习是不是一定要有外显行为(反应), 强化是不是要直接作用于学习者等 , 斯金纳没能作出科学的解释 , 对这些 问题的深入研究 , 使后来的心理学家班杜拉创立了自己独特的强化理 论 , 即社会 学习强化理论 。其 次 , 斯金纳的强化理论带有明显的机械论色彩 , 人成了环境和形形色色的强化作用的消极的承受者 。并且 , 这种支配人的环境只是人即刻所处的情境 , 其中并不包括像马克思 、恩格斯曾指出的包括诸多 生产资料的生产方式那样宏观而持久的社会因素 。 第三 , 由于他不愿意强调人类与动物行为的本质区 别 , 于是他把从动物实验中得到的有关强化的结论直接应用于人 , 而没有考虑到人的特殊性 , 如社会 性 , 主观能动性等 , 这显然是不科学的 。第四 , 斯金 纳忽视了强化必须和儿童心理发展的内部矛盾统 一起来 , 这也是他反对任何对意识 、情感和动机作假设的必然 。虽然他并不否认人有意识 、感情和心 理状态等 , 但是 , 他认为研究这些中间变量不仅不 能促进反倒会妨碍我们有效地研究和控制行为本 身 , 会妨碍我们径直地研究可以直接观察和控制的 有关变量 。所以斯金纳的研究对象被称为是彻底 的“ 黑箱有机体” 。
[ 1] 陈泽民 .B·F·斯金纳描述行为主义及学习理论简介[ J].心理探新 , 1980, (1):25-30.
[ 2] 高觉敷 .西 方近代心理学史[ M] .北京 :人民教 育出版 社 , 1982.
[ 3] 李汉松 .西 方心理学史[ M] .北京 :北京 师范大 学出版 社 , 1988.
[ 4] 朱智贤 , 林崇 德 .儿童 心理 学史[ M] .北 京 :北京 师范 大学出版社 , 1988.
[ 5] [ 美] Robert .D·Nye.三种心 理学 — 弗洛 伊德 、斯金 纳和 罗杰斯的心理学理论 [ M] .石林 , 袁坤 , 译 .北京 :中国 轻工业出版社 , 2000.
[ 6] 陈奇 , 刘儒德 .当代教育 心理学 [ M] .北京 :北 京师范 大学出版社 , 2001.
[ 7] Skinner B·F.The behavior of organismas[ M] .New York :Ap- pleton-Century -Crofts, 1938.
[ 8] Skinner .B·F.Teaching machines[ J] .Scientific American .
1961 , November.90-102.
[ 9] Skinner B·F.The technology of teaching[ M] .New York : Appleton- Century -Crofts, 1968.
[ 10] Skinner , B·F.Contingencies of reinforcement :A theoreticd analysis.[ M] .New York:Appleton -Century - Crofts , 1969.