精准教学

位置:首页>精准教学>理论文献>详情

B·F·斯金纳强化理论探析

2019年01月22日 点击查看:2295

B·F·斯金纳强化理论探析

谢应宽(贵州师范大学 教育系 , 贵州 贵 阳  550001)

        摘要 :B·F·斯金纳是美国现代行为主义心理学派的主要代表人物之一 , 强化理论是他学习理论中最重要 的部和基础 。本文在全面分析了斯金纳对强化类型 、强化在儿 童发展中的作用等方面的研究成果的基础上 , 结合强化理论在教育 、教学实践中的得失 , 认为 , 其理论一方面创造性地发展了学习理论 , 对教育教学实践产生了大的影响 , 并推动了相关学科的发展 , 但另一方面也存在着明显的机械论色彩 、忽视儿童心理发展内部矛盾 、和动物的心理不分等不足 。

       关 键 词 :B·F·斯金纳 ;强化理论 ;积极强化 ;消极强化 ;程序教 

       中图分类号 :G44 文献标识码 :A

       斯金纳的研究领域很广 , 著有10多部专著 ,110多篇论文 。他是一个彻底的行为主义者 , 也是一个激进的决定论者 , 并且具有明显的反理论化倾向 。但是 , 正如 1958 年美国心理学会授予他卓越的科学贡献奖时介绍他所说 , “ ……尽管他反对理论 , 人们仍然认为他是一个重要的系统化者 , 他展了对行为的首尾一贯的描述 。这种描述极大提高了我们预测和控制有机体(从老鼠到人)的 力” 。所以 , 我们还是把他对强化的有关研究称斯金纳强化理论 。

1 斯金纳的强化理论

     强化(reinforcement)是斯金纳从巴甫洛夫那借用来的一个概念 , 但是内涵发生了变化 , 在巴洛夫经典条件反射中 , 强化指伴随于条件刺激物后的无条件刺激的呈现 ;在斯金纳的操作条件反 , 强化是指伴随于行为之后且有助于该行为重出现的概率增加的事件 。

虽然巴甫洛夫用经典条件反射对强化作过分研究 , 但斯金纳是对强化问题作比较全面研究第一人 。在他的理论体系中 , 强化是主要的自 , 他认为行为之所以发生变化就是因为强化的 , 对强化的控制就是对行为的控制 。因此 , 强理论是斯金纳学习理论中最重要的部分和基础  

1.1 强化的类型

在斯金纳的强化理论中 , 他曾根据不同的标准 , 把强化分成不同的类型 。

1.1.1 按照强化物的性质来 

斯金纳根据强化物的性质 , 把强化分为积极强化(positive  reinforcement )和消极强化(negative  rein- forcement )(阳性强化和阴性强化或正强化和负 化)。积极强化是指由于一刺激物在个体作出某反应(行为)后出现从而增强了该行为(反应)发的概率 , 该刺激物称为积极强化物 。例如 , 当个作出某一行为后 , 给予他食物 、钱或者表扬 , 那么 种行为就会受到积极强化 , 这些食物 、钱或者表就是积极强化物 。 消极强化是指由于一刺激物个体作出某种反应(行为)后而予以排除从而增了该行为发生的概率 , 该刺激物称为消极强化物 例如 , 如果犯人立功后 , 就给他减刑 , 那么 , 犯人 立功行为就会受到消极强化 , 而服刑年限则是消强化物 。从中可以看出 , 不论积极强化还是消极 , 其结果都是一样的 , 即都可以增强该行为( 应)再次出现的可能性 , 使该行为得到增强 。积强化物同消极强化物在性质上的区别表现在 :两的区分不能仅从字面意义去理解 , 而应从该刺激的出现是增强了行为(反应)发生的概率还是降了行为(反应)发生的概率这一结果上去判断 。果该刺激物的出现增强了行为(反应)发生的概或该刺激物撤消降低了行为(反应)发生的概率 , 该刺激物为积极强化物 , 反之为 极强化物 。 , 一般而言 , 在课堂捣蛋被教师批评被认为是面(消极)结果 , 但是 , 如果一个学生由于平时不受教师注意 , 而想通过上课捣蛋来引起教师的注 (被教师批评也是一种引起教师注意), 那么 , 他为了更多地被教师注意到而不断地捣蛋 , 这时 ,  评就成了积极强化物了 , 而不是我们按日常所想是消极强化物 。

1.1.2 人类行为受强化影响的程 

斯金纳根据人类行为受强化影响的程度 , 把强化分为一级强化和二级强化 。一级强化是指满人和动物生存 、繁衍等基本生理需要的强化 。一强化物如食物 、水 、安全 、温暖 、性等 。二级强化指任何一个中性刺激如果与一级强化物反复联合 , 它就能获得自身的强化性质 。二级强化物如金钱 学历 、关注 、赞同等 , 这些二级强化物初时并不具 强化的作用 , 而是由于它们同诸如食物 、性欲之 的一级强化物相匹配而具有了强化的作用 。例如 , 金钱是和许多生活必需品(一级强化物)的提供系在一起的 ;学历虽然不如金钱那么直接 , 但也和一级强化物的获得联系在一起的(通过考试就以得到文凭 , 进而可以有利于找到工作 , 可以自 门户 , 可以自己买食物和所需的其它东西 , 可以吸引配偶的能力);来自他人的关注 , 赞同和关爱所以成为二级强化物 , 也是因为它们与来自他人 对一级强化物的满足联系在一起(那些给予儿童 同和关爱的成人也能够给孩子提供食物 , 温暖等级强化物 。而且 , 来自异性的关注 、赞同和关爱 信息是和性欲联系在一起的)。这里的关键是只通过和一级强化物发生关联 , 各式各样的刺激都以具有强化的作用 , 然后这些刺激就可以独立地 转来控制行为 。

1.1.3 根据行为和强化间间隔时间来 

斯金纳和同事们在研究什么条件下强化能发挥最佳作用时 , 根据行为发生与强化物出现间隔时间 , 把强化分为连续式强化(也称即时强化)和隔式强化(也称延缓强化)。

连续式强化是指对每一次或每一阶段的正反应予以强化 , 就是说当个体作出一次或一段时 的正确反应后 , 强化物即时到来或撤去 。例如 , 孩子扫地后 , 家长马上对他进行表扬 ;当孩子协妈妈做饭后 , 家长也即时予以肯定 。长此以往 , 子就会形成爱做家务的良好习惯 。但 , 当按照连式强化程序安排建立起了某种行为并将此行为持下来之后 , 倘若不再给予强化时 , 这种行为就逐渐消退 , 如当一个孩子已形成做家务的习惯后 , 家长对孩子做完家务后不再给予表扬 , 那么孩子做家务的习惯就会逐渐消退 。 间隔式强化是指行为发生与强化物的出现或撤去之间有一定的时间间隔或按比率出现或撤去 。间隔式强化分为时间式和比率式 , 时间式又分为定时距式强化和变时距式强化 , 比率式又分为定比率式强化和变比率式强化 。定时距式强化就是每次过一定时间间隔之后给予强化 。例如 , 每隔5min 或10min 强化一次 。实验表明 , 2 次强化的时间间隔越短 , 动物的反应就越快 。变时距式强化就是指每次强化的时间间隔不等 。例如 , 第一次隔 5min 进行强化 , 第二次隔 10min 进行强化 , 第三次隔 8min 进行强化 。定比率强化是指强化与反应次数之间呈一固定比例 。在这种情况下 , 强化不是在一 定时间间隔 , 而是在预定的多少次反应之后出现 。例如 , 动物必须在按 20 次横杆后才给予强化 。实验结果表明 , 动物在定比率强化中的反应比在定时距式强化中的反应快 , 并且这种现象在动物和人的活动中普遍存在 。他们认为这种强化式最符合实际 , 也最有效 。变比率式强化是指强化与反应次数之间的比例是变化的 。例如 , 第1次动物在按20次横杆后 , 给予强化 , 第2次动物需按30次横杆后才给予强化 , 第 3 次 … …。 这类强化有利于学习者向更高的目标前进 , 当然 , 如果这种变化是无规律 的 , 则容易引起学习者不知所从 , 从而影响学习效果 。

1.2 “ 强化”与“ 奖励” 、“消极强化”与“ 惩罚”关系

1.2.1  强化与奖励

斯金纳认为 , 在“ 强化”和“ 奖励”之间必须作 明确的区分 。受到强化的行为一定是得到了加强 , 而受到奖励的行为可能会也可能不会得到加强 对此 , 斯金纳这样解释说 :我们称一种事物为强 , 是当它能够在现实中使某种行为得到加强时这么称呼它 , 即我们是根据事物对行为的作用来义强化物的 。而奖励一词不包括强化一词所包的加强作用 , 像奖品 、金钱 、荣誉之类的奖励 , 有确实可以加强它们所奖励的行为 , 在这时 , 它们以被称为强化物 。但是 , 并不是所有的奖励都可使行为得以加强 。而且 , 斯金纳还指出 , 奖励对 为的加强作用并不是立即表现出来 , 而有效的强物对行为的加强作用则是立即表现出来的 。 另外 , 他认为 , 奖励是对与愉快情景相联系的行为的主解释 , 而强化则是一个中性术语 , 是要根据可观和测量的事件来加以讨论的 。

1.2.2 消极强化与惩 

斯金纳认为控制行为或试图控制行为的方法之一就是惩罚 , 他认为作为行为结果出现的惩罚 2 种方式 :一种方式是在行为出现之后呈现消极化物 , 另一种方式是行为出现后 , 撤走积极强化物 前一种情况比较常见 , 如工作上出了差错的员工到上级的责骂 , 对超速的驾驶员处以罚款 。

斯金纳认为 , 惩罚不是一种理想的控制行为方法 , 其效果是有限的 。惩罚最常见的结果是使到惩罚的行为(至少是暂时地)受到抑制 , 但是许惩罚行为却并没有达到预期的效果 。例如 :那些到过批评的学生仍旧在课堂上调皮捣蛋 , 一些因作业绩不佳而受到训诫的员工并未因此而有所 。这些例子中所采取的措施并不见得有效 , 所它们不能叫做“ 惩罚” 。事实上 , 有些行为表面上好像是对不良行为的一种惩罚 , 而实际上却起到强化的作用 。例如 , 一个学生因违反校规被叫到长办公室受训 , 但这种行为可能被认为是“ 勇敢” “ 大胆”的表现 , 因而获得同学们的敬佩 。这样 , 个学生违反校规的行为反而可能被强化 。

因此 , 斯金纳认为消极强化是不同于惩罚的 前者是撤走一种消极强化物 , 使得在此之前的那行为的出现概率增加 , 而后者是增加一种消极强物或撤离一种积极强化物 , 引起的结果是先行行的抑制(至少是暂时的)。

1.3 强化在儿童行为产生和发展中的作用

对儿童行为的强化控制 , 是斯金纳重点研究的对象 , 他认为 , 强化在儿童行为产生和发展过程中起着重要作用 , 主要表现在 :

首先 , 在他看来 , 强化作用是塑造儿童行为的基础只要了解了强化效应和操纵好强化技术 , 就能控制行为反应 , 就能随意塑造出一种教育者所期望的儿童的行为 。儿童偶然做出了某种行为而得到了教育者的强化 , 那么 , 这个行为就比其它行为更容易被重复出现 , 强化次数越多 , 其概率就越大 , 这便导致儿童行为的建立 。

其次 , 强化在儿童行为发展过程中起着重要的作用 , 行为不强化就会消退 。因此 , 如果要巩固儿 童的某种良好行为 , 就必须在其作出行为后予以强化 , 否则就可能消退 。在斯金纳看来 , 如果只是重复练习某种行为而不强化是不会巩固和发展起一 种行为的 , 因为练习的多少本身不会影响到行为反应的速率 , 它只是为儿童获得重复强化提供机会而 己 。也就是说 , 儿童练习某种行为的目的是为了获得强化物而不是别的 。


再次 , 斯金纳强调及时强化 , 如果强化不及时 不利于儿童行为发展 , 认为教育者要及时强化希望 在儿童身上看到的行为 , 否则 , 那种行为就不能持 久 。

2 斯金纳强化理论在教育教学中的 运用

理论和实践相结合 , 是其理论的显著特征之 。斯金纳非常重视将其理论运用于社会实际生 活 , 他在发展儿童行为和提高儿童教育教学质量方面 , 运用其强化理论 , 做了不少工作 , 并取得了重大 成果 。

斯金纳的强化理论在教育教学实践中 , 主要运 用于 :

2.1 塑造新行为

斯金纳认为儿童新行为产生的基本前提是 , 即得到强化的操作行为倾向于重复出现 , 当作行为得不到强化时 , 这种行为只能偶然出现或不出现 。他认为“ 教育就是塑造行为” , 所谓塑造 , 就是通过小步反馈帮助学生达到目标 。为塑造童的新行为 , 斯金纳设计了一整套塑造行为和保行为强度的新技术 、新方法 , 这就是对趋向于所塑造的行为的方向的行为不断地给予强化 , 直到出所需要的新行为 。 同时 , 他要求在塑造儿童行时要注意这样一条原则 :学生必须在他们能力所 的行为范围内得到强化 , 同时这些行为又必须向 的行为延伸 。斯金纳这些新技术 、新方法被社会广泛地接受和运用 。他自己为抚养女儿 , 曾设计过个被称为斯金纳“ 育婴箱”的改进摇篮 , 并取得满的教育效果 。

2.2 行为矫正

斯金纳把他的强化理论成功地运用于对儿不良行为的矫正工作 。这种矫正工作并不复杂 ,  一般性的不良行为 , 只要成人注意不论何时何地何种方式都不去强化儿童的不良行为 , 那么 , 这不良行为就能得到矫正 。例如 , 一个孩子总是不好吃饭 , 要家长追着喂或总是饭前饭后要零食吃 如果家长在他不吃饭时不管他 , 饭前饭后也不给食吃 , 每天总是按时进餐 , 那么 , 孩子由于受饥饿驱使 , 就不得不按时好好地就餐了 , 这种方法同梭的“ 自然后果法”有异曲同工之妙 。

对较严重的不良行为的矫正 , 斯金纳采用他发展了的行为疗法来进行 他用操作性行为技术补充了由华生和琼斯第一次使用的系统脱敏作用的方法 , 其典型的方法是模仿和随机强化法 。模仿疗法分两个阶段 , 首先 , 病人先观看别人的行为和行为的结果所带来的强化 , 这些行为都是病人所希望的 。其次 , 病人亲自实践这些行为 , 治疗者给予强化 。随机强化法是较为灵活的治疗方法 , 它包括各种操作学习技术 , 诸如积极强化 , 塑造 , 模仿等的随机应用 。 结果 , 精神分裂患者可以被训练去做有益工作 , 迟钝儿童也能在个人卫生和社交行为中受到训练 。

2.3 程序教学(procedural teaching)

斯金纳在他的《自传》中讲述了这样一个故事 : “ 1953 年 , 我的小女儿在剑桥的一所私立小学四年级上学 。那年11月11日 , 我以家长的身份 , 访学校 , 坐在教室后面听算术课 。我忽然发现 , 整教学情境显得十分荒谬 。那里坐着 20 个十分可爱的有机体 。 但是那位教师却违反了我们所熟的关于学习过程的几乎所有原理和做法 , 虽然这能完全归咎于她本人 。”这对他的感触很深 , 于是 , 斯金纳根据其强化理论 , 开始对学校各科教学可有的各种强化列联进行分析 , 想找出一种最有利学生学习的强化列联 。由此 , 他提出了程序教学 , 在这种教学方式中将知识学习细分为一系列过程 , 每下一个过程的复杂程度都比上一个过程深 , 每次学习的知识量都是比较合适的 。依照这种安排 , 学生每次学习的量不大 , 学习由易到难 , 学习内环环相扣 , 这样循序渐进使得学生学习起来不会现过多的困惑 , 对于和学习材 料对应的各种问 (按照复杂程度的顺序编排), 学生作出正确反应比率也会比较高 , 这样下去就可以逐步强化复杂反应 。他还为编制程序教学制定了三条基本原则 : 第一 , 学生必须对问题随时作出积极的外显反应 ; 第二 , 在学生作出外显反应时 , 应立刻得到及时强化 ;第三 , 学习进程的步子要小 。其中 , 中心的则是强化 。并且他还专门设计了一种能帮助教 安排这种强化列联的教学机器 , 通过实践 , 斯金认为教学机器的作用不亚于家教 。

1954 年春 , 斯金纳在匹兹堡大学一次关于《心 理学的当前动向》的会议上 , 做了用教学机器教拼 写和算术的演示 , 同年又发表了《学习的科学和教学的艺术》这篇重要论文 。于是在不到一年的时间 内 , 机器教学运动很快发展起来 , 形成当时美国教 育界的一股新力量 , 并波及全世界 。现在的计算机辅助教学(computer —assisted —instruction , 简称 CAI)就是一种发展了的机器教学 。


 3 .对斯金纳强化理论的评价

      (1)强化现象是人类行为中的一种普遍现象 , 斯金纳在对此进行系统研究的基础上 , 提出了强 理论 , 这是对人类学习理论研究的创造性贡献 。

(2)斯金纳的强化理论中所揭示出的有关强 的规律 , 对我们的教育教学工作具有重要的启示  。

首先 , 他认为儿童作出良好行为后 , 要予以及时强化 , 否则 , 这种行为容易消退 。这就要求我们在教育教学中要贯彻及时反馈的原则 , 要敏锐地观察到儿童的进步 , 那怕是一小点 , 都应及时给予强化 , 使儿童的进步行为进一步发展起来 , 最终达到发扬积极因素 , 克服消极因素的目的 。

其次 , 他认为惩罚虽然是控制行为或试图控行为的方法之一 , 但他认为惩罚只可能偶尔压抑 某些行为 , 并没减弱反应的总倾向 。 因此 , 他坚反对教育儿童时使用惩罚 , 甚至在他 1948 年的 说《沃尔登第二》中 , 称惩罚是一种罪恶 。他鼓励们大量运用积极强化来教育儿童 , 用积极强化物使儿童形成和维持良好行为 。这对我们教育教 实践的启示是 :要多鼓励儿童 , 不要滥用惩罚 , 更用说体罚儿童了 。

总之 , 由于其理论的有效性和可行性 , 已被广泛地运用到当今教育教学实践的方方面面 。 只要合理地综合运用各种类型的强化 , 都将有利于教育教学质量的提高 。

(3)斯金纳的程序教学当时虽没有取得最终  。但是 , 他用于教学机器中的程序设计 , 却已日益流行的计算机辅助教学(CAI)和网络技术中广泛地应用了 。

(4)现代认知心理学 , 20世 纪70 年代兴起环境心理学 , 人工智能研究 , 临床收效较大的新为疗法等 , 都受到了他的强化理论和实践的影响  

(5)斯金纳的强化理论还丰富了现代管理  , 行为科学等的内容 , 并被广泛地运用于社会的各项管理中且取得了巨大的成就 。当然 , 斯金纳的强化理论也存着许多不足之处 , 首先 , 强化是不是学习的必要条件 , 学习是不是一定要有外显行为(反应), 强化是不是要直接作于学习者等 , 斯金纳没能作出科学的解释 , 对这 问题的深入研究 , 使后来的心理学家班杜拉创立自己独特的强化理 论 , 即社会 学习强化理论 。  , 斯金纳的强化理论带有明显的机械论色彩 , 成了环境和形形色色的强化作用的消极的承受者 并且 , 这种支配人的环境只是人即刻所处的情境 , 其中并不包括像马克思 、恩格斯曾指出的包括诸 生产资料的生产方式那样宏观而持久的社会因素  第三 , 由于他不愿意强调人类与动物行为的本质  , 于是他把从动物实验中得到的有关强化的结直接应用于人 , 而没有考虑到人的特殊性 , 如社  , 主观能动性等 , 这显然是不科学的 。第四 , 斯 纳忽视了强化必须和儿童心理发展的内部矛盾 一起来 , 这也是他反对任何对意识 、情感和动机假设的必然 。虽然他并不否认人有意识 、感情和 理状态等 , 但是 , 他认为研究这些中间变量不仅 能促进反倒会妨碍我们有效地研究和控制行为  , 会妨碍我们径直地研究可以直接观察和控制 有关变量 。所以斯金纳的研究对象被称为是彻 的“ 黑箱有机体” 。

参考文献 :

[ 1]   陈泽民 .B·F·斯金纳描述行为主义及学习理论简介[  J].心理探新 , 1980, (1):25-30.

[ 2]   高觉敷 .西 方近代心理学史[ M] .北京 :人民教 育出  ,  1982.

[ 3]   李汉松 .西 方心理学史[ M] .北京 :北京 师范大 学出  , 1988.

[ 4]   朱智贤 , 林崇 德 .儿童 心理 学史[ M] .北 京 :北京 师 大学出版社 , 1988.

[ 5]  [ 美]  Robert .D·Nye.三种心 理学 — 弗洛 伊德 、斯金 纳 罗杰斯的心理学理论 [ M] .石林 , 袁坤 , 译 .北京 :中 轻工业出版社 , 2000.

[ 6]   陈奇 , 刘儒德 .当代教育 心理学 [ M] .北京 :北 京师 大学出版社 , 2001.

[ 7]  Skinner B·F.The behavior of organismas[ M] .New  York :Ap- pleton-Century -Crofts,  1938.

[ 8]   Skinner .B·F.Teaching  machines[  J] .Scientific  American .

1961 ,  November.90-102.

[ 9]  Skinner B·F.The technology  of  teaching[  M] .New  York : Appleton- Century -Crofts, 1968.

[ 10]   Skinner  , B·F.Contingencies  of  reinforcement :A  theoreticd analysis.[  M]  .New   York:Appleton  -Century - Crofts , 1969.