什麼是「操作制約」呢?其實操作制約核心概念,指「作一個行為,產生一個結果,結果決定後是否會再重複這個行。
」如果這個説法感覺有點抽象,讓我們來舉個例子。
如果一個六歲孩子自己房間整理得乾,不但得到了媽媽稱讚,還得到了獎賞-一個他喜歡玩具,那麼後要他去整理房間,他會。
反過來説,如果今天有一隻猴子,每他想要拿起房間裡香蕉吃會電,那麼試過幾次後,牠可能會碰香蕉了。
一個行為產生是因為有一個「刺激」,帶出了後面反應。
好像一個人會想整理房間時候,可能是因為家人看不下去念,有可能是因為自己找不到想找東西迫不得已整理。
操作制約和古典制約之處,於他行為是主體「主動」作出決定結果,而不是一種不能控制行為(帕夫洛夫狗流口水)。
他認為人類學習和行為是像這樣操作制約影響結果,人可以透過「增強」作用(我們所稱獎勵)來改變行為反應,以下「增強」做進一步説。


要有什麼樣行動,個人心意決定,而不是一種自發反應。
因為操作制約學習得到結果會強化刺激和行為之間,所以稱為「刺激反應心理學」(Stimulus-Response Psychology)。
接下來,我們介紹兩個操作制約相關實驗。
愛德華‧桑代克(Edward Thorndike, 1874-1949)是一位美國心理學家,他實驗是「迷籠中貓」。
實驗中,一隻飢餓貓關籠子裡,籠子外放著食物,只有壓籠中踏板門會開。
一開始貓會抓咬碰想逃出籠子,這些嘗試之中貓可能無意間觸發機關,開門。
多次實驗後,貓行為,出籠子速度。
桑代克迷籠中貓嘗試錯誤(Trial-and-error)學習方式,提出結學習理論三定律:史金納(B. F. Skinner, 1904-1990)是一位美國心理學家,是新行主義理論代表。
史金納發明史金納箱是一個籠子,籠子裡設置一個桿子,放入老鼠或鴿子。
當老鼠籠裡轉時,可能會觸動桿子而掉下食物。
多次嘗試後,久而久之老鼠學到只要觸動桿子會有食物,實驗而學會壓桿動作。
史金納箱是桑代克迷籠實驗而設計,其中點於桑代克迷籠確定貓咪下開關是想出去還是想吃魚,但史金納箱子不但附有電動裝置可以自動紀錄動物正確反應次數頻率,設計觸動桿子會掉食物會出籠子,所以可以判斷反應對應刺激源是什麼。
Figure 1: 圖來自《Introductory Psychology Image Bank》,此圖説明史金納箱設置情況史金納箱實驗結果,史金納歸結出新行為主義核心:動物學習行是一個刺激而生,而且這個行為可以是動物本身有意識決定。
史金納由此將動物學習推演到人類學習上。
他認為人類學習和行為是像這樣操作制約影響結果,人可以透過「增強」作用(我們所稱獎勵)來改變行為反應,以下「增強」做進一步説。
操作制約指是,個體刺激產生反應(某一行為)後,有應「增強物」產生,而這個「增強物」影響個體日後做出反應(行為)機率。
理解,我們可以「增強物」想成某個「結果」,而這個「結果」可以是獎勵或處罰。
如果反應會導致「獎勵」結果,反應會增強,該反應繼續發生機率會增加。
反之,那些獲得「處罰」反應會減弱。
有了前段説,我們可以地知道,增強物是增強個體行為元素,面某刺激時,可以增強個體產生反應機率。
因此,任何個體有影響力物品或事件可以作為增強物。
增強物而增強反應(行為)過程,稱為「強化」;增強物和反應之間關聯,「回應時間差(response contingency)」接下來,我們深入介紹增強類型以及其影響。
增強方式可以分為「」(positive)和「負向」(negative)兩種,而回應可以分為獎勵和懲罰兩種,因此一共四種變化。
接下來,我們會一一細分四種變化並各自舉例。
於正負向獎勵效果於負向懲罰,許多老師會運用獎勵方法刺激學生學習,而學生能因此快樂中積極地學習。
需要注意是,負向獎勵是「提高」反應繼續發生機率。
部分於,獎勵是透過反應後「呈現滿足個體刺激」,而負向獎勵是反應後「撤除個體厭惡刺激」,提高反應發生機率。
同理,負向懲罰是「降低」反應繼續發生機率。
原級增強物(primary reinforcer)是能滿足生物性需求基本事物,如水、食物、空氣,而次級增強物(secondary reinforcer)是指不能滿足生理需求,但因為和其他增強物有了而產生增強作用事物,如錢、讚美、成績、可以換獎品集點貼紙。
訓練寵物適用操作制約,例如:貓本來喜歡點耳藥,一開始會抗拒,但若每次點完耳藥後,牠愛吃罐頭,會抗拒了,牠學到了「點完耳藥可以吃到喜歡罐頭」,會地趴著主人點藥;反之,如果沒有獎勵,訓練,因為會喪失學習動力。


延伸閱讀…
「行為改變術」(Behavioral Modification)以此概念本而生輔導策略。
「行為改變術」指透過次級增強物(如點數)來改變行為技術。
因為「人」能夠透過獎勵懲罰來學習複雜動作,這種機制主要於「人」身上。
實行方式是,如果人做某些行為或做某些問題行為,可以得到「點數」(token),累積一定量後可兑換增強物(如筆記本、多二十分鐘玩電腦),直接例子,學生時交作業可以得到點數,而集滿點數可以換取禮物。
然而,於受懲罰者而言,他可能會做出令人意想不到反應,逃離或迴避懲罰發生,這種反應稱為「迴避學習」(avoidance learning)。
例如:如果學生沒交作業會因而受到懲罰,但他了逃避這個懲罰,可能會產生令人意想不到行為,如逃學。
接下來我們探討該如何給予獎勵或懲罰。
心理學家發現,延遲給予獎勵以及懲罰會使獎勵懲罰功效下降,且這個現象其他動物之間,因為動物並像人於自己未來以及學習具有規劃能力;此外,獎勵懲罰需具有一致性,以防。
進一步探討,心理學家發現,若是一個人能夠延遲自己獲得獎勵時間,或是可以領取獎勵而繼續學習,他具有社會發展能力,例如:大學生甲每次小考完後需要放鬆看個電影才能繼續讀書,而大學生乙則是期中考結束後讓自己放鬆去享受電影,這個例子中,乙有高度可能未來甲有社會發展能力,因為他能夠看電影(獎勵)延後時間實現。
獎勵會增加行為出現次數,而懲罰會減低行為出現次數。
前面提過,懲罰和增強物有著共通特點,即懲罰個體而言是個懲罰,這個結果會。
獎勵懲罰要,是行為發生後施行,拖延會失去效力。
獎勵懲罰要有一致性,每次行為發生後執行,而且不能時。
訓練寵物適用操作制約,例如:貓本來喜歡點耳藥,一開始會抗拒,但若每次點完耳藥後,牠愛吃罐頭,會抗拒了,牠學到了「點完耳藥可以吃到喜歡罐頭」,會地趴著主人點藥;反之,如果沒有獎勵,訓練,因為會喪失學習動力。
延伸閱讀…
所以許多人如果想要教會小狗坐下,小狗説「坐下」,並食物移到牠額頭前方,誇獎牠「」並牠食物,小狗自然而然學會坐下。
例用一個「」訊號,「RR」讓小狗能迅速地「確定」自己做,進而達到學習。
雖然懲罰能夠使人有所警惕,但是實驗發現,其導致問題,因此附上懲罰時留心三點事項,供讀者參考:前面部分,我們説瞭如何藉由條件操作使個體學習一些而單一行為。
接下來,我們説一個複雜行是如何透過操作行為學習而來。
但在此之前,介紹一些關於行為特性,讀者瞭解複雜行成因。
人會於刺激進行類化(generalization)區別(discrimination),類化是於類行為進行,例如:一個母親教導她小孩要衞生紙來擤鼻涕,但是小孩可能會這個用來擤鼻涕東西「類化」為任何表面,例如衣袖,進而使用衣袖擤鼻涕。
而相反是區別,假如母親教導小孩可以衣袖擤鼻涕,他進行處罰,這時,小孩會衞生紙和衣袖進行「區別」,小孩因而認知擤鼻涕應該使用衞生紙。
消弱(extinction)意指若一個反應導致結果消失,反應結果間會下降。
例如一開始,老鼠拉拉桿會出現食物,直到某天後拉拉桿出現食物,老鼠拉拉桿「反應」與得到食物「結果」間會下降消失。
日常生活中,我們可以發現許多孩童假哭行為。
這是因為公共場所兒童大哭,可以引起父母關心,進而達到自己所想要獎勵;相反地,若兒童哭鬧父母不理會,其哭鬧次數和程度會消失,這消弱。
如果小孩子跌倒哭了,父母很地去扶他,這樣下次他跌倒時候,他會用哭方式看著旁邊人,因為他經驗中學習到:跌倒時做這樣行為可以得到他想要東西,但身邊若沒有其他人,小孩子會自己爬起來。
恢復(spontaneous recovery)是指當反應結果間消失後,過了一段時間會複反應,期盼結果產生。
如前述史金納箱老鼠,實驗者牠食物後,過了一段時間,老鼠還是會試著去拉拉桿,想看看這中間是否恢復,而能夠讓他得到食物。
前兩個部分,我們説瞭如何藉由一些條件操作使個體學習一些而單一行為。
現在,我們説一個複雜行是如何透過操作行為學習而來。
一個複雜行學習我們稱「行為塑形」(shaping)行為改變技術,主要方式是藉由許多學習,循序積累成我們期望複雜行。
這一步步動作有其順序性,能夠使學習者接近學習目標。
以下水族館海豚訓練跳躍步驟,來説行塑形,:以上這種訓練海豚跳躍而藉由一個個接近學習目標動作訓練,稱為學習塑形。
這裡,我們探討如何增強學習到知識或技能,我們稱這一系列設計獎勵機制酬賞時制(reward schedule)。
增強時制分為兩類,性增強,另一為間歇式增強。