獎賞能夠影響人的知覺和行為,人們可以從意識和知覺上區分哪些事物能帶來獎賞、哪些不能。這種意識和知覺上的差異為追求獎賞提供了重要線索。獎勵規則由人制定,但大腦的獎賞系統未必需要意識來調控獎賞學習。獎賞的神經調節信號彌散地分布在整個大腦,獎賞系統與大腦中多個腦區有連接。這種連接的復雜性使無意識的獎賞學習成為潛在的可能,但由于以往研究范式里用來關聯有無獎賞(或者不同程度的獎賞)的視覺刺激在外觀上大多可以區分,因此難以證明這一點。
為此,中國科學院心理研究所研究員鮑敏研究組、蔣毅研究組合作開展研究。以往研究發現,人類對于單眼呈現的刺激不能較好地判斷刺激是通過哪只眼呈現的。將一個單眼刺激從哪只眼呈現,簡稱為刺激的“眼源信息”。利用該原理,研究人員嘗試把獎賞和眼源信息關聯起來。在實驗中,通過立體鏡給被試的一只眼呈現彩色動態的連續閃爍刺激,另一只眼呈現一個目標刺激(圖1A)。在此種視覺呈現方式下,被試一開始只能意識到連續閃爍刺激,目標刺激則被掩蔽于意識之外。但隨著呈現時間的推移,目標刺激有可能破除連續閃爍刺激的掩蔽,被試便能夠看見目標刺激。被試被告知實驗任務是只要看見目標刺激就按鍵。被試不知道的是,目標刺激在有的試次中呈現在左眼,有的試次中呈現在右眼,并且只有當被試報告發現在給定的一只眼中呈現的目標時,他(她)才會得到金錢獎賞,研究人員把這只眼稱作“獎賞眼”。由此可知,被試不能意識到有獎賞的試次和無獎賞的試次僅僅區別于目標刺激呈現在哪只眼,其實際感受可能是只有一部分按鍵報告能伴隨獎勵。該研究后對被試進行的問卷報告確認了這一點(圖2)。
由于每個試次有幾秒的最長呈現時間限制,如在限定時間內被試未看見目標刺激,則無法做出反應;倘若這是一個有獎賞試次,則意味著被試錯過了一次贏得獎賞的機會。雖然被試不知道目標刺激的眼源信息,但隨著獎賞學習的進行,被試可以習得這個關聯(圖1C)。相對于訓練前來說,訓練過程中被試在有獎賞試次中報告發現目標刺激的概率顯著上升。這意味著被試的獎賞系統在訓練過程中似乎已經“知道”:只有獎賞眼中呈現的刺激與獎賞有關,需要被更早發現和報告。而被試自己卻并不知道這一點,這說明發生了無意識的獎賞學習。由于單眼神經元在初級視皮層中存在,因此這種無意識獎賞學習效應可能發生在視覺加工的較早階段。
進一步研究發現,當把目標刺激挪到偏離視野中心的位置,并使用一個較困難的注視點任務來控制被試的注意遠離目標刺激所在的位置,無意識的獎賞學習效應則消失,這說明該效應的形成需要注意的參與。此外,研究還證明該效應依賴連續閃爍刺激所帶來的眼間抑制,且當任務中含有意識上的獎賞刺激關聯時,無意識的獎賞學習效應就無法被觀測到,說明其被意識上的獎賞學習效應遮蔽。
綜上,該研究揭示出人類獎賞系統存在兩種不同類型的獎賞學習。一種是無意識獎賞學習,其不依賴于意識上可以分辨的獎賞刺激,但仍需消耗注意資源;另一種是生活中常見的意識上獎賞學習,它可以教導選擇性注意去選擇獎賞關聯的刺激;而意識上的獎賞學習可以遮蔽無意識的獎賞學習效應。相關研究成果在線發表在British Journal of Psychology上。
圖1.實驗1a的刺激和結果。(A)試次流程;(B)四種可能的目標刺激,分別對應右、左、下、上的按鍵報告;(C)訓練階段1、訓練階段2,目標刺激突破連續閃爍刺激的掩蔽的概率相比于訓練前有所增長,且在獎賞眼里增長更為明顯。這一基于單眼的獎賞學習效應在后測階段消失。
圖2.實驗后的問卷調查發現96名被試中,僅2人報告認為獎賞與刺激呈現在獎賞眼有關。大部分被試或報告不認為獎賞有規律,或錯誤地認為獎賞與其它刺激屬性有關聯。
|
官方微信