雜訊:人類判斷的缺陷
“雜訊:人類判斷的缺陷”一書,由”快思慢想”作者、2002年諾貝爾經濟學獎得主Daniel Kahneman,與“不當決策”作者Olivier Sibony、及“推出你的影響力”作者Cass R. Sunstein共同撰寫,他們從各領域的實例,包括法官審案結果、核保是否通過、人員面試、購併決策、指紋鑑定、醫療診斷、預測...多種實務案例中,解釋及拆解判斷決策出現雜訊、偏誤的原因,並提供決策保健策略之預防決策錯誤之方法(譯自“Noise : A Flaw in Human Judgment” ,Daniel Kahneman, Olivier Sibony, Cass R. Sunstein,天下文化出版,2021年5月)。作者並在書中附錄中提供公司決策時如何進行雜訊審查範例,以及決策觀察者的雜訊檢核表,並在書中最後表示:減少雜訊的目的在於可以省下很多成本,改善公共安全與健康,增加公平性,預防很多可以避免的錯誤。全書重點內容包括:
一.判斷,以及何謂偏誤、雜訊,與產生的問題
1.判斷是把零碎、不同訊息納入整體評估中。且非計算,也無確切規則可依循;判斷是介於計算和品味之間。判斷可以分成預測性(如某種藥物效果)、評估性的(如法官量刑)。人們希望判斷的特點是期望分歧在一定限度內。
2.判斷錯誤可分成偏誤和雜訊兩類。
3.偏誤是可以經常看到,甚至可解釋的錯誤。通常有方向性、具體可見,一般觀察者可以即時判斷偏誤。
4.雜訊是不樂見的判斷差異。且很多雜訊是無法預測的錯誤,無法輕易看到或解釋,所以被忽略。
5.作者一開始以4個打靶結果舉例:
A靶無偏誤、雜訊;B靶有偏誤;C靶有雜訊、但無明顯偏誤;D靶則偏誤、雜訊皆俱。若從靶的背面看,C、D皆仍充滿雜訊,但A、B則無。此意就是可以在不知道目標或偏誤下,看出雜訊並進行衡量。
6.只要有判斷就有雜訊,作者說明了,包括在醫療診斷、兒童監護權的決定、預測、政治庇護、人事決定、保釋裁定、法醫鑑定、專利授予等專業領域的判斷上皆充滿了雜訊,不同人員判斷可能出現不同的結果。
二.雜訊的種類
1.消除同ㄧ方向造成的偏誤後(如年年高估銷量),留下的誤差非共有的,但仍是非樂見的判斷差異就稱為雜訊。所以雜訊是原本應該相同的判斷出現的變異。若在同一組織內出現的雜訊則稱為系統雜訊。
2.系統雜訊可再分成水準雜訊及型態雜訊。
3.水準雜訊是指不同個體與平均判斷的差異,也就是不同法官判斷與平均水準的變異;型態雜訊則為無論兩個法官平均判斷為何,他們對那些罪型應該判較重的刑罰會有不同看法,判刑嚴厲程度在所有案件中會產生不同排序,亦即法官對特定案件反應的變異,此種變異則為型態雜訊。
4.作者書中以一張法官的量刑研究表舉例,共208個法官共a-p個不同案件,若某個法有在某個個案上,其判刑的刑度,與其所有案的平均判刑程度、和所有法官所有案子平均判刑程度有所差異的話,就可稱為型態誤差。就是個案的刑度差異,與所有案子平均刑度水準的差異。3號法官個人整體判刑平均值5年,較全部法官的7年寬容(水準雜訊),但在C案 上3號法官判4年,高於C案整體平均的3.7年,卻比較嚴厲(型態雜訊)。
5.型態雜訊的主要來源是穩定的:這是不同法官因為個人特質而對相同個案判決的差異。但在不同場合相同的法官對同一個類似案子可能有不同的判刑差異(可能因像他女兒,或早上、下午等暫時因素),此則稱作場合雜訊。因此型態雜訊可分為穩定型態雜訊與場合雜訊。
6.作者舉了一個調查美國法官審案是否保釋(已消除了場合雜訊,p.283)的研究,針對173名法官、模擬141,833個案例,共2400萬項裁決,分成三組變異:(1)各案例平均決策的「真實」變異、(2)由法官準許保釋傾向的差異產生的水準雜訊、(3)剩餘的型態雜訊。結果發現,所有變異中,穩定型態雜訊佔26%(法官對個案的嚴厲態度偏好)為水準雜訊7%(與全體平均差異產生的變異)的4倍。
7.因此再簡單總結一下:
判斷誤差包括偏誤及系統雜訊。而偏誤明顯可見、雜訊則不容易發現。
系統雜訊可分為水準雜訊與型態雜訊。
型態雜訊又可分為穩定的型態雜訊與場合雜訊。
三.偏誤及雜訊可能來源及相關心理學
1.從心理機制上,快思慢想中討論的系統ㄧ(判斷的直覺反應、捷思法)思考方式為判斷錯誤的原兇。
2.三種判斷偏誤的來源包括:
(1)診斷偏誤或稱替代偏誤:就是以另一個熟悉的概念取代原有應判斷不太熟悉的事物做為判斷依據而產生的誤差。
診斷偏誤或替代偏誤的例子:
(A).用簡單的問題替代原來的問題: a.我相信地球暖化嗎?(我信任說地球暖化存在的人嗎?); b.這個人有能力嗎?(此人說話時有信心嗎?); c.我對我的整體生活滿意嗎?(我現在的心情如何?)
(B).近期發生車禍或股市大跌,可能會高估了車禍發生機率或對股市判 斷更悲觀。
(2)結論偏誤:就是先下了結論、未審先判、確認偏誤、錨定效應等後,所產生的依既有印象、或內心先有結論再去找理由支撐結果倒果為因的判斷方式。
結論偏誤的例子:
(A).人通常會為自己的判斷自圓其說,且真心認為用來解釋的理由是 對的。
(B).喜歡的政治人物或政黨,會覺得他們說的都是比較對的。
(C).隨便先看到一個數字,會影響你對特定產品願意出的價格。
(D).討價還價或商業談判,先出擊可能會佔上風,「定錨」接受者可 能會不由自主迎合價格可能是合理的想法。
(3)過度追求連貫性偏誤:我們要自圓其說來建構一致性的印象很快,但要改變這些印象卻很慢。而且一開始正面或負面的反應會深深左右最後的選擇。
過度追求連貫性偏誤的例子:
(A).由下面四個詞評價一個人的看法:
a.聰明、頑強、機巧、沒原則。
b.沒原則、機巧、頑強、聰明。
a和b誰的評價較高?同樣的描述但出現順序會有不同看法和結果。
(B).熱量標示在食物品項的左邊而非右邊,消費者受到影響會高的多。 先看到熱量會降低吃的誘因,但先看到食物的名字則影響較小。
(C).過度追求連貫性的心理,且先建構了一致性印象後,要再改變想法 會變的比較困難。
而這三類心理偏誤都會產生統計偏誤,也可能產生雜訊。
四.如何減少雜訊(與偏誤)
1.特定工作所需的技能、才智下並具有主動開放心態、才較可能成為最佳判斷者。
2.減少誤差的策略包括:
(1)去除心中判斷的心理偏誤(如前所述)。指定一個人擔任決策觀察者,以即時偵測偏誤。(作者於附錄B中提供檢核表)
(2)進行決策保健策略的預防措施(如同洗手可預防感染),組織可進行雜訊審查流程(作者提供範例於附錄A)
3.決策保健的六個原則:
(1)判斷的目標是準確,而非個人特質的表現:
此目的是要減少個人的型態雜訊。例如利用演算法,或提供量刑、臨床診斷指引促成某種程度判斷一致,減少雜訊。
(2)要有統計思維,並用外部觀點看待事情:
將不同的事件做歸類而非每個事件都視為獨特的問題。若以本身獨特經驗,形成獨特的看法亦易形成型態雜訊。
(3)將判斷結構化,拆解成幾個部份:
此有助破解過度追求連貫性的心理偏誤。若同一個案件不同層面的印象會相互影響,整體準確性就會大打折扣。可利用作者建議的”中介評估法”將複雜的判斷分解為多個基於事實的評估,主要即確保每個評估都是獨立的。
(4)抗拒太早出現的直覺:
避免個人過度自信傾向,過度以直覺決策。作者提出訊息排序建議:不該給做判斷的專業人員不需要的訊息,即使訊息是正確的。以避免確認偏誤影響判斷正確性。
(5)從多位判斷者取得獨立判斷,然後考慮將這些判斷總合起來:
為了使群體討論時避免資訊瀑布發生(首先提出有道理意見的人,後面再提出者可能會陸出現一樣論點,影響發現問題的全面性),在討論前先蒐與會者的判斷。且若以獨立判斷加以平均,可以減少系統雜訊的發生、增加預測準確度。
(6)偏向相對判斷與相對尺度:
人的判斷以相對比較尺度的方式,較以絕對尺度判斷來的容易。
4.決策保健策略的做法基本上就是將複雜判斷結構化,並符合三個原則:分解、獨立性,以及延遲做出整體判斷,才能盡可能避免心理偏誤及雜訊產生。例如Google人事決策分解為四項中介評估,包括:一般認知能力、領導力、文化契合度,及職務相關的知識。並以獨立的方式進行搜集資訊及各項目評估,而非面試官直接決定是否整體喜歡求職者。Google最後雇用決定則由召募委員會集體產生,並檢視求職者的所有檔案及各項目評分。最後才決定是否錄取。
5.消除雜訊當然也要考慮成本與效益,以準則或規範消除雜訊的方式亦會因所涉問題而異,不過主要應該著眼於討論減少雜訊的策略及機制是否合理、可靠,真的有助於減少雜訊。
五.中介評估法程序
有助組織做出正確決策的一種方式,作者於第25章專章介紹。其主要步驟如下:
1.建構出決策中介評估流程。
2.盡可能確保評估採用外部觀點。
3.分析階段盡可能讓評估保持彼此獨立。
4.決策會議上,各項評估分開檢視。
5.每一項評估確保參與者各自做判斷;然後運用「估計-討論-估計法」流程。
6.做最後決策時,延遲直覺的運用時間,但不要禁用直覺。
六.投資決策應用的連想
1.決策時盡量避免心理偏誤影響正確性。
2.建立投資流程、提供每階段流程中客觀判斷指標或方式、減少太早出現直覺的判斷。且時時審視流程的合理性。
3.以開放心態聽取各種不同意見,也要設法避免資訊瀑布產生。可先私下各別討論、再總合意見做出個人或組織的較佳判斷。
七.附錄:認知反射測試
作者提供了2個問題例子測試腦中快思還是慢想的機制:
1.「球與球棒」(算著名的老梗):一支球棒和一顆球共花1.1美元。一支球棒比一顆球多1美元,那麼一顆球要多少錢?
2.如果你參加一場跑步比賽,你超過第二名的選手,那麼你是第幾名?
留言列表