想得快、狠、但不准

「快思慢想」(Thinking, Fast and Slow)這本書揭露了很多關於人們使用直覺的謬誤,它的作者心理學家 Daniel Kahneman ,是2002 年的諾貝爾經濟學獎的得主。你可能會覺得奇怪,為什麼一個心理學家會得到的是經濟學獎?在「沒人想當傻蛋」那篇文章中我曾提到過,行為經濟學(neuroeconomics, or behavioural economics)是一門結合眾多領域的新興科學,藉由整合心理學、大腦神經科學、機率學、統計學,甚至哲學的知識,來瞭解人們做判斷的行為,尤其是牽涉到資源的重新分配(獲得、損失)這一類的決定或預測,因此它最大的應用是在經濟學,也有人稱之為決策學(decision science)。

代表性直覺(representativeness heuristic)

琳達今年31歲,單身,坦率直言。她大學時主修的是哲學,在大學時代她非常關心社會正義及種族歧視相關的議題,也曾參加過反核示威遊行。

請問以下哪一個關於琳達的猜測最有可能?

(1)她是一個銀行行員。

(2)她是一個銀行行員,同時也是激進的女性主義者。

你選哪一個?

大多數人都會選擇(2),因為根據之前的描述,大家覺得最有可能的是「她是個激進的女性主義者」。然而含有這個描述的選項只出現在(2),所以直覺選(2)會使我們的猜測更加明確。

然而仔細想想,這是個很基本的機率問題。答案(1)只有一個描述(事件A),而答案(2)是兩個描述(事件A 和事件B)。不管事件A的機率是大是小,一旦要再交集另一個事件,其交集的機率一定會小於單一事件的機率。

P(A & B) = P(A) * P(B)

機率是介於 0 到1 之間的數字,機率A乘上機率B,一定是越乘越小。所以,描述(1)正確的機率一定大於描述(2)正確的機率。

你很意外自己也會犯這種簡單的錯誤嗎?並不是因為你不夠聰明,而是因為你的大腦很偷懶。

Kahneman 和他的同事 Tversky 早在1970年代就用心理學實驗證明,我們的大腦經常為了求快,仰賴啟發式的直覺(heuristics)做快速判斷,而誤導我們做出錯的結論。我們的大腦之所以這樣做,是因為它可以降低處理的資訊量以及分析的步驟,以節省腦細胞運算的資源。

在他們研究得出的幾種常見謬誤當中,其中一個最有名的,稱為「代表性直覺」(representativeness heuristic)。它有點類似偏見,抓住代表性的資訊,不多做分析或考量機率,逕自把人貼上標籤,以上關於琳達的問題就是個很好的例子。

根據 Kahneman 和 Tversky 的研究發現,人們在做預測時,會偏好使用小範圍的資訊,更勝於具有一般性效力的資訊。我們下意識地認為小範圍的資訊更加明確(specific),所以應該會提高猜測的準確度,但其實這是一種謬誤。因為小範圍的資訊通常適用於特殊狀況,發生的機率較低,而一般性(普遍性)的資訊適用於更大範圍的情況,發生的機率較高。

忽略基準比例之謬誤(base rate neglect fallacy)

前一篇討論新冠病毒測試的文章裡提到「忽略基準比例之謬誤」(base rate neglect fallacy),其中提到所謂的「靠之前數據所建立好的模型」,其實就是「具有一般性效力的資訊」,或稱先驗知識(prior knowledge)。

舉個例子:今天早上有雲,我想預測今天會下雨的機率是多少。

P(A),基準比例(先驗知識):根據過去這個時節的統計,會下雨(A)的機率

 

P(B),條件發生機率:根據過去這個時節的統計,早上有雲(B)的機率

P(B|A),條件關係比例:根據過去這個時節的統計,若下雨(A),當天早上有雲(B)的機率

P(A|B),預測機率:若早上有雲(B),今天會下雨(A)的機率

預測公式:

P(A|B) = P(B|A) * P(A) / P(B)

預測機率 =條件關係比例 x 基準比例 / 條件發生機率

Posterior = Likelihood * Prior / Evidence

我們可以看到,「條件關係比例」和我們所要預測的機率,其事件與條件的位置剛好是相反的。換句話說,為了要預測雲出現之後下雨的機率,我們必須先知道,在確定下雨的日子裡,早上有觀察到雲的比例是多少。除此之外,我們也必須先知道一般情況(沒有特殊條件時)下雨的機率;然後我們還必需把今天有雲的機率反向回去(因為我們已經看到今天有雲了)。而這些都是從過去的數據統計中得到的資訊。

基準比例,P(A),或說模型 (model),會因為地區或採樣的不同而變化,例如在台灣跟在加州,這個數值就會非常不同。在沒有額外條件進來時,單單藉由普遍性效力或原則P(A) 來作猜測,會更容易接近正確答案。但是當額外的條件 (B) 出現,需要因應做新的推論時,人們往往把焦點都放在小範圍的、只跟B有關的資訊,而把P(A) 丟在一邊,忘了這個基準比例(大環境)的因素將會決定性地影響事件真正發生的機率。

前一篇新冠病毒測試的例子套進來:

P(A),基準比例(先驗知識):在此地區得病(A)的機率,也就是人口的感染率

P(B),條件發生機率:測得陽性(B)的機率

P(B|A),條件關係比例:若有病(A),測得陽性(B)的機率,也就是測試的敏銳性

P(A|B),預測機率:若測得陽性(B),真有病(A)的機率

例一:紐約,敏銳性100%

P(A) = 400/100 = 0.4

P(B) = 430/1000 = 0.43

P(B|A) = 100% = 1

我們想要知道的,就是預測機率,P(A|B)  = 1 x 0.4/0.43 = 0.93

例三:台北,敏銳性80%

P(A) = 20/100 = 0.02

P(B) = 65/1000 = 0.065

P(B|A) = 80% = 0.8

我們想要知道的,就是預測機率,P(A|B)  = 0.8 x 0.02/0.065 = 0.246

利用機率公式計算出來的結果,跟前一篇直接用人數相除所得到的結果是一樣的。

「忽略基準比例謬誤」應用在心理學的重點是:隨著大環境的不同,得到的結果也不同。這提醒了我們,在判斷事物時,別忘了你所看到的只不過是受到大環境左右而造成的結果,千萬不要忽略環境因素對單一事件所造成的影響。你應該退後一步,站在遠一點的地方,眼光才能看得到全貌;你的理解要能掌握來龍去脈,而不是僅僅針對這一個事件斷章取義。

統計直覺(statistical heuristics)

有兩家婦產科 A 和 B,醫院 A 的新生兒誕生率是每天 15 個,醫院 B 的新生兒誕生率是每天 45 個。我們想知道新生兒的男嬰比例超過 60% 的天數,在哪一家醫院的發生率會比較常見?醫院 A,B,還是兩家一樣?

大部份(至少一半)的人的答案是「一樣多」。因為大家做猜測時使用的比例是真實人口(population)為基準(base),所以不管是醫院 A 還是 B,若參考的基準都是同一個,那麼得到的比例的確應該一樣。

但其實真正的答案應該是 A 。這個問題的本質是把採樣(sampling)的結果與真實人口現象作比較。以統計學的角度來看,當採樣的數目越大時,得到的數字會越接近真實人口的狀況。換句話說,誕生率較高的那家醫院 B,因為樣本數目較大,男女嬰的比例會更接近真實人口的男女嬰比例,也就是 50%。而樣本數目較小的醫院 A,比較有可能偏離真實人口的分布情況,不管是男嬰 60%還是女嬰 60%,反正就是會偏離 50% 較多,有較大的差距。

同樣因為採樣數目太少而導致得到錯誤結論,還有其他的例子。例如,在美國賓州的學校表現調查中,表現優異的學校排名中,小型學校所佔的比例(12%)超過小型學校數目在所有學校數目中的比例(5%)。這是否意味小型學校的成績表現更好?然而,如果你去看表現最差的學校排名,小型學校所佔的比例(11%)也是超過的。所以,這只是證明小型學校的表現變化差異很大,分布不平均,而這正是因為小型學校的樣本數目小,變化性大,所造成統計偏差較大(不準確)的現象。

許多人在日常生活中習慣用歸納法(induction),就是根據少量的觀察來進行推論。這個方法用的是「小數法則」,與統計學的「大數法則」背道而馳。它的優點是簡單且快速達成結論,但卻很容易造成概括性或普遍化(generalization)的問題,也就是中文所謂的「一竿子打翻一船人」。很難精準,且不能看到事情的全貌,是它的缺點。因此這是許多思想家或嚴謹的邏輯決策者在做思考或推論時非常關切、謹防犯錯的地方。