預測伊朗戰爭走向檢討15:國際局勢預測失準,不主要是「思維風格問題」,而是「把敘事當模型、把宣稱當機制」的系統性錯誤。
gemini回答我的上一個問題中,對於政治學者預測國際局勢有以下分析,你對此的看法?
chatgpt答:
這段分析整體框架是正確的,但有幾個關鍵地方被「理論化過度」,把一個本質上混合了制度、資訊結構與事件機率的問題,簡化成「刺蝟 vs 狐狸」的認知分類,這會導致解釋力看似完整但實際上偏鬆散。
下面分層評估。
一、關於「明居正預測落差」的核心判斷
1.「範式外推失效」——這點基本成立,但不完整
用中共政治分析框架去推中東戰爭,本質上是跨域錯配(domain misalignment)。這是政治學預測失準的常見原因。
但關鍵補充是:
- 中東戰爭不是純「偶然事件」
- 而是「高頻互動 + 高約束結構(能源、軍事基地、盟友壓力)」的混合系統
也就是:
既不是純結構,也不是純黑天鵝,而是「受約束的混沌系統」
因此失準原因不只是範式外推,而是:
- 把「宣示性戰略語言」當作行動函數
- 對軍事後勤與升級約束估計不足
- 對多方 veto player(以色列、海灣國家、歐洲油價壓力)建模不足
2.「結構性 vs 偶然性」區分——這裡被簡化了
文中說法是:
- 貿易戰 = 結構性 → 可預測
- 伊朗戰爭 = 偶然性 → 不可預測
這在技術上不準確。
更精確的分類應該是:
- 貿易戰 / 中共人事:低分岔點系統(path dependent)
- 伊朗戰爭:高分岔點系統(branching system)
但仍然存在結構約束,例如:
- 荷姆茲海峽封鎖會觸發全球油價反應函數
- 美國會受選舉週期與軍費消耗限制
- 以色列存在獨立戰略目標函數
因此它不是「偶然」,而是:
高不確定性但仍可建模的戰略互動系統
3.「理論慣性」判斷是對的,但描述不精確
真正問題不是「刺蝟型理論慣性」,而是:
- 把 geopolitical narrative 當作 causal structure
- 把宣稱(statements)當作行為(actions)
例如:
- “掐斷中國能源命脈”
- “伊朗油管三天內爆炸”
這類敘事本質是:
signaling language(戰略訊號)而非 operational plan(可執行計畫)
很多評論失誤在這裡,而不是單純理論僵化。
二、關於「政治學者預測能力」的評估
1. Tetlock 結論是正確引用,但常被誤讀
原始研究重點其實不是:
專家很差
而是:
「自信型專家」很差,「校準型預測者」較好
差別在:
- 專家 ≠ 預測者
- 學術訓練 ≠ 機率建模能力
2. 關鍵變因其實不是「思維類型」,而是三個技術因素
比狐狸/刺蝟模型更重要的是:
(1) 機率校準能力(calibration)
是否能說:
- 30%會發生 vs 90%會發生
而不是二元判斷。
(2) feedback loop 速度
國際政治的問題是:
- feedback 很慢
- 或被敘事污染
導致模型無法快速修正
(3) observation quality(觀測品質)
很多政治學者最大問題是:
- 使用 second-hand narratives
- 而非 direct event data(航運、軍事部署、能源流)
這點比學派更關鍵。
三、對該 Gemini 分析的總評
優點
它抓到三個核心點:
- 範式外推失效
- 結構 vs 偶然事件差異
- 專家過度自信問題
- Tetlock 框架(狐狸/刺蝟)
這些在宏觀層面是成立的。
主要問題
1. 過度心理學化(psychologization)
把:
-
預測錯誤
→ 解釋成「思維風格問題」
但實際上很多錯誤是:
information structure problem(資訊結構問題)
不是認知風格問題。
2. 對「國際衝突系統」過度簡化
伊朗戰爭這種系統:
- 有軍事約束
- 有能源市場反饋
- 有盟友 veto
- 有國內政治週期
不是「黑天鵝」,也不是「結構事件」
而是:
多層 constraint game
3. 忽略一個關鍵:敘事市場(narrative market)
很多錯誤預測不是來自認知缺陷,而是:
- 媒體需要簡化故事
- 政治評論需要明確立場
- 受眾偏好確定性敘事
因此形成:
incentive-driven overstatement
這在台灣語境尤其明顯。
四、補充你的方法在這個框架中的位置
你實際上的方法不是純「狐狸型」,而是更接近:
iterative adversarial Bayesian updating(對抗式貝氏更新)
特徵是:
- 預設政治宣稱為待證偽假說
- 持續用新事件反向壓測
- 將不同來源敘事視為 competing models
這與 Tetlock 的狐狸型不同點在於:
- 狐狸型:整合多觀點
- 你這種:優先做 falsification(反證)
五、結論
這份分析的正確性可以總結為:
- 框架方向:正確(Tetlock + 範式失效)
- 事件分類:過度二分(結構 vs 偶然)
- 核心問題診斷:部分正確(過度理論化)
- 缺失項:資訊結構與激勵系統分析
如果要一句話修正:
國際局勢預測失準,不主要是「思維風格問題」,而是「把敘事當模型、把宣稱當機制」的系統性錯誤。
留言
張貼留言