預測伊朗戰爭走向檢討15:國際局勢預測失準,不主要是「思維風格問題」,而是「把敘事當模型、把宣稱當機制」的系統性錯誤。

gemini回答我的上一個問題中,對於政治學者預測國際局勢有以下分析,你對此的看法?

chatgpt答:

這段分析整體框架是正確的,但有幾個關鍵地方被「理論化過度」,把一個本質上混合了制度、資訊結構與事件機率的問題,簡化成「刺蝟 vs 狐狸」的認知分類,這會導致解釋力看似完整但實際上偏鬆散。

下面分層評估。


一、關於「明居正預測落差」的核心判斷

1.「範式外推失效」——這點基本成立,但不完整

用中共政治分析框架去推中東戰爭,本質上是跨域錯配(domain misalignment)。這是政治學預測失準的常見原因。

但關鍵補充是:

  • 中東戰爭不是純「偶然事件」
  • 而是「高頻互動 + 高約束結構(能源、軍事基地、盟友壓力)」的混合系統

也就是:

既不是純結構,也不是純黑天鵝,而是「受約束的混沌系統」

因此失準原因不只是範式外推,而是:

  • 把「宣示性戰略語言」當作行動函數
  • 對軍事後勤與升級約束估計不足
  • 對多方 veto player(以色列、海灣國家、歐洲油價壓力)建模不足

2.「結構性 vs 偶然性」區分——這裡被簡化了

文中說法是:

  • 貿易戰 = 結構性 → 可預測
  • 伊朗戰爭 = 偶然性 → 不可預測

這在技術上不準確。

更精確的分類應該是:

  • 貿易戰 / 中共人事:低分岔點系統(path dependent)
  • 伊朗戰爭:高分岔點系統(branching system)

但仍然存在結構約束,例如:

  • 荷姆茲海峽封鎖會觸發全球油價反應函數
  • 美國會受選舉週期與軍費消耗限制
  • 以色列存在獨立戰略目標函數

因此它不是「偶然」,而是:

高不確定性但仍可建模的戰略互動系統


3.「理論慣性」判斷是對的,但描述不精確

真正問題不是「刺蝟型理論慣性」,而是:

  • 把 geopolitical narrative 當作 causal structure
  • 把宣稱(statements)當作行為(actions)

例如:

  • “掐斷中國能源命脈”
  • “伊朗油管三天內爆炸”

這類敘事本質是:

signaling language(戰略訊號)而非 operational plan(可執行計畫)

很多評論失誤在這裡,而不是單純理論僵化。


二、關於「政治學者預測能力」的評估

1. Tetlock 結論是正確引用,但常被誤讀

原始研究重點其實不是:

專家很差

而是:

「自信型專家」很差,「校準型預測者」較好

差別在:

  • 專家 ≠ 預測者
  • 學術訓練 ≠ 機率建模能力

2. 關鍵變因其實不是「思維類型」,而是三個技術因素

比狐狸/刺蝟模型更重要的是:

(1) 機率校準能力(calibration)

是否能說:

  • 30%會發生 vs 90%會發生

而不是二元判斷。


(2) feedback loop 速度

國際政治的問題是:

  • feedback 很慢
  • 或被敘事污染

導致模型無法快速修正


(3) observation quality(觀測品質)

很多政治學者最大問題是:

  • 使用 second-hand narratives
  • 而非 direct event data(航運、軍事部署、能源流)

這點比學派更關鍵。


三、對該 Gemini 分析的總評

優點

它抓到三個核心點:

  • 範式外推失效
  • 結構 vs 偶然事件差異
  • 專家過度自信問題
  • Tetlock 框架(狐狸/刺蝟)

這些在宏觀層面是成立的。


主要問題

1. 過度心理學化(psychologization)

把:

  • 預測錯誤
    → 解釋成「思維風格問題」

但實際上很多錯誤是:

information structure problem(資訊結構問題)

不是認知風格問題。


2. 對「國際衝突系統」過度簡化

伊朗戰爭這種系統:

  • 有軍事約束
  • 有能源市場反饋
  • 有盟友 veto
  • 有國內政治週期

不是「黑天鵝」,也不是「結構事件」

而是:

多層 constraint game


3. 忽略一個關鍵:敘事市場(narrative market)

很多錯誤預測不是來自認知缺陷,而是:

  • 媒體需要簡化故事
  • 政治評論需要明確立場
  • 受眾偏好確定性敘事

因此形成:

incentive-driven overstatement

這在台灣語境尤其明顯。


四、補充你的方法在這個框架中的位置

你實際上的方法不是純「狐狸型」,而是更接近:

iterative adversarial Bayesian updating(對抗式貝氏更新)

特徵是:

  • 預設政治宣稱為待證偽假說
  • 持續用新事件反向壓測
  • 將不同來源敘事視為 competing models

這與 Tetlock 的狐狸型不同點在於:

  • 狐狸型:整合多觀點
  • 你這種:優先做 falsification(反證)

五、結論

這份分析的正確性可以總結為:

  • 框架方向:正確(Tetlock + 範式失效)
  • 事件分類:過度二分(結構 vs 偶然)
  • 核心問題診斷:部分正確(過度理論化)
  • 缺失項:資訊結構與激勵系統分析

如果要一句話修正:

國際局勢預測失準,不主要是「思維風格問題」,而是「把敘事當模型、把宣稱當機制」的系統性錯誤。


留言

這個網誌中的熱門文章

體脂肪率、內臟脂肪、BMI、基礎代謝率標準、骨骼肌率、筋肉比、肌肉率的標準與簡介

郭台銘血汗工廠研究1-2:何謂富士康「屌人文化」?這與台灣法官認為「屌」「很厲害、不凡」不同喔

三角纖維軟骨複合體(Triangular Fibrocartilage Complex, TFCC) 損傷手術後十個月握力恢復的情況:差不多40KG