預測伊朗戰爭走向檢討15：國際局勢預測失準，不主要是「思維風格問題」，而是「把敘事當模型、把宣稱當機制」的系統性錯誤。

6月 23, 2026

gemini回答我的上一個問題中，對於政治學者預測國際局勢有以下分析，你對此的看法？

chatgpt答：

這段分析整體框架是正確的，但有幾個關鍵地方被「理論化過度」，把一個本質上混合了制度、資訊結構與事件機率的問題，簡化成「刺蝟 vs 狐狸」的認知分類，這會導致解釋力看似完整但實際上偏鬆散。

下面分層評估。

一、關於「明居正預測落差」的核心判斷

1.「範式外推失效」——這點基本成立，但不完整

用中共政治分析框架去推中東戰爭，本質上是跨域錯配（domain misalignment）。這是政治學預測失準的常見原因。

但關鍵補充是：

中東戰爭不是純「偶然事件」
而是「高頻互動 + 高約束結構（能源、軍事基地、盟友壓力）」的混合系統

也就是：

既不是純結構，也不是純黑天鵝，而是「受約束的混沌系統」

因此失準原因不只是範式外推，而是：

把「宣示性戰略語言」當作行動函數
對軍事後勤與升級約束估計不足
對多方 veto player（以色列、海灣國家、歐洲油價壓力）建模不足

2.「結構性 vs 偶然性」區分——這裡被簡化了

文中說法是：

貿易戰 = 結構性 → 可預測
伊朗戰爭 = 偶然性 → 不可預測

這在技術上不準確。

更精確的分類應該是：

貿易戰 / 中共人事：低分岔點系統（path dependent）
伊朗戰爭：高分岔點系統（branching system）

但仍然存在結構約束，例如：

荷姆茲海峽封鎖會觸發全球油價反應函數
美國會受選舉週期與軍費消耗限制
以色列存在獨立戰略目標函數

因此它不是「偶然」，而是：

高不確定性但仍可建模的戰略互動系統

3.「理論慣性」判斷是對的，但描述不精確

真正問題不是「刺蝟型理論慣性」，而是：

把 geopolitical narrative 當作 causal structure
把宣稱（statements）當作行為（actions）

例如：

“掐斷中國能源命脈”
“伊朗油管三天內爆炸”

這類敘事本質是：

signaling language（戰略訊號）而非 operational plan（可執行計畫）

很多評論失誤在這裡，而不是單純理論僵化。

二、關於「政治學者預測能力」的評估

1. Tetlock 結論是正確引用，但常被誤讀

原始研究重點其實不是：

專家很差

而是：

「自信型專家」很差，「校準型預測者」較好

差別在：

專家 ≠ 預測者
學術訓練 ≠ 機率建模能力

2. 關鍵變因其實不是「思維類型」，而是三個技術因素

比狐狸/刺蝟模型更重要的是：

(1) 機率校準能力（calibration）

是否能說：

30%會發生 vs 90%會發生

而不是二元判斷。

(2) feedback loop 速度

國際政治的問題是：

feedback 很慢
或被敘事污染

導致模型無法快速修正

(3) observation quality（觀測品質）

很多政治學者最大問題是：

使用 second-hand narratives
而非 direct event data（航運、軍事部署、能源流）

這點比學派更關鍵。

三、對該 Gemini 分析的總評

優點

它抓到三個核心點：

範式外推失效
結構 vs 偶然事件差異
專家過度自信問題
Tetlock 框架（狐狸/刺蝟）

這些在宏觀層面是成立的。

主要問題

1. 過度心理學化（psychologization）

把：

預測錯誤
→ 解釋成「思維風格問題」

但實際上很多錯誤是：

information structure problem（資訊結構問題）

不是認知風格問題。

2. 對「國際衝突系統」過度簡化

伊朗戰爭這種系統：

有軍事約束
有能源市場反饋
有盟友 veto
有國內政治週期

不是「黑天鵝」，也不是「結構事件」

而是：

多層 constraint game

3. 忽略一個關鍵：敘事市場（narrative market）

很多錯誤預測不是來自認知缺陷，而是：

媒體需要簡化故事
政治評論需要明確立場
受眾偏好確定性敘事

因此形成：

incentive-driven overstatement

這在台灣語境尤其明顯。

四、補充你的方法在這個框架中的位置

你實際上的方法不是純「狐狸型」，而是更接近：

iterative adversarial Bayesian updating（對抗式貝氏更新）

特徵是：

預設政治宣稱為待證偽假說
持續用新事件反向壓測
將不同來源敘事視為 competing models

這與 Tetlock 的狐狸型不同點在於：

狐狸型：整合多觀點
你這種：優先做 falsification（反證）

五、結論

這份分析的正確性可以總結為：

框架方向：正確（Tetlock + 範式失效）
事件分類：過度二分（結構 vs 偶然）
核心問題診斷：部分正確（過度理論化）
缺失項：資訊結構與激勵系統分析

如果要一句話修正：

國際局勢預測失準，不主要是「思維風格問題」，而是「把敘事當模型、把宣稱當機制」的系統性錯誤。

搜尋此網誌

blackjack的blog(本人文字非經授權不得轉載)