simon·geofin
Sections
Backtest · 公開回測

Geofin Score v0:把敘事觀點翻譯成可回測的因子

強敘事觀點很多、能進 backtest 的很少。這篇提出 Geofin Score v0——一個把 Geopolitical-First 框架五個維度量化成單一分數的初版設計。v0,會被下一版推翻。

2026-04-143 min readGeofin Score · 總經 · 因子建構

問題:強敘事 ≠ 可用因子

如果你看過足夠多的總經評論——不論來源是研究報告、Substack、YouTube、還是 老交易員的 twitter——你會同意一件事:觀點的強度跟可驗證性不成正比

強敘事讓人記得住,但「記得住」無法進 backtest。我要的是反過來的東西: 把一個敘事拆成每天可以算出數字的 feature,然後進 backtest。

Geofin Score 是我對這個問題的答案的第 0 版。它還不 work,我需要先寫下來 才知道哪裡會壞掉。

五個維度

v0 用五個軸,全部對應 Geopolitical-First 框架 的上游變量:

1. Geopolitical Tension(GT)

  • 資料源:GDELT 事件資料庫 + 七個瓶頸點的新聞事件嚴重度
  • 量化:0–10,週滾動
  • 信念:地緣風險先於資金,資金先於價格

2. Debt Stress(DS)

  • 資料源:七個主要經濟體的公債殖利率曲線 + CDS spread + 銀行體系壓力指標
  • 量化:0–10
  • 信念:債務陷阱的警報不是價格,是利率曲線的形狀

3. Supply Chain Chokepoint(SCC)

  • 資料源:七個瓶頸點的船運通過數 + BDI + 運價 spread
  • 量化:0–10
  • 信念:物理世界的延遲是金融世界的 alpha 窗口

4. Governance Quality(GQ)

  • 資料源:World Bank Governance Indicators + 主權評等變化 + 資本管制事件
  • 量化:0–10,月更新

5. Narrative Divergence(ND)

  • 資料源:主流財經媒體情緒 vs 獨立評論者情緒的偏離度
  • 量化:0–10
  • 信念:敘事分歧有時是 alpha,有時只是 noise——這一軸本身是反向 指標測試用,不是信號來源

v0 的組合方式

簡單加權(後續版本會試 PCA 或 regime-switching):

Geofin Score = 0.25·GT + 0.25·DS + 0.20·SCC + 0.15·GQ + 0.15·ND

這組權重是猜的。我知道。下一版會用每一軸對過去 NASDAQ / 台指的預測力去 反推權重,但 v0 先用直覺跑一遍作為 baseline。把 v0 發表出來的唯一目 的,就是讓未來的 v1 有東西可以打。

預計的測試

| 測試 | 目的 | |---|---| | 單軸 IC | 每一軸對未來 5/20/60 日 return 的相關性 | | 組合 IC | 整合分數的 IC | | Regime-conditional | 不同 VIX regime 下的表現 | | Walk-forward | 避免 in-sample overfit | | Seed stress | 任何含 ML 元件的版本,最少 10 個 seed 平均 |

會犯的錯(事先承認)

  1. 權重猜測:v0 的 0.25/0.25/0.20/0.15/0.15 是直覺,不是最佳化的結果
  2. 資料對齊偏差:五個軸的發布頻率不同(日/週/月),對齊時會引入 look-ahead 風險,要明確處理
  3. 生存偏誤:我選的七個瓶頸點是現在覺得重要的,1995 年重要的節點 跟現在不一樣
  4. LGBM 樂透:前一篇講過的教訓——v0 不用 LGBM,先用線性組合,避免 random seed 把假訊號放大成真訊號

下一步

  • [ ] 五個軸的每日/週數列建起來(GDELT + FRED + 海運資料源 + 新聞情緒)
  • [ ] 五年 IC 測試
  • [ ] 公開結果,不管好看不好看

如果 IC 是 0,下一篇就寫 Geofin Score v0 是一個 0 IC 的因子。這也是有價值 的結論——至少讓未來的我不會再用同一組假設跑第二次。