Research Overview
本專案以多源資料蒐集與機器學習預測為核心,建構一套針對解放軍軍事活動的自動化分析系統。 透過 爬蟲代理 (Scraper Agents) 持續蒐集來自多國官方與媒體管道的公開資料, 再由 預測模組 (Prediction Module) 進行時序建模與未來趨勢推估, 為研究者與決策者提供即時、可量化的態勢感知工具。
Multi-Source Scraper Agents
系統部署多個自動化爬蟲代理,每日排程執行,涵蓋台灣國防部即時軍力動態、 日本防衛省統合幕僚監部艦艇/航空機情報、中國官媒(新華社、微博)輿情、 以及航行警告與機場氣象等資料來源。各代理以 Selenium、Playwright、 Crawl4AI 等工具實作,經由 GitHub Actions 自動觸發與排程。
ML Prediction Module
預測模組採用 CatBoost 集成學習演算法,結合 21 日滯後特徵、動量指標、 突波偵測、regime detection 等特徵工程,以分位數回歸 (Quantile Regression) 輸出 95% 信賴區間的 7 日出動架次預測。模型透過時序交叉驗證 (Time-Series Cross-Validation) 確保穩健性,並整合新聞分類器 (Grok AI) 進行輿情關聯分析。
Expected Outcomes
- 每日自動更新的多源軍事活動資料集
- 具信賴區間的 7 日出動架次預測
- AI 輔助新聞分類與輿情趨勢追蹤
- 台海周邊氣象與航行警告即時監控
- 日本防衛省艦艇/航空機動態彙整
- 開放資料下載供後續學術研究使用