勞動民意陳情分析系統
自動把每月幾千筆民眾陳情,化為可看趨勢、可比較期間、可搜尋個案的儀表板。 資料先以 Python 統計處理,再由大型語言模型(LLM)分類與寫摘要;輸出靜態 JSON 供本網站讀取。
案件總數
1,494件
資料區間
2025年01月01日 ~ 2025年01月31日
分析主題
14類
系統流程 End-to-End Pipeline
人類紀錄
CSV 原始檔
勞動list_*.csv
陳情日期、結案別、文號、主旨、內容…(含個資)
→
核心Python + AI
Pipeline
8 個分析步驟
統計
ingest · redact · aggregate · indices
AI
classify · daily · monthly · yearly · topic
→
結構化資料
JSON 報表
web/public/data/
cases / daily / monthly / yearly / topics / manifest
→
此網站
Dashboard
7 種網頁視圖
趨勢地圖 / 報告 / 搜尋 / 個案詳情
色彩編碼: 人類紀錄 / Python 統計 / AI 推論 / Dashboard
流程細節 Pipeline Steps
01
ingest.py
讀 CSV、把民國日期換成西元、依文號去重
純統計
02
redact.py
抹除電話、身分證、Email、地址、銀行帳號(regex)
純統計
03
classify.py
為每筆案件貼 1–3 個主題標籤 + 紅旗警示
AI
04
analyze_daily.py
逐日彙整 + 與前一日比較 + 產出當日摘要
AI
05
analyze_monthly.py
月度滾動統計 + 政策觀察 2–3 點
AIThink
06
analyze_yearly.py
年度回顧 + 政策方向 3–5 點
AIThink
07
analyze_topics.py
14 個主題的長期趨勢曲線 + 解讀
AIThink
08
build_indices.py
產 manifest 與全文搜尋索引
純統計