臨床統計學
掌握核心概念
統計學第一性原理
統計學的核心意義
統計學是:用樣本推論總體的工具,是「量化不確定性」的語言。
醫學決策中,數據永遠來自樣本,不是母體 → 必須接受機率、誤差、不確定。
三大核心原理
- 不確定性:疾病發生具有隨機性,不能確定地預測個體,但可預測群體機率。
- 變異性:個體間反應不同,統計幫助我們判斷這些變異是否具臨床意義。
- 證據為本:臨床判斷應基於數據,而非個人經驗或直覺。
研究設計與統計概念總覽
研究設計的結構性邏輯
| 類型 | 時序 | 起點 | 常見疾病頻率 | 可計算指標 | 優點 | 缺點 |
|---|---|---|---|---|---|---|
| Cohort (世代研究) | 前瞻/回溯 | 依暴露分群 | 常見病 | RR, AR, HR | 時間順序明確,可看多結果 | 成本高、需長期追蹤 |
| Case-control (病例對照) | 回顧性 | 依結果分群 | 罕見病 | OR | 適合研究罕病、快速 | 回憶/選擇偏差 |
| Cross-sectional (橫斷面) | 單一時間 | 同步收資料 | 常見病 | Prevalence | 快速、成本低 | 無法推論因果 |
| RCT (隨機對照試驗) | 前瞻性 | 隨機分派 | 任意 | ARR, RRR, NNT | 偏差最小、因果關係最強 | 費用高、倫理限制 |
| Crossover (交叉試驗) | 前瞻性 | 自身對照 | 穩定病 | 差異比較 | 控制個體差異 | 適用族群有限,需washout |
統計名詞與應用概念
統計指標定義比較表
| 指標 | 英文名 | 第一性邏輯概念 | 公式 | 用途 | 常見誤區 |
|---|---|---|---|---|---|
| 發生率 | Incidence | 某期間新發病數 | 新病例 / 風險人口 | 疾病速度 | 需明確時間定義 |
| 盛行率 | Prevalence | 當下存有的病 | 現有病患 / 總人口 | 疾病負擔 | 無法推因果 |
| 風險比 | Risk Ratio (RR) | 暴露組風險是否↑ | 暴露組發病率 / 對照組發病率 | 看治療是否有效 | 無法解釋效應大小 |
| 相對風險差 | RRR | 效果百分比下降 | 1 - RR | 研究報告常引用 | 過度樂觀 |
| 絕對風險差 | ARR | 實際減少多少人出事 | 對照組發病率 - 實驗組發病率 | 算NNT的基礎 | 常被忽略 |
| 需治療人數 | NNT | 幾人治療可助1人 | 1 / ARR | 衡量臨床價值 | NNT越小越好 |
統計檢定工具選擇邏輯
檢定工具與題型搭配
| 比較目標 | 適合統計方法 | 條件 | 常見題目例子 |
|---|---|---|---|
| 兩組平均值(連續資料) | t-test | 常態分布資料 | ICU兩組鈉離子比較 |
| 同一組前後比較 | Paired t-test | 相依樣本 | 同一病人前後BP差異 |
| 類別比例比較 | Chi-square | n > 5格頻 | 預後與性別關聯 |
| 小樣本比例 | Fisher’s exact | n < 5 | 稀有副作用分析 |
| 多組平均值 | ANOVA | 正態連續資料 | 三組血糖藥效比較 |
| 多變量調整 | Multiple logistic regression | 二元結果,控制混雜因子 | 影響疾病預後的獨立因素分析 |
🧠 判斷邏輯記憶術:
- 題幹提到 before vs after → Paired t-test
- 題幹提到 Group A vs B → Independent t-test
- 題幹提到 比例/分類變項 → Chi-square or Fisher's exact test
- 題幹明示「控制多個變項」→ Regression
🔍
診斷試驗性能指標
| 指標 | 第一性原理 | 公式 | 應用 | 錯誤避免 |
|---|---|---|---|---|
| 敏感度 (Sn) | 病人有病時能抓出來 | TP / (TP + FN) | 排除病(陰性則無病) | 太高可能抓錯人 |
| 特異度 (Sp) | 沒病的人能正確排除 | TN / (TN + FP) | 確診病(陽性則確診) | 太高可能漏掉病人 |
| 陽性預測值 (PPV) | 陽性檢測是真病 | TP / (TP + FP) | 臨床使用PPV決策 | 受盛行率影響大 |
| 陰性預測值 (NPV) | 陰性檢測真沒病 | TN / (TN + FN) | 排除診斷用 | 盛行率低會很高 |
| 概似比 (LR+, LR−) | 檢測改變病機率的力道 | LR+ = Sn / (1−Sp) | 貝式更新用 | 難以直觀解釋 |
生存分析與風險模型
| 概念 | 說明 | 臨床例子解釋 |
|---|---|---|
| Hazard ratio (HR) | 瞬時風險比 | HR = 0.5 → 治療組在任何時間點發生風險是對照組的一半 |
| Kaplan-Meier 曲線 | 累積生存曲線 | 生存分析表示不同時間點存活比率 |
| Cox regression | 多因子生存風險調整 | 癌症預後模型類似多變項logistic regression |
模擬題精選與答題策略
題目 1: Retrospective observational cohort study → 控制混雜因子?
✅ 答案:Multiple logistic regression
📌 關鍵: 回溯性設計無法隨機 → 必須用迴歸控制混雜因子。
題目 2: 前瞻性分組(有無RRT)→追蹤90天功能狀態?
✅ 答案:Cohort study
📌 關鍵: 分組依暴露、追蹤結果(非結果→暴露)=世代研究。
快速答題策略總表
| 線索 | 推論設計/方法 |
|---|---|
| 結果→回推暴露 | Case-control |
| 暴露→追蹤結果 | Cohort |
| 單次調查 | Cross-sectional |
| 有隨機分派 | RCT |
| 自身前後比較 | Paired t-test |
| 二組平均比較 | Independent t-test |
| 控制混雜因子 | Logistic regression (或其他迴歸模型) |
| 內部一致性分析 | Cronbach’s alpha |
附錄:統計方法選擇決策樹
統計方法選擇流程
- 步驟一:決定資料類型
- 連續型?(如:血壓、Na、血糖)→ 看是否常態
- 類別型?(如:性別、存活與否)→ 分析比例
- 步驟二:樣本是否配對?
- 同一人前後比較 → Paired test
- 不同人兩組比較 → Independent test
- 步驟三:決定檢定方法
研究目標 資料型態 群組關係 檢定方法 比較兩組平均(常態) 連續變數 獨立 Independent t-test 比較兩組平均(非常態) 連續變數 獨立 Mann-Whitney U test 同一組前後平均(常態) 連續變數 相依 Paired t-test 同一組前後平均(非常態) 連續變數 相依 Wilcoxon signed-rank test 比較三組以上平均 連續變數 獨立 ANOVA 比例比較(樣本大) 類別變數 任意 Chi-square test 比例比較(樣本小) 類別變數 任意 Fisher’s exact test 控制多變項/混雜因子 任意 任意 Regression(多種型式)
📌 記憶技巧:
- 數據是否常態?→ 是就用 t/ANOVA,否則用 Mann-Whitney/Wilcoxon。
- 組別是否相依?→ 相依用 paired 檢定。
- 結果是否為比例?→ 用 Chi-square / Fisher。
- 變項很多、需控制偏差?→ 用 Regression。
Tip:「何種統計方法最合適?」以上流程圖搭配題幹判斷字詞(如“配對”、“控制”、“兩組”)即可快速破題!
沒有留言:
張貼留言