# 訪談逐字稿引用 SOP

> **由獨立 QA 第二輪審查觸發(2026-04-26)**:Wave 25 引入 Whisper 訪談轉錄後,平台一度直接連結原始逐字稿到議題卡片,引發名譽 / 隱私風險。本檔建立未來引用準則。

## 一、背景

平台從 Wave 25 起整合 Whisper(Groq large-v3)語音轉錄能力。**價值**:可從訪談、公聽會、記者會 m4a/mp3 中迅速產出文字材料。**風險**:
1. **同音誤判**:大型 LLM 仍會把人名辨識錯(如「伯洋」誤作「後山」、「事務所」誤作「所整天」)
2. **未經查證指涉**:訪談中受訪者對第三人之評價、推測、批評,未經當事人查證
3. **內部工作壓力之透露**:律師事務所、機構內部運作、媒體應對策略等,屬商業 / 隱私敏感
4. **無公開同意之言論**:私下訪談 ≠ 公開談話,引用須有受訪者書面同意

## 二、引用準則(必遵守)

### 2.1 不可直接 hyperlink 原始逐字稿

- 議題卡片、影子報告、advocacy_action 檔**不直接連結**原始 .txt / .srt
- 原始檔僅存 `data/sources/`,但屬**內部歸檔**,Jekyll sync 應排除(見 `scripts/sync_to_jekyll.py` 之 published 過濾)

### 2.2 必須先做「中性摘要」

- 由編輯人工校對後,**只保留制度面觀察**(法規、程序、結構性問題)
- 移除:第三人姓名、機構內部運作、未經查證之指控、Whisper 同音誤判
- 摘要檔以 `_制度面摘要.md` 結尾命名,frontmatter 加 `ethics_status` 欄位
- 範例:[`data/sources/賴月蜜訪談_2026-04_制度面摘要.md`](../data/sources/賴月蜜訪談_2026-04_制度面摘要.md)

### 2.3 受訪者書面同意原則

| 場景 | 引用範圍 |
|---|---|
| **公開談話**(YouTube、立法院 IVOD、公聽會發言)| 可直接引用,標明出處 |
| **媒體採訪**(已刊登)| 可引用已刊登內容,須附媒體連結 |
| **私下訪談 + 受訪者書面同意公開** | 可引用,須附同意書 ID |
| **私下訪談 + 無書面同意** | **僅可作為平台內部研究素材;不得在議題卡片、影子報告、媒體稿引用具體內容** |

### 2.4 第三人姓名之雙重核對

引用時若涉及第三人(非受訪者本人),必須:
1. 該人已在公開場合就同議題發表過相關言論(以 YouTube / 報導 / 法院判決為佐證)
2. 引用內容**不得逾越該公開言論之範圍**
3. 對 Whisper 同音誤判,須以**至少兩個其他公開來源**交叉驗證姓名拼寫

## 三、技術配套(自動化保護)

### 3.1 sync_to_jekyll.py 之 redact 規則
- 排除 `data/sources/*_逐字稿_*.txt`、`*_逐字稿_*.srt` 從 Jekyll 輸出
- 排除任何 `ethics_status` frontmatter 標記為「內部歸檔」之檔案

### 3.2 transcribe_audio.sh 之自動倫理提示
轉錄完成時印出警告:
```
⚠ 倫理提示:本逐字稿含原始未校對內容。
 在引用至議題卡片或影子報告前,請依 governance/transcript_citation_sop.md
 製作中性摘要,並評估受訪者同意狀況。
```

### 3.3 self_qa.sh 新增檢核
檢查議題卡片是否直接連結 `*_逐字稿_*.txt`(若有則 ✗ fail)。

## 四、現有訪談檔案處置紀錄

| 檔案 | 原狀 | 處置(2026-04-26)|
|---|---|---|
| 賴月蜜訪談 | PI-05/12 直連原始逐字稿 | 改連 `_制度面摘要.md`;原始 .txt 標「內部歸檔」 |
| 師大和平校區訪談 | 無 PI 引用 | 加 `ethics_status` frontmatter |
| GMT20260411 Zoom 71 分鐘 | PI-09 連結 | 評估同意狀況後改連摘要(待辦)|

## 五、責任分工

- **主編**:轉錄完成後 24 小時內評估倫理狀況,決定是否需製作中性摘要
- **DPO**:每月稽核 `data/sources/` 中所有逐字稿之引用狀態
- **兒少保護專員**:若涉兒少訪談,額外依 [`child_safeguarding.md`](child_safeguarding.md) 雙重審核
