diary-shadow PoC #5 — LLM 校正パイプライン

PoC #5 — LLM 校正パイプライン v1

MarianMT (PoC #4) の機械翻訳出力を LLM で校正し、自然な英語に近づける。オーナー実機テスト (2026-05-23) で検出された 12 種類の不自然箇所への回帰テスト機能つき。

📚 PoC #5 の狙い: PoC #4 結果 (MarianMT) で「意味は伝わるが英語として不自然」と判定 → LLM 校正でどこまで自然な英語に近づくか実測する。

🟡 仮説: 原文 (日本語) + 粗訳 (MarianMT) を LLM に渡し校正させると、直訳・語彙・時制の不自然は改善見込み (📚 LangMark 2025: CHRF +3〜4)。ただし意味崩壊 (例: "good boy" 誤訳) は LLM でも修正困難な可能性あり。要実測。

📚 採用 LLM: Gemini 2.5 Flash (Free Tier・クレカ不要・直叩き CORS OK) を default。OpenAI gpt-4o-mini (直叩き) / Anthropic Claude Haiku 4.5 (CORS 拒否のためプロキシ) も切替可能。

⚠ プライバシー注意: LLM 校正には原文 (日本語日記) と粗訳の両方を外部 API に送信します。

🟡 Gemini Free Tier: 学習に使用される (Paid Tier は使用されない・公式規約)。利用規約
✅ OpenAI API: 学習に使用されない (デフォルト・30日保存)
✅ Anthropic API: 学習に使用されない (7日保存・2025-09 以降)

1. 入力 (原文 + 粗訳) 原文 (日本語日記)

0 字

粗訳 (MarianMT 出力・PoC #4 から貼り付け or 手入力)

0 字

プリセット:

📌 オーナー実機テスト (2026-05-23) で検出された 12 種類の不自然箇所

🟡 これらが LLM 校正で改善されるか、回帰テストとして観察する。 ⑤ "good boy" のような意味崩壊は LLM でも難所 (原文の "彼" が誰か / 文脈解釈が必要)。

2. 目標言語

3. LLM 選択

Gemini 2.5 Flash FREE

Google AI Studio 経由・クレカ不要・250 req/日 (Free Tier)。CORS 対応で直叩き可。
🟡 Free Tier は学習に使用される (公式規約)。

OpenAI gpt-4o-mini PAID

$0.15/M input · $0.60/M output。CORS 対応で直叩き可。学習に使用されない (デフォルト)。

Claude Haiku 4.5 PAID PROXY

$1/M input · $5/M output。CORS 拒否のため /api/anthropic プロキシ経由。学習に使用されない (7日保存)。

4. API キー (選択 LLM のもの)

localStorage 保存 (自己責任)

5. プロンプト (編集可)

原文・粗訳は実行時に末尾へ自動付加されます。

6. 校正実行

8. 診断ログ

このページについて (PoC #5 詳細)

PoC #5 LLM 校正パイプライン: PoC #4 の MarianMT 出力を「原文 + 粗訳」のペアで LLM に渡し、自然な英語に校正させる。

事前調査 (✅ 検証済 / 2026-05-23):

Gemini 2.5 Flash (gemini-2.5-flash): CORS preflight 200 OK (実測) → 直叩き可
OpenAI API: CORS preflight 200 OK (実測) → 直叩き可
Anthropic API: CORS preflight 400 "Disallowed CORS origin" (実測) → /api/anthropic プロキシ必須
Claude Haiku 4.5 (alias claude-haiku-4-5) は公式ドキュメントの現行 ID
Gemini Free Tier は学習利用あり (公式規約)

F1 警告 (楽観煽らない): LLM 校正で 12 箇所全てが直るとは断定しない。特に意味崩壊 ("good boy" 等) は原文文脈の解釈が必要で、LLM でも誤訳継承の可能性。

F6 警告 (動く ≠ 効く): API が成功するだけでなく、出力がオーナー手動校正版に近づくかが本質。主観評価必須。

PoC #5 — LLM 校正パイプライン v1

原文日本語

校正前 MarianMT

校正後 LLM

PoC #5 — LLM 校正パイプライン v1

原文 日本語

校正前 MarianMT

校正後 LLM

原文日本語