現在の状態
① 起動
JS 起動中...
0s 経過

PoC #5 — LLM 校正パイプライン v1

MarianMT (PoC #4) の機械翻訳出力を LLM で校正し、自然な英語に近づける。オーナー実機テスト (2026-05-23) で検出された 12 種類の不自然箇所への回帰テスト機能つき。

📚 PoC #5 の狙い: PoC #4 結果 (MarianMT) で「意味は伝わるが英語として不自然」と判定 → LLM 校正でどこまで自然な英語に近づくか実測する。

🟡 仮説: 原文 (日本語) + 粗訳 (MarianMT) を LLM に渡し校正させると、直訳・語彙・時制の不自然は改善見込み (📚 LangMark 2025: CHRF +3〜4)。ただし意味崩壊 (例: "good boy" 誤訳) は LLM でも修正困難な可能性あり。要実測。

📚 採用 LLM: Gemini 2.5 Flash (Free Tier・クレカ不要・直叩き CORS OK) を default。OpenAI gpt-4o-mini (直叩き) / Anthropic Claude Haiku 4.5 (CORS 拒否のためプロキシ) も切替可能。
⚠ プライバシー注意: LLM 校正には原文 (日本語日記) と粗訳の両方を外部 API に送信します。
1. 入力 (原文 + 粗訳)
0 字
0 字
プリセット:
📌 オーナー実機テスト (2026-05-23) で検出された 12 種類の不自然箇所

    🟡 これらが LLM 校正で改善されるか、回帰テストとして観察する。 ⑤ "good boy" のような意味崩壊は LLM でも難所 (原文の "彼" が誰か / 文脈解釈が必要)。

    2. 目標言語
    3. LLM 選択
    4. API キー (選択 LLM のもの)
    5. プロンプト (編集可)
    原文・粗訳は実行時に末尾へ自動付加されます。
    6. 校正実行
    8. 診断ログ
    このページについて (PoC #5 詳細)

    PoC #5 LLM 校正パイプライン: PoC #4 の MarianMT 出力を「原文 + 粗訳」のペアで LLM に渡し、自然な英語に校正させる。

    事前調査 (✅ 検証済 / 2026-05-23):

    F1 警告 (楽観煽らない): LLM 校正で 12 箇所全てが直るとは断定しない。特に意味崩壊 ("good boy" 等) は原文文脈の解釈が必要で、LLM でも誤訳継承の可能性。

    F6 警告 (動く ≠ 効く): API が成功するだけでなく、出力がオーナー手動校正版に近づくかが本質。主観評価必須。