現在の状態
① 起動
JS 起動中...
0s 経過

PoC #7 — WebGPU + 量子化 LLM ローカル翻訳 v1

transformers.js v3 + WebGPU で Qwen 2.5 / Gemma 3 をブラウザ内で実行。MarianMT (PoC #4) 単独の品質限界を、ローカル LLM 直接翻訳で超えられるかを実機検証する。

📚 PoC #7 の狙い: シナリオ 2 (WebGPU LLM 統合・推定実現確率 40%) の実機検証。ローカル + 高品質 + ¥0 を同時に満たせるかを Qwen / Gemma で計測する。

🟡 仮説: 0.5B-1.5B 級 LLM (Qwen) は MarianMT 74M を構造的に上回るが、Gemini 2.5 Flash 校正 (PoC #5・91.7% 改善) に届くかは未検証。プロンプト + 量子化次第。

F5 (実装前確認・✅ HF Hub HEAD 実測):
⚠ 想定リスク (F1/F6/F9):
0. 環境検出 (WebGPU / Adapter / メモリ)
⏳ 検出中...
1. 入力 (日本語日記)
0 字
プリセット:
📌 PoC #5 でも使った 12 種類の不自然箇所 (MarianMT 出力)

    🟡 これらが WebGPU LLM 直接翻訳 でどこまで改善されるか、回帰テストとして観察。Gemini Flash 校正 (PoC #5 = 91.7% 改善) との比較が判断軸。

    2. 目標言語
    3. WebGPU LLM モデル選択

    🟡 量子化 (dtype) は q4f16 既定 (品質保持 + サイズ最小寄り)。q4 はサイズ大だが速度高い場合あり。

    4. モデル準備 (初回のみ DL)
    未準備

    📚 モデルファイルは OPFS にキャッシュされる (transformers.js v3)。2 回目以降は再 DL 不要。

    5. プロンプト (編集可)
    原文は実行時に末尾へ自動付加されます。
    6. 並列比較 (任意)
    7. 翻訳実行
    9. 診断ログ
    このページについて (PoC #7 詳細)

    PoC #7 WebGPU + 量子化 LLM ローカル翻訳: ローカル LLM (Qwen 2.5 / Gemma 3) を WebGPU で実行し「ローカル + 高品質」革命の実機検証。

    事前調査 (✅ 検証済 / 2026-05-23 F5 遵守):

    F1 警告 (楽観煽らない): 「WebGPU LLM で全部解決」と断定しない。0.5B モデルでは Gemini Flash の文脈推論には届かない可能性が高い。

    F6 警告 (動く ≠ 効く): モデルが推論を完了するだけでなく、出力が MarianMT 単独より自然な英語になっているかが本質。主観評価必須。

    F9 警告 (モバイル OOM): 1.22GB モデルはモバイルで OOM 危険。Qwen 0.5B (483MB) / Gemma 3 270M (273MB) から実機テスト推奨。