外国語日記 → シャドーイング練習アプリの技術検証用 PoC 一覧。
1Web Speech API 最小検証
ブラウザ内蔵 TTS(OS声)の英語・仏語品質を評価。¥0 / DL 0。→ 実機テスト結果: ロボ感・発音不正確で不採用。
2Piper TTS (ONNX/WASM)
VITS ベースの neural TTS をブラウザで実行。分割推論+連結再生で 1119字を 11チャンク/215秒で完走。→ ②TTS GO 確定 (オーナー判定)。
3Whisper LRC生成 (transformers.js)
WAV → Whisper transcribe → タイムスタンプ字幕 (LRC) 生成。Piper TTS 出力に時刻情報を付与する forced alignment 検証。tiny=41MB / base=77MB。
6シャドーイングプレーヤー
音声再生 + LRC 同期 + マイク録音 + 録音再生の最小 UI。
4翻訳 (MarianMT vs DeepL Free)
日本語日記 → 英・仏 翻訳の ローカル MarianMT (~103MB/言語) と DeepL Free API (CORS 不可のためプロキシ経由) を並列比較。①翻訳ブロックの実現性と品質を実日記サンプルで判定。
5LLM 校正パイプライン
MarianMT の不自然な英訳を LLM で校正。Gemini 2.5 Flash (Free・直叩き) / OpenAI gpt-4o-mini (直叩き) / Claude Haiku 4.5 (プロキシ)。オーナー検出 12 箇所の回帰テスト・3 列比較・差分ハイライト・HTML エクスポートつき。
6Chrome Built-in AI Translation
Chrome 138+ デスクトップに搭載された Gemini Nano ベースの Translator API を実機検証。MarianMT (PoC #4) / Gemini 校正 (PoC #5) と並列比較。⚠ モバイル非対応(公式) のためデスクトップ Chrome 限定。
7WebGPU + Qwen/Gemma ローカル LLM 翻訳
transformers.js v3 + WebGPU で Qwen 2.5 0.5B/1.5B / Gemma 3 270M をブラウザ内推論。MarianMT (PoC #4) / Gemini 校正 (PoC #5) と並列比較し、シナリオ2「ローカル+高品質」の実現性を実機検証。Qwen 0.5B q4f16=483MB / Gemma 3 270M q4f16=273MB (HF Hub 実測)。