現在の状態
① 起動
JS 起動中...
0s 経過

PoC #3 — Whisper LRC生成 v1

音声WAV → Whisper transcribe → タイムスタンプ付き字幕 (LRC) 生成。Piper TTS で作った音声に時刻情報を付与する用途。

🟡 PoC段階: モバイル WASM で Whisper が実用速度・精度で動くかは未検証。 実機テストで「動く」「効く」を判定する。F1〜F9遵守: 楽観煽らない・実データで判定する。
環境別の所要時間目安 (1分音声 × tiny モデル) 🟡 実測前の予想:
PC デスクトップ5〜20秒
Android Chrome (WASM)20〜90秒
iOS Safari (WASM)30〜120秒
📚 出典: ebook-audio・Piper PoC#2 実測との比較推定。Whisper モバイル実速は 本PoCで実測する。
1. Whisper モデル
2. 入力 WAV
3. transcribe + LRC生成
🟡 推論はキャンセル中断不可 (transformers.js の AbortSignal 限定対応・要ソース確認)。 キャンセル=ページリロード。OPFS キャッシュは消えません。
ログ (実機テストで秘書へ送付するための診断情報)
F1〜F9 遵守状況 (技術的セルフチェック)