あなたのCalibreライブラリは聴かれるべきです
Calibreを使っているなら、おそらく本格的な蔵書をお持ちでしょう。何百冊、もしかすると何千冊ものタイトル。EPUBやPDF、2014年から変換しようと思いつつ放置しているMOBIなど。このライブラリを何年もかけて管理してきたはずです。
しかし問題はここです。ほとんどの本はただそこにあるだけです。読書時間より本のほうが多い。通勤、ジム、散歩 — すべて無駄な読書時間です。なぜなら、目は別のことに忙しいからです。
Calibreライブラリのどの本でも指さして「これを読んで」と言えたら — しかも実際に良い音質のオーディオブックが返ってきたらどうでしょうか?
2026年のAI音声合成はまさにそれを可能にします。5年前のロボット音声ではありません。感情、ペーシング、適切なチャプターマーカーを備えた本物のナレーションです。
従来の方法:システムTTS
Calibreの電子書籍ビューアにはテキスト読み上げオプションが内蔵されています。オフラインのオープンソースエンジンとしてはまずまずのPiper TTSを使用しています。他の読書アプリはシステム音声を使います — Microsoft、Apple、GoogleがOSに標準搭載しているものです。
結果は…5分間ならなんとか耐えられるレベルです。
システムTTSはすべてを同じフラットなトーンで読みます。戦闘シーンもラブレターも同じに聞こえます。会話とナレーションの区別がつきません。感情もリズムも息継ぎもありません。物語を吸収するより、人工的な音と戦うことにエネルギーを使ってしまいます。
さらに悪いことに、これらのツールのほとんどは何もエクスポートできません。音声を保存したり、スマホに転送したり、オフラインで聴いたりすることができません。アプリに縛られているのに、その体験は縛られるに値するほど良くないのです。
新しい方法:MimicReader
MimicReaderは異なるアプローチを取ります。フラットな音声でリアルタイムにテキストを読み上げるのではなく、本格的なオーディオブックファイルを生成します。Audibleからダウンロードするようなもの — ただし、自分の電子書籍から数分で作れます。
パイプラインの実際の処理はこうです:
- 電子書籍を解析 — 章、会話、シーン区切りをすべて保持
- 感情を分析 — AIがパッセージの緊張、悲しみ、喜び、中立を検出し、音声を調整
- Chatterbox TTSで音声を生成 — 合成音ではなく、本当に人間らしく聞こえるニューラル音声モデル
- 品質管理を実行 — Whisper(音声認識)が出力をソーステキストと照合し、幻覚や読み飛ばしをチェック
- 音声を正規化 — EBU R128ラウドネス規格により、すべての章が同じ音量になります
- チャプターマーカー付きM4Aを出力 — ダウンロードして任意のプレーヤーに入れ、章間をスキップ
結果は人間のナレーターではありません。しかし、最初の数ページを過ぎるとAIを聴いていることを忘れるほど近いです。そして23言語で動作します。
今日の使い方:Calibreからオーディオブックへ4ステップ
現在のワークフローはシンプルです。プラグインはまだ不要 — ブラウザとCalibreライブラリだけです。
ステップ1:Calibreからエクスポート
Calibreで本を右クリックし、「ディスクに保存」または「デバイスに送信」を選んで、EPUBファイルを取得します。別のフォーマットの場合、Calibreで先にEPUBに変換できます(数秒で完了)。
ステップ2:MimicReaderにアップロード
mimicreader.ai/appにアクセスし、ジェネレーターを開いてEPUBをアップロード。EPUB、PDF、TXT、MOBI、FB2に対応しているので、Calibreから取得したどのフォーマットでも動作します。
ステップ3:音声と言語を選択
内蔵音声から選ぶか、5秒のサンプルから自分の声をクローンします。本の言語を選択(ほとんどの場合自動検出されます)。「生成」を押します。
ステップ4:オーディオブックをダウンロード
生成が完了したら、M4Aファイルをダウンロード。チャプターマーカーが埋め込まれています。Apple Books、VLC、ポッドキャストアプリに入れるか、MimicReaderの内蔵プレーヤーで直接再生できます。
近日公開:Calibreプラグイン
4ステップのプロセスは動作しますが、さらにシンプルにしたいと考えています。Calibreのインターフェースに直接「MimicReaderに送信」ボタンを追加するCalibreプラグインを開発中です。
動作イメージ:
- Calibreライブラリで本を右クリック
- 「オーディオブック生成」を選択
- ポップアップで音声と言語を選択
- プラグインが本をアップロードし、生成をトリガーし、完成したM4AをCalibreライブラリにオーディオブックとしてタグ付きでダウンロード
ブラウザタブ不要。手動エクスポート不要。あなたのCalibreライブラリが、いつも使っているアプリを離れることなくオーディオブックライブラリになります。
早期アクセスをご希望ですか? プラグインウェイトリストに登録いただければ、準備ができ次第お知らせします。
音声品質の比較
TTSオーディオブックを諦める最大の理由は音声品質です。Calibreの本を音声化するオプションの比較はこちらです:
| 機能 | システムTTS | Calibre Piper | MimicReader Chatterbox |
|---|---|---|---|
| 自然さ | ロボット的 | まずまず | 非常に自然 |
| 感情表現 | なし | なし | AI検出(14種類の感情) |
| 言語 | OS依存 | 30以上(品質にばらつき) | 23(最適化済み) |
| ボイスクローニング | なし | なし | あり(5秒のサンプル) |
| ダウンロード可能なファイル | なし | なし | チャプター付きM4A |
| 章の検出 | なし | なし | 自動(TOC対応) |
| 品質管理 | なし | なし | Whisper QC(エラー検出) |
| オフライン使用 | あり | あり | M4Aダウンロード → 任意のプレーヤー |
| コスト | 無料(内蔵) | 無料(内蔵) | 無料1時間/月、以降£1/時間 |
システムTTSとCalibre内蔵のPiperは、1〜2段落の確認には十分です。しかし、本1冊分 — 8時間、10時間、15時間のオーディオを聴くとなると、自然さの差は本を最後まで聴き終えるか第1章で断念するかの違いになります。
価格:思ったより安い
プロの人間ナレーターは、完成1時間あたり£200〜500です。一般的な小説は8〜12時間のオーディオになるので、1冊あたり£1,600〜6,000になります。
ElevenLabsなどのAIオーディオブックサービスはサブスクリプションで月額$11〜99ですが、無料枠は短すぎて(約10分)実用的なものは作れません。使っても使わなくても料金が発生します。
MimicReaderは従量課金制です。サブスクリプションなし。契約縛りなし。
無料:毎月1時間のオーディオ(約50ページ分)。クレジットカード不要。
有料:1時間あたり£1。小説1冊で約£8〜12。
クレジットに有効期限なし。必要なときに購入。
Audibleの1冊あたり£15〜25と比較すれば、経済性は明らかです。Audible1年分の費用以下で、Calibreライブラリ全体を変換できます。
電子書籍リーダーにはブラウザの音声エンジンを使った読み上げ機能も内蔵されています — 即座に、無料で、待ち時間なし。ただし、大幅に高い品質を求めるなら、Chatterbox AIでフルオーディオブックを生成してください。章あたり数分かかりますが、結果には感情検出、適切なペーシング、実在の人物のような自然なナレーションが含まれます — システム音声とは別次元です。
なぜAudibleを使わないのか?
3つの理由があります:
- 品揃え。あなたのCalibreライブラリには、Audibleにない本があります。ニッチなタイトル、外国語の小説、自費出版作品、パブリックドメインの古典 — Calibreライブラリにあれば、MimicReaderが変換できます。Audibleには出版社がナレーションを付けたものしかありません。
- DRM。Audibleのオーディオブックは自社アプリに固定されています。MimicReaderはM4Aファイルを提供します。DRMなし、アプリロックインなし、永久にあなたのものです。
- コスト。Audibleは月額£7.99で1冊。年に数冊以上読むなら、Calibreからの変換のほうが大幅に安くなります。
あなたの本で試してみてください
Calibreライブラリから電子書籍をアップロードし、自然なAIオーディオブックを生成。毎月1時間無料 — クレジットカード不要、サブスクリプション不要。
無料で始めるプラグインウェイトリスト
Calibreプラグインは開発中です。リリースされると、Calibreを離れることなくオーディオブックを生成できるようになります — ワンクリックで、ライブラリに自動ダウンロード。
ウェイトリストに登録いただければ、プラグインの準備ができた瞬間にメールでお知らせします。スパムなし、ローンチ時の1通だけです。