Alternative TTS pour KOReader : des voix IA qui sonnent vraiment humaines

KOReader est formidable. Sauf pour une chose.

Si vous possédez une Kindle, Kobo, PocketBook ou tout autre appareil e-ink, il y a de fortes chances que vous ayez entendu parler de KOReader. Avec plus de 22 700 étoiles sur GitHub, c’est le lecteur de documents open-source le plus populaire pour le matériel e-ink. Il gère les fichiers EPUB, PDF, DJVU, MOBI et CBZ avec un niveau de personnalisation qu’aucun firmware d’origine ne peut égaler. Rendu des polices, marges, recherche dans le dictionnaire, synchronisation de la progression, contrôles gestuels — KOReader réussit presque tout.

Presque tout. La seule lacune flagrante est la synthèse vocale.

L’issue GitHub #545 a été ouverte en 2015. Elle est toujours ouverte. L’issue #11931 a revisité la question en 2024 avec une proposition détaillée d’intégration de Piper. Toujours ouverte également. Les commentaires dans les deux fils racontent la même histoire : les utilisateurs de KOReader veulent le TTS, et ils attendent depuis longtemps.

« J’adorerais pouvoir écouter mes livres en cuisinant ou en me déplaçant. C’est la seule raison pour laquelle je garde encore le firmware Kobo d’origine installé à côté de KOReader. » — Utilisateur GitHub, issue #11931

« Le TTS est probablement la fonctionnalité la plus demandée de l’histoire de KOReader. Toutes les solutions de contournement que j’ai essayées sonnent terriblement mal. » — Reddit, r/ereader

Pourquoi KOReader n’a pas de TTS

Ce n’est pas faute d’avoir essayé. Les barrières techniques sont réelles :

Le matériel e-ink est faible. La plupart des liseuses fonctionnent avec des processeurs ARM et une RAM limitée. Exécuter un modèle TTS neuronal localement n’est pas réaliste sur une Kindle Paperwhite ou une Kobo Clara. Même Piper, qui est léger selon les standards TTS, aurait du mal sur de nombreux appareils.
Pas de consensus sur l’architecture. KOReader devrait-il streamer le TTS depuis un serveur ? Intégrer un moteur local ? Rediriger le texte vers une application externe ? Chaque approche a ses compromis, et les mainteneurs ne se sont pas accordés sur une solution.
Le matériel audio varie énormément. Certaines liseuses ont des haut-parleurs. Certaines ont le Bluetooth. Certaines n’ont ni l’un ni l’autre. Une fonctionnalité TTS qui ne fonctionne que sur un sous-ensemble d’appareils est difficile à maintenir dans un projet open-source.
Les attentes de qualité ont augmenté. En 2015, les voix TTS système étaient la norme. En 2026, les gens s’attendent à une narration de qualité IA. Livrer une voix robotique dans KOReader aujourd’hui décevrait plus d’utilisateurs que ça n’en satisferait.

L’intégration Piper proposée dans #11931 est la voie la plus prometteuse, mais elle nécessite un travail d’ingénierie important et n’a pas été intégrée. Il n’y a pas de calendrier.

Les solutions de contournement actuelles (et pourquoi elles ne suffisent pas)

Les utilisateurs de KOReader qui veulent du TTS aujourd’hui ont quelques options, aucune n’étant satisfaisante :

TTS Android sur appareils Boox/Onyx. Si votre liseuse fonctionne sous Android (comme Onyx Boox), vous pouvez installer Google TTS ou Samsung TTS et utiliser @Voice Aloud Reader pour lire vos livres. Le problème : vous quittez complètement KOReader, perdez votre position de lecture, et les voix sont des voix système génériques — plates, monotones et indubitablement robotiques.
Bluetooth vers un téléphone avec une application TTS. Certains utilisateurs gardent leur téléphone avec une application TTS synchronisée sur le même livre. Cela implique de gérer deux appareils, deux applications et deux positions de lecture. Ça marche, tout juste.
Calibre + TTS de bureau. Exportez le livre depuis KOReader, ouvrez-le dans Calibre sur un ordinateur et utilisez un outil TTS de bureau. Fonctionnel mais contredit l’intérêt d’avoir un lecteur portable.

Toutes ces solutions partagent le même problème fondamental : la qualité vocale n’est pas suffisante pour écouter pendant une longue période. Les voix TTS système en 2026 sont acceptables pour lire une courte notification. Elles sont épuisantes pour un roman de 10 heures.

MimicReader : le compagnon de KOReader

        L’idée est simple : Prenez l’EPUB que vous lisez dans KOReader, téléversez-le sur MimicReader, et obtenez un vrai livre audio avec des voix IA — celles qui sonnent humaines, avec émotion, rythme et inflexion naturelle. Téléchargez le fichier M4A et écoutez sur n’importe quel appareil, y compris votre liseuse.
    

MimicReader est une plateforme de conversion d’ebook en livre audio basée sur Chatterbox, un moteur TTS neuronal open-source. Ce n’est pas un plugin pour KOReader (pas encore — plus de détails ci-dessous). C’est un service autonome qui gère tout le pipeline : extraction de texte, détection des chapitres, analyse émotionnelle, synthèse vocale sur du matériel GPU dédié, contrôle qualité par Whisper, et normalisation audio au standard broadcast.

Le résultat est un fichier M4A avec marqueurs de chapitres dans 23 langues. Vous pouvez le streamer dans le lecteur intégré ou le télécharger pour l’écouter où vous voulez — sur votre téléphone, dans votre voiture ou sur le haut-parleur de votre liseuse via Bluetooth.

Ce qui le différencie du TTS système

Voix neuronales, pas concaténatives. Chatterbox génère la parole à partir de zéro plutôt que d’assembler des phonèmes pré-enregistrés. Le résultat ressemble à une personne qui lit, pas à un GPS qui donne des directions.
Sensible aux émotions. MimicReader analyse chaque passage pour son contenu émotionnel — tension, tristesse, excitation, humour — et ajuste la voix en conséquence. Les dialogues sonnent comme des dialogues. Les scènes d’action accélèrent le rythme.
23 langues. Anglais, espagnol, français, allemand, polonais, japonais, coréen, arabe, et 15 autres. Les utilisateurs de KOReader lisent dans de nombreuses langues. MimicReader le supporte.
Clonage vocal. Téléversez un échantillon audio de 5 secondes et le moteur narrera votre livre avec cette voix. Vous voulez votre livre audio lu par un narrateur spécifique ? Enregistrez un court extrait et laissez l’IA faire le reste.

Comment l’utiliser aujourd’hui

En attendant le plugin KOReader, voici le processus :

Trouvez votre fichier de livre. Sur votre liseuse, KOReader stocke les livres dans un répertoire que vous avez configuré (souvent /mnt/onboard/ ou un dossier personnalisé). Connectez votre liseuse à un ordinateur via USB, ou utilisez le gestionnaire de fichiers intégré pour localiser l’EPUB.
Transférez l’EPUB. Copiez-le sur votre ordinateur ou téléphone. Si vous gérez votre bibliothèque avec Calibre, le fichier est déjà sur votre ordinateur.
Téléversez sur MimicReader. Allez sur mimicreader.ai/app, créez un compte gratuit et téléversez votre EPUB. MimicReader accepte également les PDF, TXT, MOBI et FB2.
Générez votre livre audio. Ouvrez le livre dans votre bibliothèque, appuyez sur le bouton de génération, choisissez une voix et une langue. Le pipeline IA s’occupe du reste. Vous recevrez une notification quand ce sera prêt.
Téléchargez le M4A. Transférez-le sur votre liseuse, téléphone ou n’importe quel appareil. Lisez-le dans n’importe quel lecteur audio supportant le M4A (c’est-à-dire pratiquement tous).

Le niveau gratuit vous donne 1 crédit par mois — assez pour environ 1 heure d’audio. C’est un court roman ou plusieurs chapitres d’une œuvre plus longue. Les crédits payants coûtent 1 £ par heure et n’expirent jamais.

Bientôt : plugin KOReader

Nous développons un plugin Lua pour KOReader qui ajoutera une option « Envoyer vers MimicReader » directement dans le menu de lecture. Sélectionnez du texte ou un livre entier, et le plugin le téléversera vers l’API de MimicReader et mettra la génération en file d’attente. Quand votre livre audio sera prêt, il se téléchargera automatiquement sur votre appareil.

C’est le workflow que les utilisateurs de KOReader demandent : surligner un passage, appuyer sur un bouton, et l’entendre lu par une voix humaine — sans quitter l’application.

Le plugin est en développement. Si vous voulez un accès anticipé, inscrivez-vous sur la liste d’attente et votez pour la priorité du plugin KOReader.

Qualité vocale : pas le TTS robotique auquel vous êtes habitué

Si votre seule expérience avec le TTS est la voix système de Google ou Amazon Polly, l’écart de qualité va vous surprendre. MimicReader utilise Chatterbox, un modèle TTS neuronal spécialement conçu pour une parole naturelle et expressive.

« Dans des tests de préférence en aveugle, Chatterbox est préféré à ElevenLabs 63 % du temps. » — Article de recherche Chatterbox, Resemble AI

Ce n’est pas du marketing — c’est tiré de l’évaluation publiée du modèle. Chatterbox produit une parole avec des pauses naturelles, une emphase adaptée et le genre de variation vocale subtile qui rend l’écoute longue confortable plutôt que fatigante.

Pour les utilisateurs de KOReader qui ont souffert du TTS système ou ont complètement abandonné, c’est la différence entre « je ne peux pas écouter ça plus de cinq minutes » et « j’ai oublié que ce n’était pas un narrateur humain ».

Essayez MimicReader gratuitement

Téléversez l’EPUB de votre bibliothèque KOReader et entendez la différence que font les voix IA. 1 heure gratuite chaque mois, sans carte bancaire.

Commencer gratuitement

Vous voulez le plugin KOReader plus tôt ? Votez ici — plus il y a de votes, plus la priorité sera élevée.