Alternativa TTS para KOReader: Voces de IA que realmente suenan humanas

KOReader es increíble. Excepto por una cosa.

Si tienes un Kindle, Kobo, PocketBook o cualquier otro dispositivo de tinta electrónica, hay una buena probabilidad de que hayas oído hablar de KOReader. Con más de 22.700 estrellas en GitHub, es el lector de documentos de código abierto más popular para hardware de tinta electrónica. Maneja archivos EPUB, PDF, DJVU, MOBI y CBZ con un nivel de personalización que ningún firmware de fábrica puede igualar. Renderizado de fuentes, márgenes de página, búsqueda en diccionario, sincronización de progreso, controles por gestos — KOReader hace casi todo bien.

Casi todo. La única carencia evidente es el texto a voz.

El issue de GitHub #545 se abrió en 2015. Sigue abierto. El issue #11931 revisó la cuestión en 2024 con una propuesta detallada para integrar Piper. También sigue abierto. Los comentarios en ambos hilos cuentan la misma historia: los usuarios de KOReader quieren TTS, y llevan mucho tiempo esperando.

“Me encantaría poder escuchar mis libros mientras cocino o voy al trabajo. Esta es la única razón por la que sigo teniendo el firmware original de Kobo instalado junto a KOReader.” — Usuario de GitHub, issue #11931

“TTS es probablemente la función más solicitada en la historia de KOReader. Cada solución alternativa que he probado suena terrible.” — Reddit, r/ereader

Por qué KOReader no tiene TTS

No es por falta de intentos. Las barreras técnicas son reales:

El hardware de tinta electrónica es limitado. La mayoría de los lectores electrónicos funcionan con procesadores ARM con RAM limitada. Ejecutar un modelo TTS neuronal localmente no es realista en un Kindle Paperwhite o un Kobo Clara. Incluso Piper, que es ligero según los estándares de TTS, tendría problemas en muchos dispositivos.
Sin consenso en la arquitectura. ¿Debería KOReader transmitir TTS desde un servidor? ¿Incluir un motor local? ¿Enviar texto a una app externa? Cada enfoque tiene sus ventajas y desventajas, y los mantenedores no se han decidido por uno.
El hardware de audio varía enormemente. Algunos lectores electrónicos tienen altavoces. Algunos tienen Bluetooth. Algunos no tienen ninguno. Una función de TTS que solo funcione en un subconjunto de dispositivos es difícil de mantener en un proyecto de código abierto.
Las expectativas de calidad han subido. En 2015, las voces TTS del sistema eran la norma. En 2026, la gente espera narración con calidad de IA. Lanzar una voz robótica en KOReader hoy decepcionaría a más usuarios de los que satisfaría.

La integración de Piper propuesta en el #11931 es el camino más prometedor, pero requiere un trabajo de ingeniería significativo y no se ha fusionado. No hay fecha prevista.

Las soluciones actuales (y por qué se quedan cortas)

Los usuarios de KOReader que quieren TTS hoy tienen algunas opciones, ninguna ideal:

Android TTS en dispositivos Boox/Onyx. Si tu lector electrónico ejecuta Android (como Onyx Boox), puedes instalar Google TTS o Samsung TTS y usar @Voice Aloud Reader para leer tus libros. El problema: sales completamente de KOReader, pierdes tu posición de lectura, y las voces son voces genéricas del sistema — planas, monótonas e inconfundiblemente robóticas.
Bluetooth a un teléfono con una app TTS. Algunos usuarios mantienen su teléfono ejecutando una app TTS sincronizada con el mismo libro. Esto requiere gestionar dos dispositivos, dos apps y dos posiciones de lectura. Funciona, apenas.
Calibre + TTS de escritorio. Exportar el libro de KOReader, abrirlo en Calibre en un ordenador y usar una herramienta TTS de escritorio. Funcional pero anula el propósito de tener un lector portátil.

Todas estas soluciones comparten el mismo problema fundamental: la calidad de voz no es lo suficientemente buena para escuchar durante un periodo prolongado. Las voces TTS del sistema en 2026 son aceptables para leer una notificación corta. Son agotadoras para una novela de 10 horas.

MimicReader: El compañero de KOReader

        La idea es simple: Toma el EPUB que estás leyendo en KOReader, súbelo a MimicReader y obtén un audiolibro real con voces de IA — del tipo que suenan humanas, con emoción, ritmo e inflexión natural. Descarga el archivo M4A y escúchalo en cualquier dispositivo, incluido tu lector electrónico.
    

MimicReader es una plataforma de ebook a audiolibro construida sobre Chatterbox, un motor TTS neuronal de código abierto. No es un plugin para KOReader (todavía no — más sobre eso abajo). Es un servicio independiente que maneja todo el pipeline: extracción de texto, detección de capítulos, análisis emocional, síntesis de voz en hardware GPU dedicado, control de calidad basado en Whisper y normalización de audio al estándar de emisión.

El resultado es un archivo M4A con marcadores de capítulo en 23 idiomas. Puedes reproducirlo en el reproductor integrado o descargarlo para escucharlo en cualquier lugar — en tu teléfono, en el coche o en el altavoz de tu lector electrónico por Bluetooth.

Qué lo diferencia del TTS del sistema

Voces neuronales, no concatenativas. Chatterbox genera habla desde cero en lugar de unir fonemas pregrabados. El resultado suena como una persona leyendo, no como un GPS dando indicaciones.
Consciente de las emociones. MimicReader analiza cada pasaje en busca de contenido emocional — tensión, tristeza, emoción, humor — y ajusta la voz en consecuencia. Los diálogos suenan como diálogos. Las escenas de acción aceleran el ritmo.
23 idiomas. Inglés, español, francés, alemán, polaco, japonés, coreano, árabe y 15 más. Los usuarios de KOReader leen en muchos idiomas. MimicReader lo soporta.
Clonación de voz. Sube una muestra de audio de 5 segundos y el motor narrará tu libro con esa voz. ¿Quieres tu audiolibro leído por un narrador específico? Graba un clip corto y deja que la IA haga el resto.

Cómo usarlo hoy

Hasta que se lance el plugin de KOReader, este es el flujo de trabajo:

Encuentra tu archivo de libro. En tu lector electrónico, KOReader almacena libros en un directorio que configuraste (normalmente /mnt/onboard/ o una carpeta personalizada). Conecta tu lector a un ordenador por USB, o usa el gestor de archivos integrado para localizar el EPUB.
Transfiere el EPUB. Cópialo a tu ordenador o teléfono. Si gestionas tu biblioteca con Calibre, el archivo ya está en tu ordenador.
Sube a MimicReader. Ve a mimicreader.ai/app, crea una cuenta gratuita y sube tu EPUB. MimicReader también acepta PDF, TXT, MOBI y FB2.
Genera tu audiolibro. Abre el libro en tu biblioteca, pulsa el botón de generar, elige una voz y un idioma. El pipeline de IA se encarga del resto. Recibirás una notificación cuando esté listo.
Descarga el M4A. Transfiérelo de vuelta a tu lector electrónico, teléfono o cualquier dispositivo. Reprodúcelo en cualquier reproductor de audio que soporte M4A (que son prácticamente todos).

El plan gratuito te da 1 crédito al mes — suficiente para aproximadamente 1 hora de audio. Eso es una novela corta o varios capítulos de una obra más larga. Los créditos de pago cuestan 1€ por hora y nunca caducan.

Próximamente: Plugin de KOReader

Estamos construyendo un plugin en Lua para KOReader que añadirá una opción de “Enviar a MimicReader” directamente en el menú de lectura. Selecciona texto o un libro completo, y el plugin lo subirá a la API de MimicReader y pondrá en cola la generación. Cuando tu audiolibro esté listo, se descargará a tu dispositivo automáticamente.

Este es el flujo de trabajo que los usuarios de KOReader han estado pidiendo: selecciona un pasaje, pulsa un botón y escúchalo leído con una voz humana — sin salir de la app.

El plugin está en desarrollo. Si quieres acceso anticipado, únete a la lista de espera y vota por la prioridad del plugin de KOReader.

Calidad de voz: No es el TTS robótico al que estás acostumbrado

Si tu única experiencia con TTS es la voz del sistema de Google o Amazon Polly, la diferencia de calidad te sorprenderá. MimicReader usa Chatterbox, un modelo TTS neuronal construido específicamente para habla natural y expresiva.

“En pruebas de preferencia ciega, Chatterbox es preferido sobre ElevenLabs el 63% de las veces.” — Artículo de investigación de Chatterbox, Resemble AI

Eso no es texto de marketing — es de la evaluación publicada del modelo. Chatterbox produce habla con pausas naturales, énfasis apropiado y el tipo de variación vocal sutil que hace que la escucha prolongada sea cómoda en lugar de agotadora.

Para los usuarios de KOReader que han estado sufriendo con el TTS del sistema o rindiéndose por completo, esta es la diferencia entre “no puedo escuchar esto más de cinco minutos” y “me olvidé de que esto no era un narrador humano.”

Prueba MimicReader gratis

Sube el EPUB de tu biblioteca de KOReader y escucha la diferencia que hacen las voces de IA. 1 hora gratis cada mes, sin tarjeta de crédito.

Empieza gratis

¿Quieres el plugin de KOReader antes? Vota aquí — cuantos más votos, mayor la prioridad.