KOReader jest świetny. Z wyjątkiem jednej rzeczy.
Jeśli posiadasz Kindle, Kobo, PocketBook lub jakiekolwiek inne urządzenie e-ink, jest duża szansa, że słyszałeś o KOReader. Z ponad 22 700 gwiazdkami na GitHubie to najpopularniejszy open-source'owy czytnik dokumentów dla sprzętu e-ink. Obsługuje pliki EPUB, PDF, DJVU, MOBI i CBZ z poziomem personalizacji, jakiego żaden fabryczny firmware nie może dorównać. Renderowanie czcionek, marginesy stron, wyszukiwanie w słowniku, synchronizacja postępu, sterowanie gestami — KOReader robi prawie wszystko dobrze.
Prawie wszystko. Jedyną rażącą luką jest tekst na mowę.
Zgłoszenie na GitHubie #545 zostało otwarte w 2015 roku. Nadal jest otwarte. Zgłoszenie #11931 wróciło do tematu w 2024 roku ze szczegółową propozycją integracji Piper. Też nadal otwarte. Komentarze w obu wątkach mówią to samo: użytkownicy KOReader chcą TTS i czekają już bardzo długo.
„Chciałbym móc słuchać książek podczas gotowania lub dojazdów do pracy. To jedyny powód, dla którego wciąż trzymam fabryczny firmware Kobo zainstalowany obok KOReader.” — użytkownik GitHuba, zgłoszenie #11931
„TTS to prawdopodobnie najczęściej zgłaszana prośba w historii KOReader. Każde obejście, którego próbowałem, brzmi fatalnie.” — Reddit, r/ereader
Dlaczego KOReader nie ma TTS
Nie z braku prób. Bariery techniczne są realne:
- Sprzęt e-ink jest słaby. Większość czytników ebooków działa na procesorach ARM z ograniczoną pamięcią RAM. Uruchomienie neuronowego modelu TTS lokalnie nie jest realistyczne na Kindle Paperwhite czy Kobo Clara. Nawet Piper, który jest lekki jak na standardy TTS, miałby problemy na wielu urządzeniach.
- Brak konsensusu w architekturze. Czy KOReader powinien streamować TTS z serwera? Dołączyć lokalny silnik? Przekazywać tekst do zewnętrznej aplikacji? Każde podejście ma swoje wady i zalety, a opiekunowie projektu nie osiągnęli porozumienia.
- Sprzęt audio jest bardzo zróżnicowany. Niektóre czytniki mają głośniki. Niektóre mają Bluetooth. Niektóre nie mają ani jednego. Funkcja TTS, która działa tylko na części urządzeń, jest trudna do utrzymania w projekcie open-source.
- Oczekiwania co do jakości wzrosły. W 2015 roku systemowe głosy TTS były normą. W 2026 roku ludzie oczekują narracji w jakości AI. Wypuszczenie robotycznego głosu w KOReader dziś rozczarowałoby więcej użytkowników, niż by zadowoliło.
Integracja Piper zaproponowana w #11931 to najbardziej obiecująca ścieżka, ale wymaga znacznej pracy inżynieryjnej i nie została jeszcze wdrożona. Nie ma żadnego harmonogramu.
Obecne obejścia (i dlaczego nie wystarczają)
Użytkownicy KOReader, którzy chcą TTS już dziś, mają kilka opcji, z których żadna nie jest świetna:
- Android TTS na urządzeniach Boox/Onyx. Jeśli Twój czytnik działa na Androidzie (jak Onyx Boox), możesz zainstalować Google TTS lub Samsung TTS i użyć @Voice Aloud Reader do czytania książek. Problem: opuszczasz KOReader całkowicie, tracisz pozycję w czytaniu, a głosy to generyczne głosy systemowe — płaskie, monotonne i bezapelacyjnie robotyczne.
- Bluetooth do telefonu z aplikacją TTS. Niektórzy użytkownicy trzymają telefon z uruchomioną aplikacją TTS zsynchronizowaną z tą samą książką. Wymaga to zarządzania dwoma urządzeniami, dwoma aplikacjami i dwoma pozycjami czytania. Działa, ledwo.
- Calibre + desktopowy TTS. Wyeksportuj książkę z KOReader, otwórz ją w Calibre na komputerze i użyj desktopowego narzędzia TTS. Funkcjonalne, ale przeczy idei posiadania przenośnego czytnika.
Wszystkie te obejścia mają ten sam fundamentalny problem: jakość głosu nie jest wystarczająco dobra, by słuchać przez dłuższy czas. Systemowe głosy TTS w 2026 roku są znośne do przeczytania krótkiego powiadomienia. Są wyczerpujące dla 10-godzinnej powieści.
MimicReader: kompan dla KOReader
MimicReader to platforma do zamiany ebooków na audiobooki zbudowana na Chatterbox, open-source'owym neuronowym silniku TTS. To nie jest wtyczka do KOReader (jeszcze nie — więcej o tym poniżej). To samodzielna usługa, która obsługuje cały pipeline: ekstrakcję tekstu, wykrywanie rozdziałów, analizę emocji, syntezę mowy na dedykowanym sprzęcie GPU, kontrolę jakości opartą na Whisper i normalizację audio do standardu nadawczego.
Wynikiem jest plik M4A ze znacznikami rozdziałów w 23 językach. Możesz go streamować we wbudowanym odtwarzaczu lub pobrać, by słuchać gdziekolwiek — na telefonie, w samochodzie lub przez głośnik czytnika e-ink po Bluetooth.
Co odróżnia go od systemowego TTS
- Głosy neuronowe, nie konkatentywne. Chatterbox generuje mowę od zera, zamiast sklejać nagrane fonemy. Rezultat brzmi jak osoba czytająca, a nie nawigacja GPS podająca kierunki.
- Świadomość emocji. MimicReader analizuje każdy fragment pod kątem treści emocjonalnej — napięcie, smutek, podekscytowanie, humor — i odpowiednio dostosowuje głos. Dialog brzmi jak dialog. Sceny akcji przyspieszają tempo.
- 23 języki. Angielski, hiszpański, francuski, niemiecki, polski, japoński, koreański, arabski i 15 innych. Użytkownicy KOReader czytają w wielu językach. MimicReader to wspiera.
- Klonowanie głosu. Wgraj 5-sekundową próbkę audio, a silnik odczyta Twoją książkę tym głosem. Chcesz, żeby audiobook czytał konkretny narrator? Nagraj krótki klip i pozwól AI zrobić resztę.
Jak korzystać z tego już dziś
Dopóki wtyczka do KOReader nie zostanie wydana, oto jak wygląda proces:
- Znajdź plik książki. Na czytniku e-ink KOReader przechowuje książki w katalogu, który skonfigurowałeś (często
/mnt/onboard/lub niestandardowy folder). Podłącz czytnik do komputera przez USB lub użyj wbudowanego menedżera plików, by zlokalizować EPUB. - Przenieś EPUB. Skopiuj go na komputer lub telefon. Jeśli zarządzasz biblioteką Calibre, plik jest już na komputerze.
- Wgraj do MimicReader. Wejdź na mimicreader.ai/app, załóż darmowe konto i wgraj EPUB. MimicReader akceptuje również PDF, TXT, MOBI i FB2.
- Wygeneruj audiobook. Otwórz książkę w bibliotece, kliknij przycisk generowania, wybierz głos i język. Pipeline AI zajmie się resztą. Otrzymasz powiadomienie, gdy będzie gotowe.
- Pobierz M4A. Przenieś go z powrotem na czytnik e-ink, telefon lub dowolne urządzenie. Odtwórz w dowolnym odtwarzaczu audio obsługującym M4A (czyli praktycznie we wszystkich).
Darmowy plan daje 1 kredyt miesięcznie — wystarczający na około 1 godzinę audio. To krótka powieść lub kilka rozdziałów dłuższej książki. Płatne kredyty kosztują 1 £ za godzinę i nigdy nie wygasają.
Wkrótce: wtyczka do KOReader
Budujemy wtyczkę Lua dla KOReader, która doda opcję „Wyślij do MimicReader” bezpośrednio w menu czytania. Zaznacz tekst lub całą książkę, a wtyczka wgra ją do API MimicReader i doda do kolejki generowania. Gdy audiobook będzie gotowy, automatycznie pobierze się na urządzenie.
To jest dokładnie ten workflow, o który użytkownicy KOReader proszą: zaznacz fragment, kliknij przycisk i usłysz go odczytanego ludzkim głosem — nie opuszczając aplikacji.
Wtyczka jest w fazie rozwoju. Jeśli chcesz wczesny dostęp, dołącz do listy oczekujących i zagłosuj na priorytet wtyczki KOReader.
Jakość głosu: to nie ten robotyczny TTS, do którego przywykłeś
Jeśli Twoje jedyne doświadczenie z TTS to głos systemowy Google lub Amazon Polly, różnica w jakości Cię zaskoczy. MimicReader używa Chatterbox, neuronowego modelu TTS zaprojektowanego specjalnie do naturalnej, ekspresyjnej mowy.
„W ślepych testach preferencji Chatterbox jest preferowany wobec ElevenLabs w 63% przypadków.” — artykuł badawczy Chatterbox, Resemble AI
To nie tekst marketingowy — to z opublikowanej ewaluacji modelu. Chatterbox tworzy mowę z naturalnymi pauzami, odpowiednim akcentem i subtelnymi wariacjami wokalnymi, które czynią długie słuchanie komfortowym, a nie męczącym.
Dla użytkowników KOReader, którzy cierpieli przy systemowym TTS lub całkowicie z niego zrezygnowali, to jest różnica między „nie mogę tego słuchać dłużej niż pięć minut” a „zapomniałem, że to nie ludzki narrator.”
Wypróbuj MimicReader za darmo
Wgraj EPUB z biblioteki KOReader i przekonaj się, jaką różnicę robią głosy AI. 1 darmowa godzina co miesiąc, bez karty kredytowej.
Zacznij za darmoChcesz, żeby wtyczka do KOReader pojawiła się szybciej? Zagłosuj tutaj — im więcej głosów, tym wyższy priorytet.