KOReader शानदार है। एक चीज़ को छोड़कर।

अगर आपके पास Kindle, Kobo, PocketBook या कोई अन्य ई-इंक डिवाइस है, तो संभावना है कि आपने KOReader के बारे में सुना होगा। GitHub पर 22,700 से अधिक स्टार के साथ, यह ई-इंक हार्डवेयर के लिए सबसे लोकप्रिय ओपन-सोर्स डॉक्यूमेंट रीडर है। यह EPUB, PDF, DJVU, MOBI और CBZ फ़ाइलों को ऐसे कस्टमाइज़ेशन स्तर के साथ संभालता है जो कोई स्टॉक फ़र्मवेयर नहीं दे सकता। फ़ॉन्ट रेंडरिंग, पेज मार्जिन, डिक्शनरी लुकअप, प्रोग्रेस सिंक, जेस्चर कंट्रोल — KOReader लगभग सब कुछ सही करता है।

लगभग सब कुछ। एक स्पष्ट कमी है टेक्स्ट-टू-स्पीच।

GitHub इश्यू #545 2015 में खोला गया था। अभी भी खुला है। इश्यू #11931 ने 2024 में Piper इंटीग्रेशन के विस्तृत प्रस्ताव के साथ इस सवाल को दोबारा उठाया। वह भी अभी खुला है। दोनों थ्रेड्स में टिप्पणियाँ एक ही कहानी बताती हैं: KOReader उपयोगकर्ता TTS चाहते हैं, और वे लंबे समय से इंतज़ार कर रहे हैं।

“मुझे खाना बनाते या यात्रा करते समय अपनी किताबें सुनना अच्छा लगेगा। यही एकमात्र कारण है कि मैं अभी भी KOReader के साथ स्टॉक Kobo फ़र्मवेयर इंस्टॉल रखता हूँ।” — GitHub उपयोगकर्ता, इश्यू #11931
“TTS शायद KOReader के इतिहास में सबसे ज़्यादा माँगी गई सुविधा है। मैंने जो भी उपाय आज़माया है वह भयानक लगता है।” — Reddit, r/ereader

KOReader में TTS क्यों नहीं है

कोशिश की कमी नहीं है। तकनीकी बाधाएँ वास्तविक हैं:

#11931 में प्रस्तावित Piper इंटीग्रेशन सबसे आशाजनक रास्ता है, लेकिन इसके लिए महत्वपूर्ण इंजीनियरिंग कार्य की आवश्यकता है और इसे मर्ज नहीं किया गया है। कोई टाइमलाइन नहीं है।

मौजूदा उपाय (और वे क्यों अपर्याप्त हैं)

KOReader उपयोगकर्ताओं के पास जो आज TTS चाहते हैं, कुछ विकल्प हैं, कोई भी बढ़िया नहीं:

ये सभी उपाय एक ही मूलभूत समस्या साझा करते हैं: आवाज़ की गुणवत्ता लंबे समय तक सुनने लायक नहीं है। 2026 में सिस्टम TTS आवाज़ें एक छोटा नोटिफ़िकेशन पढ़ने के लिए चलती हैं। 10 घंटे के उपन्यास के लिए वे थकाऊ हैं।

MimicReader: KOReader का साथी

विचार सरल है: अपनी KOReader में पढ़ी जा रही EPUB लें, MimicReader पर अपलोड करें, और AI आवाज़ों के साथ एक असली ऑडियोबुक वापस पाएँ — जो इंसानी लगती हैं, भावना, गति और प्राकृतिक उतार-चढ़ाव के साथ। M4A फ़ाइल डाउनलोड करें और किसी भी डिवाइस पर सुनें, अपने ई-रीडर सहित।

MimicReader Chatterbox पर निर्मित एक ईबुक-टू-ऑडियोबुक प्लेटफ़ॉर्म है, एक ओपन-सोर्स न्यूरल TTS इंजन। यह KOReader का प्लगइन नहीं है (अभी नहीं — उसके बारे में नीचे बात करेंगे)। यह एक स्टैंडअलोन सेवा है जो पूरी पाइपलाइन संभालती है: टेक्स्ट एक्सट्रैक्शन, चैप्टर डिटेक्शन, भावनात्मक विश्लेषण, समर्पित GPU हार्डवेयर पर स्पीच सिंथेसिस, Whisper-आधारित क्वालिटी कंट्रोल, और ब्रॉडकास्ट स्टैंडर्ड में ऑडियो नॉर्मलाइज़ेशन।

आउटपुट 23 भाषाओं में चैप्टर-मार्क्ड M4A फ़ाइल है। आप इसे बिल्ट-इन प्लेयर में स्ट्रीम कर सकते हैं या कहीं भी सुनने के लिए डाउनलोड कर सकते हैं — अपने फ़ोन पर, कार में, या अपने ई-रीडर के स्पीकर पर Bluetooth के माध्यम से।

सिस्टम TTS से यह कैसे अलग है

आज इसका उपयोग कैसे करें

KOReader प्लगइन आने तक, यह वर्कफ़्लो है:

  1. अपनी बुक फ़ाइल खोजें। आपके ई-रीडर पर, KOReader किताबें उस डायरेक्टरी में स्टोर करता है जो आपने कॉन्फ़िगर की (अक्सर /mnt/onboard/ या कस्टम फ़ोल्डर)। अपने ई-रीडर को USB से कंप्यूटर से कनेक्ट करें, या बिल्ट-इन फ़ाइल मैनेजर से EPUB ढूँढें।
  2. EPUB ट्रांसफ़र करें। इसे अपने कंप्यूटर या फ़ोन पर कॉपी करें। अगर आप Calibre से अपनी लाइब्रेरी मैनेज करते हैं, तो फ़ाइल पहले से आपके कंप्यूटर पर है।
  3. MimicReader पर अपलोड करें। mimicreader.ai/app पर जाएँ, मुफ्त अकाउंट बनाएँ, और अपना EPUB अपलोड करें। MimicReader PDF, TXT, MOBI और FB2 भी स्वीकार करता है।
  4. अपना ऑडियोबुक जनरेट करें। अपनी लाइब्रेरी में किताब खोलें, जनरेट बटन पर टैप करें, आवाज़ और भाषा चुनें। AI पाइपलाइन बाकी संभालती है। तैयार होने पर आपको नोटिफ़िकेशन मिलेगी।
  5. M4A डाउनलोड करें। इसे अपने ई-रीडर, फ़ोन या किसी भी डिवाइस पर ट्रांसफ़र करें। M4A सपोर्ट करने वाले किसी भी ऑडियो प्लेयर में चलाएँ (जो मूल रूप से सभी हैं)।

फ्री टियर आपको प्रति माह 1 क्रेडिट देता है — लगभग 1 घंटे के ऑडियो के लिए पर्याप्त। यह एक छोटा उपन्यास या लंबे काम के कई चैप्टर हैं। पेड क्रेडिट £1 प्रति घंटा हैं और कभी एक्सपायर नहीं होते।

जल्द आ रहा है: KOReader प्लगइन

हम KOReader के लिए एक Lua प्लगइन बना रहे हैं जो रीडिंग मेनू में सीधे “Send to MimicReader” विकल्प जोड़ेगा। टेक्स्ट या पूरी किताब चुनें, और प्लगइन इसे MimicReader के API पर अपलोड करके जनरेशन की कतार में डाल देगा। जब आपकी ऑडियोबुक तैयार हो, यह स्वचालित रूप से आपके डिवाइस पर डाउनलोड हो जाती है।

यह वही वर्कफ़्लो है जो KOReader उपयोगकर्ता माँग रहे हैं: एक अंश हाइलाइट करें, बटन पर टैप करें, और मानवीय आवाज़ में सुनें — ऐप छोड़े बिना।

प्लगइन विकास में है। अगर आप अर्ली एक्सेस चाहते हैं, तो वेटलिस्ट में शामिल हों और KOReader प्लगइन प्राथमिकता के लिए वोट करें।

वॉइस क्वालिटी: वह रोबोटिक TTS नहीं जिसकी आपको आदत है

अगर TTS के साथ आपका एकमात्र अनुभव Google की सिस्टम वॉइस या Amazon Polly है, तो गुणवत्ता का अंतर आपको चौंकाएगा। MimicReader Chatterbox का उपयोग करता है, एक न्यूरल TTS मॉडल जो प्राकृतिक, अभिव्यंजक भाषण के लिए विशेष रूप से बनाया गया था।

“अंधी प्राथमिकता परीक्षणों में, Chatterbox को ElevenLabs पर 63% बार प्राथमिकता दी जाती है।” — Chatterbox शोध पत्र, Resemble AI

यह मार्केटिंग कॉपी नहीं है — यह मॉडल के प्रकाशित मूल्यांकन से है। Chatterbox प्राकृतिक ठहराव, उचित ज़ोर और उस प्रकार की सूक्ष्म स्वर विविधता के साथ स्पीच बनाता है जो लंबे समय तक सुनने को थकाऊ के बजाय आरामदायक बनाती है।

KOReader उपयोगकर्ताओं के लिए जो सिस्टम TTS से जूझ रहे हैं या पूरी तरह हार मान चुके हैं, यह “मैं इसे पाँच मिनट से ज़्यादा नहीं सुन सकता” और “मैं भूल गया कि यह मानव नैरेटर नहीं था” के बीच का अंतर है।

MimicReader मुफ्त आज़माएँ

अपनी KOReader लाइब्रेरी से EPUB अपलोड करें और AI आवाज़ों का अंतर सुनें। हर महीने 1 मुफ्त घंटा, कोई क्रेडिट कार्ड आवश्यक नहीं।

मुफ्त शुरू करें

KOReader प्लगइन जल्दी चाहिए? यहाँ इसके लिए वोट करें — जितने ज़्यादा वोट, उतनी ज़्यादा प्राथमिकता।