KOReader는 대단합니다. 한 가지만 빼면.

Kindle, Kobo, PocketBook 또는 다른 전자잉크 기기를 소유하고 있다면, KOReader에 대해 들어보셨을 가능성이 높습니다. GitHub에서 22,700개 이상의 별을 받은 전자잉크 하드웨어용 가장 인기 있는 오픈소스 문서 리더입니다. EPUB, PDF, DJVU, MOBI, CBZ 파일을 기본 펌웨어가 따라올 수 없는 수준의 커스터마이징으로 처리합니다. 글꼴 렌더링, 페이지 여백, 사전 검색, 진행 상황 동기화, 제스처 제어 — KOReader는 거의 모든 것을 제대로 합니다.

거의 모든 것. 유일하게 눈에 띄는 공백이 음성 합성입니다.

GitHub 이슈 #545는 2015년에 열렸습니다. 아직 열려 있습니다. 이슈 #11931은 2024년에 Piper 통합에 대한 상세한 제안과 함께 이 질문을 재검토했습니다. 역시 아직 열려 있습니다. 두 스레드의 댓글은 같은 이야기를 말합니다: KOReader 사용자들은 TTS를 원하며, 오랫동안 기다려왔습니다.

“요리하거나 출퇴근할 때 책을 들을 수 있으면 좋겠어요. KOReader와 함께 기본 Kobo 펌웨어를 계속 설치해 두는 유일한 이유입니다.” — GitHub 사용자, 이슈 #11931
“TTS는 아마 KOReader 역사상 가장 많이 요청된 기능일 겁니다. 시도해 본 모든 우회 방법이 끔찍하게 들려요.” — Reddit, r/ereader

KOReader에 TTS가 없는 이유

노력이 부족해서가 아닙니다. 기술적 장벽이 현실적입니다:

#11931에서 제안된 Piper 통합이 가장 유망한 전진 경로이지만, 상당한 엔지니어링 작업이 필요하며 아직 머지되지 않았습니다. 타임라인은 없습니다.

현재의 우회 방법 (그리고 왜 부족한지)

오늘 TTS를 원하는 KOReader 사용자에게는 몇 가지 옵션이 있지만, 어느 것도 좋지 않습니다:

이 모든 우회 방법은 같은 근본적인 문제를 공유합니다: 음성 품질이 오랫동안 듣기에 충분하지 않습니다. 2026년의 시스템 TTS 음성은 짧은 알림을 읽기에는 쓸 만합니다. 10시간짜리 소설에는 지치게 됩니다.

MimicReader: KOReader의 동반자

아이디어는 간단합니다: KOReader에서 읽고 있는 EPUB을 MimicReader에 업로드하고, 감정, 페이싱, 자연스러운 억양이 담긴 AI 음성으로 제대로 된 오디오북을 받으세요. M4A 파일을 다운로드하여 전자책 리더를 포함한 어떤 기기에서든 들으세요.

MimicReader는 오픈소스 신경망 TTS 엔진인 Chatterbox를 기반으로 한 전자책-오디오북 플랫폼입니다. KOReader 플러그인은 아닙니다 (아직은요 — 아래에서 자세히). 전체 파이프라인을 처리하는 독립 서비스입니다: 텍스트 추출, 챕터 감지, 감정 분석, 전용 GPU 하드웨어에서의 음성 합성, Whisper 기반 품질 관리, 방송 표준으로의 오디오 정규화.

출력은 23개 언어의 챕터 마커가 포함된 M4A 파일입니다. 내장 플레이어에서 스트리밍하거나 다운로드하여 어디서든 들을 수 있습니다 — 폰에서, 차에서, 또는 전자책 리더의 스피커에서 블루투스로.

시스템 TTS와 다른 점

현재 사용 방법

KOReader 플러그인이 출시되기 전까지의 워크플로우는 다음과 같습니다:

  1. 책 파일을 찾으세요. 전자책 리더에서 KOReader는 설정한 디렉토리에 책을 저장합니다 (보통 /mnt/onboard/ 또는 사용자 정의 폴더). 전자책 리더를 USB로 컴퓨터에 연결하거나 내장 파일 관리자로 EPUB을 찾으세요.
  2. EPUB을 전송하세요. 컴퓨터나 폰으로 복사합니다. Calibre로 라이브러리를 관리하고 있다면 파일은 이미 컴퓨터에 있습니다.
  3. MimicReader에 업로드하세요. mimicreader.ai/app에 접속하여 무료 계정을 만들고 EPUB을 업로드하세요. MimicReader는 PDF, TXT, MOBI, FB2도 지원합니다.
  4. 오디오북을 생성하세요. 라이브러리에서 책을 열고 생성 버튼을 탭한 다음, 음성과 언어를 선택합니다. AI 파이프라인이 나머지를 처리합니다. 준비되면 알림을 받게 됩니다.
  5. M4A를 다운로드하세요. 전자책 리더, 폰, 어떤 기기로든 전송합니다. M4A를 지원하는 아무 오디오 플레이어에서 재생하세요 (사실상 거의 모든 플레이어).

무료 등급은 월 1크레딧을 제공합니다 — 약 1시간의 오디오에 해당합니다. 짧은 소설이나 긴 작품의 여러 챕터에 충분합니다. 유료 크레딧은 시간당 £1이며 만료되지 않습니다.

출시 예정: KOReader 플러그인

읽기 메뉴에 “MimicReader로 보내기” 옵션을 추가하는 KOReader용 Lua 플러그인을 개발 중입니다. 텍스트나 책 전체를 선택하면 플러그인이 MimicReader의 API에 업로드하고 생성을 대기열에 넣습니다. 오디오북이 준비되면 자동으로 기기에 다운로드됩니다.

이것이 KOReader 사용자들이 요청해온 워크플로우입니다: 구절을 선택하고, 버튼을 탭하고, 앱을 떠나지 않고 사람의 목소리로 읽어주는 것을 듣는 것.

플러그인은 개발 중입니다. 조기 접근을 원하시면 대기자 명단에 등록하고 KOReader 플러그인 우선순위에 투표하세요.

음성 품질: 익숙한 로봇 TTS가 아닙니다

TTS 경험이 Google 시스템 음성이나 Amazon Polly뿐이라면 품질 차이에 놀랄 것입니다. MimicReader는 자연스럽고 표현력 있는 음성을 위해 특별히 제작된 신경망 TTS 모델인 Chatterbox를 사용합니다.

“블라인드 선호도 테스트에서 Chatterbox는 ElevenLabs보다 63%의 경우에 선호되었습니다.” — Chatterbox 연구 논문, Resemble AI

이것은 마케팅 카피가 아닙니다 — 모델의 공개된 평가에서 나온 것입니다. Chatterbox는 자연스러운 쉼, 적절한 강조, 장시간 청취를 피로하지 않고 편안하게 만드는 미묘한 음성 변화가 있는 음성을 생성합니다.

시스템 TTS를 참아왔거나 완전히 포기한 KOReader 사용자에게 이것은 “5분 이상 들을 수 없다”와 “사람 내레이터가 아닌 줄 잊었다”의 차이입니다.

MimicReader 무료 체험

KOReader 라이브러리의 EPUB을 업로드하고 AI 음성의 차이를 직접 들어보세요. 매월 무료 1시간, 신용카드 불필요.

무료로 시작하기

KOReader 플러그인을 더 빨리 원하시나요? 여기서 투표하세요 — 투표가 많을수록 우선순위가 높아집니다.