무료 AI 글쓰기 코파일럿: 초고에서 로컬 모델이 Sudowrite를 이기는 이유

그 순간

밤 11시. 챕터에 600단어쯤 써놓고, “그녀는 알았다, 꿈속에서 무언가를 알듯이, …”로 시작하는 문장에서 막혔습니다. 머릿속이 텅 빕니다. 다음 단락을 매직 8볼이 대신 써주길 바라는 건 아니에요. 그저 살짝 밀어주는 힘이 필요할 뿐. 읽고 반응할 무언가. 이렇게 속삭이는 작은 거울: “…그 문은 그녀가 손잡이를 돌리든 말든 열려 있을 거라는 것을.”

1.5초 멈춥니다. 회색 이탤릭의 ‘유령’이 인라인으로 나타납니다. 맞으면 Tab. 아니면 Esc, 아니면 그냥 계속 타이핑하면 됩니다 — 사라집니다. 인터랙션은 그게 전부예요. 무료. 우리 하드웨어에서 돌아갑니다. 반대편에서 누가 당신의 초고를 읽고 있지 않습니다.

이게 바로 AI co-writer를 켠 MimicReader 글쓰기 스튜디오입니다. 그리고 똑같은 아이디어를 두고 Sudowrite가 받는 가격과 비교해 보면, 솔직히 Sudowrite 입장에서 부끄러울 정도예요.

Sudowrite 세금

Sudowrite는, 비교적 얇은 기술 제품을 훌륭한 마케팅으로 감싼 것에 가깝습니다. 2026년 중반 기준 가격 구조:

최소 월 $19 (약 2만 6천원), “Hobby and Student” 플랜
월 22만 5천 크레딧 — 엄청나 보이지만, 그들의 Story Engine은 몇 번의 세션이면 다 먹어 치웁니다
헤비 유저는 더 큰 플랜($29, $59, $129)을 사야 합니다 — 한도가 안 차게 하려면요
생성할 때마다 원고는 OpenAI로 전송됩니다 — Sudowrite는 결국 래퍼입니다

마지막 항목은 마케팅에서 슬쩍 가려지는 부분이에요. Sudowrite는 자체 모델이 없습니다. 뒤에서 OpenAI API를 호출합니다. 작업 중인 원고 — 편집자에게 보여주기 부끄러운 반쪽짜리 장면까지 포함해서 — 는 OpenAI 서버로 떠나고, 거기서 처리되고, 완성된 부분이 돌아옵니다. OpenAI의 엔터프라이즈 약관은 API 데이터로 학습하지 않는다고 적혀 있죠. 엔터프라이즈 약관을 신뢰하는 분에게는 위안이 됩니다. (이 약관, 이번 10년에 이미 두 번 바뀌었지만요.)

NovelCrafter는 살짝 저렴한 변형판입니다: 구독 월 $7(약 9천원), 그리고 본인의 OpenAI 또는 Anthropic API 키를 가져와서 생성마다 그들에게 직접 결제합니다. 데이터 흐름은 똑같아요 — 원고는 여전히 당신이 그것을 작성한 플랫폼 밖으로 나갑니다.

‘로컬 모델’이 진짜 의미하는 것

MimicReader의 AI co-writer는 OpenAI를 호출하지 않습니다. Anthropic도 호출하지 않습니다. Llama 계열 모델 — 정확히는 gemma3:4b — 을 두드리는데, 그건 스코틀랜드에 있는 우리 서버실의 우리 RTX 3090에서 돌아갑니다.

당신이 타이핑을 잠시 멈추면 에디터는 초고의 최근 ~500단어를 192.168.20.155:11434(VPS에서 WireGuard 터널 경유)로 보내고, 10~30단어짜리 이어쓰기를 받아와서 인라인 회색 이탤릭으로 그려냅니다. 전체 경로:

당신의 브라우저 → MimicReader VPS (Cloudflare 통해 HTTPS)
VPS → 우리의 GPU 서버 (암호화된 WireGuard 터널, 내부망)
GPU 서버에서 Ollama가 gemma3:4b로 이어쓰기를 생성
생성 결과가 같은 경로로 돌아옴
회색 이탤릭 텍스트가 에디터에 표시됨

제3자 AI 제공자는 전혀 끼지 않습니다. OpenAI는 당신의 문장을 본 적이 없습니다. Anthropic도 본 적이 없습니다. 이론적으로 당신의 원고를 볼 수 있는 사람은 우리뿐인데, 우리는 요청 본문을 로깅하지 않습니다 — 모델에 도달하면 응답이 만들어지는 순간 페이로드는 사라집니다. (요청이 있었다는 사실은 로깅합니다, 레이트 리밋 때문에요. 그 안에 뭐가 있었는지는 로깅하지 않습니다.)

        왜 이게 중요하냐면: 장르 소설, 에로티카, 민감한 회고록, 또는 글 자체가 자산이 되는 무언가를 쓰고 있다면, 제3자 LLM에 가는 API 호출 한 번 한 번은 모두 당신의 초고가 남의 하드웨어 위에 존재하는 순간입니다. 그런 상황에서 완전히 제정신인 선택지는 로컬 모델 하나뿐이에요.
    

솔직한 비교: 로컬이 좋을 때, 그렇지 않을 때

gemma3:4b를 과대 포장할 생각은 없습니다. 40억 파라미터의 오픈 웨이트 모델입니다. Claude 4.7이 아닙니다. GPT-5도 아닙니다. 정직한 매트릭스는 이렇습니다:

작업	로컬 gemma3:4b	대형 클라우드 모델
이 문장을 마무리 (5-15단어)	훌륭함	훌륭함
이 단락을 마무리 (20-40단어)	좋음	훌륭함
다음 단락을 처음부터 초안	괜찮음	훌륭함
한 챕터 전체 초안	그저 그럼 — Workshop 쓰세요	훌륭함 — Workshop 쓰세요
1000단어에 걸쳐 톤 유지	흐트러짐	덜 흐트러지고, 사라지진 않음
50챕터 개요 짜기	하지 마세요	AI Workshop / Claude 쓰세요

고스트 텍스트는 의도적으로 초록 열 안에만 머물도록 만들어졌습니다. 두뇌가 한 박자 쉬고 ‘마무리 한 조각’이 필요한 그 순간을 위한 도구지, 챕터 초안을 위한 도구가 아닙니다. 챕터 초안이 필요하다면, MimicReader 안에 AI Workshop이라는 다른 기능이 있어요. 거기서는 Claude나 Gemini를 사용합니다 (유료, 당신의 크레딧 차감). 구조적 드래프팅을 고품질로 해주는 도구죠. 두 가지를 모두 쥐여주고, 어떤 순간에 무엇이 맞는지는 당신이 고르도록 합니다.

하루의 대부분을 AI에게 “다음 500단어 써줘”라고 부탁하며 보낸다면, 고스트 텍스트가 아니라 Workshop이 필요한 거예요. 하루의 대부분을 직접 쓰고 가끔 마무리 한 줄의 도움이 필요한 정도라면, 고스트 텍스트만으로 충분하고 Workshop은 평생 안 건드릴 수도 있습니다. 둘 다 모든 계정에 기본 포함입니다.

레이턴시의 현실: ~400ms

1.5초 멈춤. 요청이 날아갑니다. 모델은 약 400밀리초 만에 응답합니다. 마지막 키 입력부터 회색 텍스트가 뜨기까지 총 시간 — 2초가 채 안 됩니다. 에디터가 한 호흡 뒤에서 당신의 생각을 읽고 있다는 느낌이 들어요.

비교를 위해 말하자면, 클라우드 API는 보통 단대단 1~3초 정도 걸립니다 (OpenAI 대형 모델은 더 길어요). Sudowrite의 “Write” 명령은 서버 측에서 여러 번의 생성을 체이닝하느라 5~15초가 흔합니다. MimicReader의 고스트 텍스트가 빠른 건 모델이 작고 요청 옆방에 살고 있기 때문이에요.

Tab으로 수락. Esc로 거절. 주도권은 당신이.

인터랙션은 의도적으로 최소화했습니다:

Tab — 제안 수락, 회색 텍스트가 진짜 텍스트가 되고 커서는 끝으로
Esc — 거절, 제안이 사라지고 계속 타이핑
그냥 계속 타이핑 — 다른 키를 누른 순간 제안은 자동으로 사라짐

자동 삽입은 절대 일어나지 않습니다. AI는 명시적인 Tab 없이 초고를 건드리지 않습니다. 회색 텍스트를 안 쳐다보고 계속 타이핑하면, 처음부터 없었던 것처럼 사라집니다. 많은 작가들이 기능을 켜놓고 그 존재를 잊어버린 채로 쓰다가, 에디터가 가끔 괜찮은 제안으로 놀라게 할 때 받아들이곤 하는데 — 그게 올바른 사용법이에요.

고스트 텍스트는 사용자당 분당 60회의 슬라이딩 윈도우 레이트 리밋이 걸려 있습니다. 실용적으로는 1분 내내 매초 멈췄다가 제안을 띄워도 상한에 닿지 않아요. 그런 식으로 쓰는 사람은 없습니다. 이 제한은 작가가 아니라 봇을 막기 위한 것입니다.

프라이버시: 진짜로 신경 써야 하는 이유

클라우드 AI는 코드에는 괜찮고, 이메일에도 괜찮고, 당신 업무 중 지루한 절반에는 괜찮습니다. 그런데 아직 확신이 없는 원고에는 괜찮지 않습니다.

구체적으로 — 에로티카 작가, 원고에 아직 살아 있는 가족이 등장하는 회고록 작가, 어두운 주제(실화 범죄, 학대, 중독)를 다루는 픽션 작가, NDA에 묶인 전문 작가, 변호 의견서를 쓰는 변호사, 내담자에 대한 일지를 쓰는 치료사, 엠바고 상태의 무언가를 다루는 모든 사람, 클라우드 제공자의 안전 필터가 이해하지 못하는 문화적 민감성을 가진 언어로 쓰는 사람 — 이들 모두에게, 클라우드 API 호출 한 번은 스스로 떠안기로 한 작은 리스크입니다.

로컬 모델은 그 리스크의 부재입니다. OpenAI의 개인정보 처리방침을 믿어달라고 하지 않습니다. Anthropic의 엔터프라이즈 약관을 믿어달라고도 하지 않습니다. 우리가 부탁하는 건, 우리 GPU에서 돌아가는 모델이 우리 GPU 밖으로 나가는 네트워크 경로를 갖고 있지 않다는 사실을 믿어달라는 겁니다. (실제로 없습니다. Ollama 프로세스는 사설망의 192.168.20.155:11434에 바인딩되어 있고, VPS는 WireGuard 터널로 그곳에 도달합니다. 추론 트래픽이 GPU에서 공용 인터넷으로 나가는 통로는 존재하지 않습니다.)

왜 우리가 GPU 시간을 떠안는가

솔직히 말하면, 영국 전기요금 기준으로 고스트 텍스트 한 번 완성에 약 £0.001의 전기료가 듭니다. 사용자당 분당 60회 제한 안에서, 그 기능을 최대치로 가동하며 네 시간 연속 글을 쓰는 헤비 작가가 있다 해도 전기료는 £1 정도일 거예요 — 게다가 그 사람은 같은 계정에서 오디오북도 만들고 있을 확률이 높습니다 (그쪽이 실제로 돈이 되는 곳이고요). 고스트 텍스트는 플랫폼을 더 ‘끈끈하게’ 만드는 기능이고, 비용 시트에는 거의 잡히지 않습니다. 그래서 수익화하는 걸 포기하고 그냥 무료로 만들었습니다.

Sudowrite가 고스트 텍스트에 월 $19를 받는 건, 호출마다 OpenAI에 비용을 지불해야 하기 때문이에요. 그들의 마진은 당신의 구독을 필요로 합니다. 우리는 OpenAI에 돈을 내지 않습니다. 전기 요금을 냅니다. 경제 구조 자체가 다른 거죠 — 그리고 솔직히 그 $19(약 2만 6천원)는 진짜로 비용이 발생하는 오디오북 생성용 크레딧 팩에 쓰는 게 우리도 더 좋습니다.

활성화 방법

MimicReader 앱 안에서:

설정 열기
글쓰기 스튜디오까지 스크롤
AI co-writer (고스트 텍스트) 켜기
아무 프로젝트나 열고 쓰기 시작 — 제안이 필요할 때 1.5초 멈춤

언제든 끌 수 있습니다. 설정은 사용자별이고, 기기 간에 유지됩니다. 이 기능은 글쓰기 스튜디오의 다른 환경설정(글꼴, 테마, 기본 챕터 휴식 등)과 같은 패널에 있습니다.

고스트 텍스트, 그냥 한 번 써보세요 — 거기 있습니다

무료 계정, 신용카드 없이, AI co-writer는 첫날부터 포함입니다. 음성 메모, 원고 편집, 표지 생성, 월 1시간 오디오북 생성도 마찬가지예요.

무료로 글쓰기 시작

고스트 텍스트가 하지 않는 것들

우리가 만든 것과 만들지 않은 것을 분명히 해두자면:

교정은 안 합니다 — 그건 별도 기능입니다 (그리고 솔직히, 사람을 고용하세요)
단락 경계를 안정적으로 넘어가지 않습니다 — 지금 쓰고 있는 한 생각을 마무리하는 데 튜닝되어 있어요
당신의 원고 전체를 알지 못합니다 — 컨텍스트로 보는 건 최근 ~500단어이지 1장이 아닙니다
긴 구간에 걸쳐 인물의 목소리를 유지하지 못합니다 — 훨씬 어려운 AI 문제고, 4B 모델은 거기까지 못 갑니다
대량으로 다시 쓰지 않습니다 — 그런 작업은 더 상위 모델로 AI Workshop을 쓰세요

한 가지만 합니다 — 당신이 멈췄을 때 작은 인라인 이어쓰기 — 그걸 잘, 빠르게, 무료로, 그리고 비공개로요.

다음으로 읽으면 좋은 글

소설을 쓰고 같은 자리에서 오디오북까지 — 글쓰기 플랫폼으로서의 MimicReader 전반에 대한 이야기
2026년, 진짜 무료인 AI 오디오북 생성기들 — 어디까지가 정말 무료고 어디까지가 마케팅인가
음성 메모에서 오디오북까지: 4단계 풀 파이프라인 — 녹음, 초고, 패키징, 내레이션