El momento

Son las 23:00. Llevas 600 palabras de un capítulo y te has quedado atascado en una frase que empieza por «Sabía, como se saben las cosas en los sueños, que…» — y tu cerebro se ha vaciado. No quieres que un Magic 8-Ball te escriba el siguiente párrafo. Quieres un empujón. Algo que leer y a lo que reaccionar. Un pequeño espejo que diga: «…que la puerta estaría abierta tanto si giraba la manilla como si no.»

Haces una pausa de segundo y medio. El fantasma gris en cursiva aparece inline. Si encaja, Tab. Si no, Esc, o simplemente sigue escribiendo — desaparece. Esa es toda la interacción. Es gratis. Corre en nuestro hardware. Nadie lee tu borrador del otro lado.

Esto es el Writing Studio de MimicReader con el interruptor AI co-writer activado. Y el contraste con lo que cobra Sudowrite por la misma idea es, francamente, vergonzoso para Sudowrite.

El impuesto Sudowrite

Sudowrite es un marketing excelente envolviendo un producto técnico bastante delgado. La estructura de precios a mediados de 2026:

Ese último punto queda disimulado en el marketing. Sudowrite no tiene modelo propio. Llama a la API de OpenAI por detrás. Tu manuscrito en curso — incluidas las escenas a medio escribir que te avergonzaría enseñar a tu editor — viaja a los servidores de OpenAI, allí se procesa, y la continuación vuelve. Las condiciones enterprise de OpenAI dicen que no entrenan con datos de API, lo cual tranquiliza si confías en condiciones enterprise. (Ya las han cambiado dos veces en esta década.)

NovelCrafter es la variante un poco más barata: $7/mes (unos 6,50 €) por la suscripción, y luego traes tu propia clave de OpenAI o Anthropic y les pagas directamente por cada generación. Mismo flujo de datos — tu prosa sigue saliendo de la plataforma donde la has escrito.

Qué significa realmente «modelo local»

El AI co-writer de MimicReader no llama a OpenAI. No llama a Anthropic. Llama a un modelo de la familia Llama — concretamente gemma3:4b — corriendo en nuestra propia RTX 3090 en nuestra propia sala de servidores en Escocia.

Cuando haces una pausa al teclear, el editor manda las últimas ~500 palabras de tu borrador a 192.168.20.155:11434 (por túnel WireGuard desde el VPS), recibe una continuación de 10-30 palabras y la renderiza como texto gris en cursiva inline. La ruta completa:

  1. Tu navegador → VPS de MimicReader (HTTPS por Cloudflare)
  2. VPS → nuestro servidor GPU (túnel WireGuard cifrado, red interna)
  3. El servidor GPU ejecuta Ollama con gemma3:4b, genera la continuación
  4. La continuación vuelve por la misma ruta
  5. El texto gris en cursiva aparece en tu editor

Ningún proveedor de IA externo está implicado. OpenAI nunca ve tu frase. Anthropic nunca ve tu frase. Las únicas personas que teóricamente podrían ver tu prosa somos nosotros, y no registramos las solicitudes — entran al modelo y el payload se va en el momento en que se genera la respuesta. (Registramos que hubo una solicitud, para el rate limit. No registramos qué contenía.)

Por qué importa: si escribes ficción de género, erótica, una memoria delicada o cualquier cosa donde la prosa en sí es el activo, cada llamada a una API de un LLM externo es un momento en que tu borrador existe en hardware ajeno. El modelo local es la única opción plenamente sensata.

Comparativa honesta: cuándo lo local es genial y cuándo no

No vamos a sobrevender gemma3:4b. Es un modelo de 4 mil millones de parámetros con pesos abiertos. No es Claude 4.7. No es GPT-5. Aquí va la matriz honesta:

TareaLocal gemma3:4bModelo grande en la nube
Termina esta frase (5-15 palabras)ExcelenteExcelente
Termina este párrafo (20-40 palabras)BuenoExcelente
Redacta el siguiente párrafo desde ceroDecenteExcelente
Redacta un capítulo completoMediocre — usa WorkshopExcelente — usa Workshop
Mantener consistencia de voz durante 1000 palabrasDerivaDeriva menos, no se desvanece
Planificar un esquema de 50 capítulosNo lo hagasUsa AI Workshop / Claude

El ghost text está intencionadamente acotado a la columna verde. Existe para ese momento en el que tu cerebro se detiene y quieres un fragmento de cierre, no un borrador de capítulo. Cuando quieras borradores de capítulo — eso es otra función dentro de MimicReader llamada AI Workshop, que usa Claude o Gemini (de pago, tus créditos) para redacción estructural de alta calidad. Te damos las dos herramientas y dejamos que elijas la adecuada para cada momento.

Si pasas la mayor parte del día pidiéndole a la IA que «escriba las próximas 500 palabras», no quieres ghost text — quieres Workshop. Si pasas la mayor parte del día escribiendo tú y de vez en cuando quieres un empujoncito de cierre, quieres ghost text y nunca tocarás Workshop. Ambas vienen incluidas en cada cuenta.

Realidad de la latencia: ~400 ms

Pausa de 1,5 segundos. La petición sale disparada. El modelo responde en unos 400 milisegundos. Tiempo total desde tu última tecla hasta que aparece el texto gris: poco menos de 2 segundos. Da la sensación de que el editor te lee la mente con un respiro de retraso.

Para comparar, las APIs en la nube suelen tardar 1-3 segundos de extremo a extremo (más para los modelos grandes de OpenAI). El comando «Write» de Sudowrite a menudo tarda 5-15 segundos porque encadena varias generaciones en el servidor. El ghost text de MimicReader es rápido precisamente porque el modelo es pequeño y vive junto a quien lo invoca.

Tab para aceptar. Esc para descartar. Tú mandas.

La interacción es deliberadamente mínima:

Nada se inserta de forma automática. La IA nunca modifica tu borrador sin un Tab explícito. Si no miras el texto gris y sigues escribiendo, desaparece como si nunca hubiera estado. Muchos escritores activan la función y se olvidan de que existe, y solo de vez en cuando aceptan una sugerencia cuando el editor les sorprende con una buena. Ese es el modo correcto de uso.

Limitamos el ghost text a 60 peticiones por minuto por usuario, con ventana deslizante. En la práctica significa que puedes pausar y disparar una sugerencia cada segundo durante un minuto entero antes de tocar el tope. Nadie escribe así. El límite está para detener bots, no escritores.

Privacidad: la razón de verdad para preocuparse

La IA en la nube está bien para código, para correos, para la mitad aburrida de tu trabajo. No está bien para la prosa de la que aún no estás seguro.

En concreto: autores de erótica, memorialistas con familiares aún vivos en el manuscrito, autores de ficción explorando temas oscuros (true crime, abusos, adicciones), profesionales bajo NDA, abogados redactando escritos, terapeutas tomando notas sobre pacientes, cualquiera que trabaje sobre algo embargado, cualquiera escribiendo en un idioma con sensibilidades culturales que el filtro de seguridad del proveedor cloud no entiende — para todos ellos, cada llamada a una API en la nube es un pequeño riesgo que se asume voluntariamente.

El modelo local es la ausencia de ese riesgo. No te pedimos que confíes en la política de privacidad de OpenAI. No te pedimos que confíes en las enterprise terms de Anthropic. Te pedimos que confíes en que el modelo que corre en nuestra GPU no tiene una ruta de red fuera de nuestra GPU. (No la tiene. El proceso de Ollama escucha en 192.168.20.155:11434 en una red privada. El VPS llega por túnel WireGuard. No hay salida desde la GPU al internet público para el tráfico de inferencia.)

Por qué nos comemos el tiempo de GPU

Respuesta honesta: nos cuesta unos £0,001 de electricidad por cada compleción de ghost text con las tarifas eléctricas del Reino Unido. Con el límite de 60 compleciones/min/usuario, incluso un escritor intenso de cuatro horas seguidas con la función a tope nos costaría como mucho £1 en luz — y probablemente también está generando audiolibros (que es donde vive nuestro ingreso real) en la misma cuenta. El ghost text es una función que vuelve la plataforma más adictiva y apenas se nota en nuestra cuenta de gastos. Así que dejamos de intentar monetizarla y la hicimos gratis.

Sudowrite cobra $19/mes por el ghost text porque tiene que pagar a OpenAI por cada llamada. Su margen exige tu suscripción. Nosotros no pagamos a OpenAI. Pagamos la factura de la luz. La economía es genuinamente distinta — y preferimos que te gastes esos $19 (unos 18 €) en un pack de créditos para generación real de audiolibros, que es donde está el coste.

Cómo activarlo

Dentro de la app de MimicReader:

  1. Abre Ajustes
  2. Baja hasta Writing Studio
  3. Activa AI co-writer (ghost text)
  4. Abre cualquier proyecto, empieza a escribir — pausa 1,5 segundos cuando quieras una sugerencia

Puedes desactivarlo cuando quieras. Los ajustes son por usuario y persisten entre dispositivos. La función está en el mismo panel que el resto de preferencias del Writing Studio (fuente, tema, pausa de capítulo por defecto, etc.).

Prueba el ghost text — está sin más

Cuenta gratis, sin tarjeta, el AI co-writer viene incluido desde el primer día. Igual que las notas de voz, la edición de manuscritos, la generación de portadas y 1 hora al mes de generación de audiolibros.

Empieza a escribir gratis

Lo que el ghost text no hace

Para que quede claro qué hemos construido y qué no:

Hace una sola cosa — pequeña continuación inline cuando te paras — y la hace bien, rápido, gratis y en privado.

Adónde ir ahora