Kostenloser KI-Schreib-Copilot: Wie lokale Modelle Sudowrite im Erstentwurf schlagen

Der Moment

Es ist 23 Uhr. Du hast 600 Wörter in einem Kapitel und hängst an einem Satz fest, der mit „Sie wusste, so wie man Dinge im Traum weiß, dass …" beginnt — und dein Kopf ist leer. Du willst keinen Magic 8-Ball, der dir den nächsten Absatz schreibt. Du willst einen Anstoß. Etwas zum Lesen und Reagieren. Einen kleinen Spiegel, der sagt: „… dass die Tür offen sein würde, ob sie die Klinke drückte oder nicht."

Du machst anderthalb Sekunden Pause. Der graue, kursive Geist erscheint inline. Passt er, Tab. Passt er nicht, Esc — oder schreib einfach weiter, er verschwindet. Das ist die ganze Interaktion. Es ist kostenlos. Läuft auf unserer Hardware. Niemand auf der anderen Seite liest deinen Entwurf.

Das ist das Writing Studio von MimicReader mit eingeschaltetem AI co-writer. Und der Kontrast zu dem, was Sudowrite für dieselbe Idee verlangt, ist, offen gesagt, peinlich für Sudowrite.

Die Sudowrite-Steuer

Sudowrite ist hervorragendes Marketing um ein eher dünnes technisches Produkt herum. Die Preisstruktur Mitte 2026:

$19/Monat mindestens (rund 17 €) für den „Hobby and Student"-Plan
225.000 Credits/Monat — klingt riesig, bis du merkst, dass die Story Engine das in ein paar Sitzungen verschlingt
Vielschreiber kaufen größere Pläne ($29, $59, $129), um nicht in den Limits zu landen
Dein Text wird bei jeder Generation an OpenAI geschickt — Sudowrite ist nur ein Wrapper

Dieser letzte Punkt wird im Marketing kleingeredet. Sudowrite hat kein eigenes Modell. Im Hintergrund ruft es die OpenAI-API auf. Dein Manuskript in Arbeit — inklusive der halbfertigen Szenen, die du deinem Lektor nie zeigen würdest — geht auf OpenAIs Server, wird dort verarbeitet, und die Vervollständigung kommt zurück. Die Enterprise-AGB von OpenAI sagen, dass sie nicht auf API-Daten trainieren, was beruhigt, wenn man Enterprise-AGB vertraut. (Sie wurden in diesem Jahrzehnt schon zweimal geändert.)

NovelCrafter ist die etwas günstigere Variante: $7/Monat (rund 6,50 €) für das Abo, danach bringst du deinen eigenen OpenAI- oder Anthropic-Key mit und zahlst direkt pro Generation. Gleicher Datenfluss — dein Text verlässt weiterhin die Plattform, auf der du ihn getippt hast.

Was „lokales Modell" wirklich heißt

Der AI-Co-Writer von MimicReader ruft kein OpenAI auf. Er ruft kein Anthropic auf. Er trifft ein Modell aus der Llama-Familie — konkret gemma3:4b — das auf unserer eigenen RTX 3090 in unserem eigenen Serverraum in Schottland läuft.

Wenn du beim Tippen pausierst, schickt der Editor die letzten ~500 Wörter deines Entwurfs an 192.168.20.155:11434 (über einen WireGuard-Tunnel vom VPS), bekommt eine Fortsetzung von 10-30 Wörtern zurück und rendert sie als grauen, kursiven Text inline. Der komplette Weg:

Dein Browser → MimicReader-VPS (HTTPS über Cloudflare)
VPS → unser GPU-Server (verschlüsselter WireGuard-Tunnel, internes Netz)
GPU-Server fährt Ollama mit gemma3:4b, generiert die Vervollständigung
Die Vervollständigung kommt denselben Weg zurück
Grauer, kursiver Text erscheint in deinem Editor

Kein KI-Drittanbieter ist beteiligt. OpenAI sieht deinen Satz nie. Anthropic sieht deinen Satz nie. Die einzigen Leute, die deinen Text theoretisch sehen könnten, sind wir, und wir loggen die Anfragen nicht — sie treffen das Modell und das Payload ist weg, sobald die Antwort generiert ist. (Wir loggen, dass eine Anfrage stattfand, fürs Rate Limit. Wir loggen nicht, was drin war.)

        Warum das zählt: Wenn du Genre-Fiktion, Erotik, eine sensible Memoir oder irgendetwas schreibst, bei dem der Text selbst der Wert ist, ist jeder API-Call an ein Dritt-LLM ein Moment, in dem dein Entwurf auf fremder Hardware liegt. Lokales Modell ist die einzige vollständig vernünftige Wahl.
    

Ehrlicher Vergleich: wann lokal genial ist und wann nicht

Wir werden gemma3:4b nicht überverkaufen. Es ist ein Open-Weights-Modell mit 4 Milliarden Parametern. Es ist kein Claude 4.7. Es ist kein GPT-5. Hier die ehrliche Matrix:

Aufgabe	Lokal gemma3:4b	Großes Cloud-Modell
Diesen Satz beenden (5-15 Wörter)	Exzellent	Exzellent
Diesen Absatz beenden (20-40 Wörter)	Gut	Exzellent
Nächsten Absatz von Grund auf entwerfen	Brauchbar	Exzellent
Ein ganzes Kapitel entwerfen	Mittelmäßig — nimm Workshop	Exzellent — nimm Workshop
Stimme über 1000 Wörter halten	Driftet	Driftet weniger, verschwindet nicht
50-Kapitel-Outline planen	Lass es	Nimm AI Workshop / Claude

Ghost Text ist absichtlich auf die grüne Spalte beschränkt. Er existiert für den Moment, in dem dein Kopf eine Pause macht und du ein Schlussfragment willst, keinen Kapitelentwurf. Wenn du Kapitelentwürfe willst — das ist eine andere Funktion in MimicReader namens AI Workshop, die Claude oder Gemini nutzt (kostenpflichtig, deine Credits) für hochwertiges strukturelles Drafting. Wir geben dir beide Werkzeuge und überlassen dir die Wahl.

Wenn du den größten Teil des Tages die KI bittest, „die nächsten 500 Wörter zu schreiben", willst du keinen Ghost Text — du willst Workshop. Wenn du den größten Teil des Tages selbst schreibst und gelegentlich einen Abschluss-Schubs willst, willst du Ghost Text und wirst Workshop nie anfassen. Beide sind in jedem Konto enthalten.

Latenz-Realität: ~400 ms

1,5 Sekunden Pause. Die Anfrage fliegt raus. Das Modell antwortet in etwa 400 Millisekunden. Gesamtzeit vom letzten Tastendruck bis zum Erscheinen des grauen Texts: knapp unter 2 Sekunden. Es fühlt sich an, als würde der Editor deine Gedanken mit einem Atemzug Verzögerung lesen.

Zum Vergleich: Cloud-APIs laufen typischerweise 1-3 Sekunden Ende zu Ende (länger für die größeren OpenAI-Modelle). Der „Write"-Befehl von Sudowrite braucht oft 5-15 Sekunden, weil er serverseitig mehrere Generationen verkettet. Der Ghost Text in MimicReader ist genau deshalb schnell, weil das Modell klein ist und direkt neben dem Aufrufer wohnt.

Tab zum Annehmen. Esc zum Verwerfen. Du behältst die Kontrolle.

Die Interaktion ist bewusst minimal:

Tab — Vorschlag annehmen, grauer Text wird echter Text, Cursor springt ans Ende
Esc — verwerfen, Vorschlag verschwindet, du tippst weiter
Einfach weitertippen — Vorschlag verschwindet automatisch in dem Moment, in dem du eine andere Taste drückst

Nichts wird je automatisch eingefügt. Die KI ändert deinen Entwurf nie ohne explizites Tab. Wenn du den grauen Text nicht anschaust und weitertippst, verschwindet er, als wäre er nie da gewesen. Viele Schreibende schalten die Funktion ein und vergessen, dass sie existiert, und nehmen gelegentlich einen Vorschlag an, wenn der Editor mit einem guten überrascht. Das ist der richtige Modus.

Wir limitieren Ghost Text auf 60 Anfragen pro Minute pro Nutzer im Sliding-Window-Verfahren. Praktisch heißt das, du kannst eine ganze Minute lang jede Sekunde pausieren und einen Vorschlag triggern, bevor du an die Decke stößt. So schreibt niemand. Das Limit existiert, um Bots zu stoppen, nicht Schreibende.

Privatsphäre: der eigentliche Grund

Cloud-KI ist okay für Code, okay für E-Mails, okay für die langweilige Hälfte deines Jobs. Sie ist nicht okay für den Text, bei dem du dir noch nicht sicher bist.

Konkret: Erotik-Autorinnen, Memoir-Schreibende mit Familienmitgliedern, die im Manuskript noch leben, Fiktion-Autoren, die dunkle Themen erkunden (True Crime, Missbrauch, Sucht), Profis unter NDA, Anwältinnen, die Schriftsätze entwerfen, Therapeuten mit Klientennotizen, jeder, der an etwas unter Embargo arbeitet, jeder, der in einer Sprache mit kulturellen Empfindlichkeiten schreibt, die der Safety-Filter des Cloud-Anbieters nicht versteht — für all diese ist jeder Cloud-API-Call ein kleines Risiko, das du freiwillig eingehst.

Lokales Modell ist das Fehlen dieses Risikos. Wir bitten dich nicht, der Datenschutzerklärung von OpenAI zu vertrauen. Wir bitten dich nicht, den Enterprise-Bedingungen von Anthropic zu vertrauen. Wir bitten dich zu vertrauen, dass das Modell auf unserer GPU keinen Netzwerkpfad von unserer GPU weg hat. (Hat es nicht. Der Ollama-Prozess lauscht auf 192.168.20.155:11434 in einem privaten Netz. Der VPS erreicht ihn über einen WireGuard-Tunnel. Von der GPU gibt es keinen Ausgang ins öffentliche Internet für Inferenz-Traffic.)

Warum wir die GPU-Zeit selber tragen

Ehrliche Antwort: Es kostet uns rund £0,001 Strom pro Ghost-Text-Vervollständigung zu britischen Strompreisen. Beim Limit von 60 Vervollständigungen/Min./Nutzer würde selbst ein Vielschreiber, der vier Stunden am Stück mit voll ausgereizter Funktion schreibt, uns vielleicht £1 an Strom kosten — und der erzeugt vermutlich auch Hörbücher (wo unser tatsächlicher Umsatz liegt) im selben Account. Ghost Text ist ein Feature, das die Plattform „klebriger" macht und in unserer Kostenrechnung kaum auftaucht. Also haben wir aufgegeben, es zu monetarisieren, und einfach kostenlos gemacht.

Sudowrite verlangt $19/Monat für Ghost Text, weil Sudowrite OpenAI pro Call bezahlen muss. Ihre Marge braucht dein Abo. Wir zahlen kein OpenAI. Wir zahlen unsere Stromrechnung. Die Wirtschaftlichkeit ist tatsächlich anders — und uns wäre lieber, du würdest die $19 (rund 17 €) für ein Credit-Pack für echte Hörbuchgenerierung ausgeben, weil dort die Kosten liegen.

So aktivierst du es

In der MimicReader-App:

Öffne Einstellungen
Scrolle zu Writing Studio
Schalte AI co-writer (Ghost Text) ein
Öffne ein beliebiges Projekt, fang an zu schreiben — 1,5 Sekunden Pause, wenn du einen Vorschlag willst

Du kannst es jederzeit wieder ausschalten. Einstellungen sind pro Nutzer und gelten geräteübergreifend. Die Funktion liegt im selben Panel wie die anderen Writing-Studio-Einstellungen (Schriftart, Theme, Standard-Kapitelpause usw.).

Probier den Ghost Text — er ist einfach da

Gratis-Konto, keine Kreditkarte, der AI-Co-Writer ist ab Tag eins dabei. Genauso wie Sprachnotizen, Manuskript-Bearbeitung, Cover-Generierung und 1 Stunde Hörbuchgenerierung pro Monat.

Gratis loslegen

Was Ghost Text nicht tut

Damit klar ist, was wir gebaut haben und was nicht:

Lektoriert nicht — das ist eine andere Funktion (und ehrlich: nimm einen Menschen)
Setzt nicht zuverlässig über Absatzgrenzen hinweg fort — er ist auf das Beenden des aktuellen Gedankens getunt
Kennt dein ganzes Manuskript nicht — er sieht die letzten ~500 Wörter Kontext, nicht Kapitel 1
Hält keine Figurenstimme über lange Strecken — das ist ein viel schwierigeres KI-Problem und ein 4B-Modell schafft das nicht
Schreibt nicht in Masse um — dafür nimm AI Workshop mit einem höherstufigen Modell

Er tut eine Sache — kleine Inline-Fortsetzung, wenn du pausierst — und tut sie gut, schnell, kostenlos und privat.

Wohin als Nächstes

Roman schreiben und Hörbuch an einem Ort erzeugen — die breitere Argumentation für MimicReader als Schreibplattform
Die besten kostenlosen KI-Hörbuchgeneratoren 2026 — was wirklich gratis ist und was Marketing
Von Sprachnotizen zum Hörbuch: die komplette 4-Schritt-Pipeline — aufnehmen, entwerfen, verpacken, vertonen