Darmowy AI co-pilot pisarski: jak lokalne modele pokonują Sudowrite w pierwszych szkicach

Ten moment

Jest 23:00. Masz 600 słów w rozdziale i utknąłeś na zdaniu, które zaczyna się od „Wiedziała, tak jak wie się we śnie, że…" — i mózg ci się wyłączył. Nie chcesz, żeby Magic 8-Ball napisał ci następny akapit. Chcesz tylko bodźca. Czegoś, na co możesz zareagować. Małego lustra, które powie: „…że drzwi będą otwarte, niezależnie od tego, czy nacisnęła klamkę, czy nie."

Robisz pauzę półtorej sekundy. Szary kursywą duch pojawia się inline. Jeśli pasuje — Tab. Jeśli nie — Esc, albo po prostu pisz dalej, sam zniknie. Cała interakcja. Darmowa. Na naszym sprzęcie. Nikt nie czyta twojego szkicu z drugiej strony łącza.

To Writing Studio MimicReadera z włączonym przełącznikiem AI co-writer. A kontrast z tym, co za ten sam pomysł kasuje Sudowrite, jest dla Sudowrite szczerze mówiąc żenujący.

Podatek Sudowrite

Sudowrite to świetny marketing opakowany wokół dość cienkiego produktu technicznego. Cennik na maj 2026:

$19/miesiąc minimum za plan „Hobby and Student"
225 000 kredytów/miesiąc — brzmi sporo, dopóki nie zrozumiesz, że ich Story Engine zżera to w kilka sesji
Heavy userzy biorą większe plany ($29, $59, $129), żeby nie wyczerpywać limitów
Twój tekst leci do OpenAI przy każdej generacji — Sudowrite to tylko wrapper

Ten ostatni punkt zostaje przemilczany w marketingu. Sudowrite nie ma własnego modelu. Pod spodem wywołuje API OpenAI. Twój manuskrypt w trakcie pisania — łącznie z półszkicowanymi scenami, których wstydziłbyś się pokazać redaktorowi — leci na serwery OpenAI, jest tam przetwarzany, a uzupełnienie wraca z powrotem. Regulamin enterprise OpenAI mówi, że nie trenują na danych API — co uspokaja, jeśli ufasz regulaminom enterprise. (Zmienili go już dwukrotnie w tej dekadzie.)

NovelCrafter to nieco tańszy wariant: $7/miesiąc za subskrypcję, potem przynosisz własny klucz OpenAI albo Anthropic i płacisz im bezpośrednio za każde wywołanie. Ten sam przepływ danych — twój tekst nadal opuszcza platformę, na której go piszesz.

Co tak naprawdę znaczy „lokalny model"

AI co-writer MimicReadera nie wywołuje OpenAI. Nie wywołuje Anthropica. Uderza w model z rodziny Llama — konkretnie gemma3:4b — chodzący na naszej RTX 3090 w naszej serwerowni w Szkocji.

Kiedy robisz pauzę, edytor wysyła ostatnie ~500 słów twojego szkicu pod 192.168.20.155:11434 (przez tunel WireGuard z VPS), dostaje 10–30 słów kontynuacji i renderuje jako szary kursywą tekst inline. Pełna ścieżka:

Przeglądarka → VPS MimicReadera (HTTPS przez Cloudflare)
VPS → nasz serwer GPU (szyfrowany tunel WireGuard, sieć wewnętrzna)
Serwer GPU odpala Ollama z gemma3:4b, generuje kontynuację
Kontynuacja wraca tą samą drogą
Szary kursywą tekst pojawia się w edytorze

Żaden zewnętrzny dostawca AI nie jest w to zamieszany. OpenAI nigdy nie widzi twojego zdania. Anthropic nigdy nie widzi twojego zdania. Jedyne osoby, które teoretycznie mogłyby widzieć twój tekst, to my — ale nie logujemy treści zapytań. Lecą do modelu i payload znika w chwili, gdy odpowiedź jest gotowa. (Logujemy że zapytanie miało miejsce, dla rate limitu. Nie logujemy co w nim było.)

        Dlaczego to ważne: jeśli piszesz fikcję gatunkową, erotyk, wrażliwy memuar albo cokolwiek, gdzie sam tekst jest aktywem — każde wywołanie API zewnętrznego LLM-a to moment, w którym twój szkic istnieje na cudzym sprzęcie. Lokalny model to jedyny w pełni rozsądny wybór.
    

Uczciwe porównanie: kiedy lokalny jest świetny, a kiedy nie

Nie zamierzamy nadmiernie chwalić gemma3:4b. To model o 4 miliardach parametrów z otwartymi wagami. Nie Claude 4.7. Nie GPT-5. Oto uczciwa macierz:

Zadanie	Lokalny gemma3:4b	Duży model w chmurze
Dokończ to zdanie (5–15 słów)	Znakomicie	Znakomicie
Dokończ ten akapit (20–40 słów)	Dobrze	Znakomicie
Naszkicuj następny akapit od zera	Przyzwoicie	Znakomicie
Naszkicuj cały rozdział	Średnio — użyj Workshopu	Znakomicie — użyj Workshopu
Trzymaj spójność głosu przez 1000 słów	Dryfuje	Dryfuje mniej, nie znika
Zaplanuj outline 50 rozdziałów	Nie używaj	Użyj AI Workshop / Claude

Ghost text jest celowo ograniczony do zielonej kolumny. Istnieje dla tego momentu, kiedy mózg się zatnie i potrzebujesz kończącego fragmentu — nie szkicu rozdziału. Kiedy chcesz szkic rozdziału — to inna funkcja w MimicReaderze, AI Workshop, która używa Claude albo Gemini (płatne, twoje kredyty) do wysokiej jakości strukturalnego draftingu. Dajemy ci oba narzędzia i pozwalamy wybrać właściwe na właściwy moment.

Jeśli większość dnia spędzasz prosząc AI o „napisanie kolejnych 500 słów" — nie chcesz ghost textu, chcesz Workshopu. Jeśli większość dnia piszesz sam i okazjonalnie chcesz drobnego dopchnięcia — chcesz ghost textu i nigdy nie tkniesz Workshopu. Oba są w każdym koncie.

Realia opóźnień: ~400 ms

Pauza 1,5 sekundy. Zapytanie wystrzeliwuje. Model odpowiada w około 400 milisekund. Pełny czas od ostatniego klawisza do pojawienia się szarego tekstu: niecałe 2 sekundy. To uczucie, jakby edytor czytał ci w myślach z opóźnieniem jednego oddechu.

Dla porównania — chmurowe API zwykle chodzą 1–3 sekundy end-to-end (dłużej dla większych modeli OpenAI). Polecenie „Write" w Sudowrite często trwa 5–15 sekund, bo łańcuchuje kilka generacji po stronie serwera. Ghost text w MimicReaderze jest szybki specjalnie dlatego, że model jest mały i mieszka tuż obok serwera, który go wywołuje.

Tab przyjmuje. Esc odrzuca. Ty masz kontrolę.

Interakcja jest celowo minimalna:

Tab — przyjmij sugestię, szary tekst staje się prawdziwym tekstem, kursor leci na koniec
Esc — odrzuć, sugestia znika, piszesz dalej
Po prostu pisz dalej — sugestia znika automatycznie w chwili, gdy naciśniesz inny klawisz

Nic nigdy nie jest auto-wstawiane. AI nigdy nie zmienia twojego szkicu bez wyraźnego Taba. Jeśli nie spojrzysz na szary tekst i będziesz pisać dalej, znika tak, jakby nigdy go nie było. Wielu pisarzy włącza funkcję i o niej zapomina, a od czasu do czasu przyjmuje sugestię, kiedy edytor zaskoczy ich dobrą. To właściwy tryb pracy.

Mamy rate limit ghost textu na 60 zapytań na minutę na użytkownika z sliding window. Praktycznie znaczy to, że możesz wyzwalać podpowiedź co sekundę przez pełną minutę, zanim dobijesz do sufitu. Nikt tak nie pisze. Limit istnieje, żeby zatrzymać boty, nie pisarzy.

Prywatność: prawdziwy powód, żeby się tym przejmować

Chmurowe AI jest OK do kodu, OK do maili, OK do nudnej połowy twojej pracy. Nie jest OK do prozy, której jeszcze nie jesteś pewien.

Konkretnie: autorzy erotyki, memuaryści z rodziną wciąż żyjącą w manuskrypcie, autorzy fikcji eksplorujący trudne tematy (true crime, przemoc, uzależnienia), profesjonalni pisarze pod NDA, prawnicy piszący opinie, terapeuci notujący o klientach, każdy pracujący nad czymś objętym embargiem, każdy piszący w języku z kulturowymi wrażliwościami, których filtr bezpieczeństwa cloud provider nie rozumie — dla wszystkich z nich każde wywołanie API w chmurze to małe ryzyko, które się dobrowolnie podejmuje.

Lokalny model to brak tego ryzyka. Nie prosimy cię, żebyś ufał regulaminowi OpenAI. Nie prosimy cię, żebyś ufał enterprise terms Anthropica. Prosimy cię, żebyś ufał, że model chodzący na naszym GPU nie ma sieciowej ścieżki z naszego GPU. (Nie ma. Proces Ollama słucha na 192.168.20.155:11434 w sieci prywatnej. VPS dochodzi tam tunelem WireGuard. Z GPU nie ma wyjścia na publiczny internet dla ruchu inferencji.)

Dlaczego zjadamy ten GPU time

Uczciwa odpowiedź: kosztuje nas to około 0,005 zł prądu na jedną podpowiedź ghost textu przy brytyjskich cenach prądu. Przy limicie 60 podpowiedzi/min/user nawet ciężki pisarz pracujący cztery godziny z funkcją w pełnym obciążeniu kosztowałby nas może 5 zł w energii — a prawdopodobnie generuje też audiobooki (gdzie naprawdę leży nasza marża) na tym samym koncie. Ghost text to funkcja, która sprawia, że platforma jest „lepka", a koszt ledwo rejestruje się na naszej rachunkowości. Więc zrezygnowaliśmy z monetyzowania i po prostu zrobiliśmy ją darmową.

Sudowrite kasuje $19/miesiąc za ghost text, bo Sudowrite musi płacić OpenAI za każde wywołanie. Ich marża wymaga twojej subskrypcji. My nie płacimy OpenAI. Płacimy rachunek za prąd. Ekonomika jest naprawdę inna — i wolelibyśmy, żebyś te 75 zł wydał na pakiet kredytów na faktyczne generowanie audiobooków, bo tam leży koszt.

Jak włączyć

W aplikacji MimicReadera:

Otwórz Ustawienia
Przewiń do Writing Studio
Włącz przełącznik AI co-writer (ghost text)
Otwórz dowolny projekt, zacznij pisać — pauza 1,5 sekundy, kiedy chcesz podpowiedź

Możesz wyłączyć w każdej chwili. Ustawienia są per-user, działają na wszystkich urządzeniach. Funkcja jest na tym samym panelu co inne preferencje Writing Studio (czcionka, motyw, domyślna pauza między rozdziałami itp.).

Spróbuj ghost text — jest po prostu

Darmowe konto, bez karty kredytowej, AI co-writer jest dołączony od pierwszego dnia. Tak samo notatki głosowe, edycja manuskryptu, generowanie okładek i 1 godzina generowania audiobooka na miesiąc.

Zacznij pisać za darmo

Czego ghost text nie robi

Żeby było jasne, co zbudowaliśmy, a czego nie:

Nie redaguje — to inna funkcja (i szczerze: zatrudnij człowieka)
Nie kontynuuje niezawodnie przez przerwy akapitów — jest dostrojony do kończenia bieżącej myśli
Nie zna twojego pełnego manuskryptu — widzi ostatnie ~500 słów jako kontekst, nie rozdział 1
Nie trzyma głosu postaci na długich dystansach — to znacznie trudniejszy problem AI, a model 4B nie da rady
Nie przepisuje hurtowo — do tego użyj AI Workshop z modelem wyższego poziomu

Robi jedną rzecz — krótką kontynuację inline, gdy robisz pauzę — i robi ją dobrze, szybko, za darmo i prywatnie.

Co dalej

Napisz powieść i wygeneruj audiobook w jednym miejscu — szersza argumentacja za MimicReaderem jako platformą pisarską
Najlepsze darmowe generatory audiobooków AI w 2026 — co jest naprawdę darmowe, a co tylko marketing
Od notatek głosowych do audiobooka: pełny 4-etapowy pipeline — łap, szkicuj, pakuj, narratuj