اللحظة التي يفشل فيها الإملاء عادةً

كنت أمشي مع الكلب صباح الثلاثاء الماضي، أرتب مشهداً في رأسي. شخصيتان، Ezra و Lyra، يتجادلان في قبو نصف غارق حول ما إذا كان النهر قد غيّر مساره عمداً. مشهد جيد. من النوع الذي يصلك كاملاً، ويختفي لحظة جلوسك أمام الكيبورد.

إذن فعلت ما يفعله كل كاتب يحمل هاتفاً. فتحت تطبيق إملاء وبدأت بالحديث. بعد ثلاث دقائق كان لدي المشهد. بعد خمس دقائق كان لدي النص المنسوخ. كل ظهور لـ „Ezra" تحوّل إلى „Israel". كل ظهور لـ „Lyra" تحوّل إلى „Lila". القبو أصبح „the bay"، والنهر أصبح „the reefer". بعد نصف ساعة من البحث والاستبدال، كان المشهد على الورق، لكن الشرارة اختفت.

هذه التجربة العالمية لكتابة الخيال بالصوت. نماذج الإملاء العامة لم تقرأ كتابك أبداً. لم تقرأ حتى قائمة شخصياتك. تخمن الأسماء العلَم من جدول تردد لمقالات الأخبار، ولهذا الأسماء غير الشائعة — بالضبط الأسماء التي يميل الخيال لاستخدامها — تُعاد كتابتها إلى أسماء شائعة. Ezra إلى Israel. Lyra إلى Lila. Saoirse إلى „Sersha". Caitlyn إلى „Caitlin" (أو أسوأ).

الإصلاح بنيوي. على نموذج الإملاء أن يعرف عن مشروعك قبل أن يبدأ بالنسخ. محرر Writing Studio في MimicReader يفعل ذلك بالضبط.

لماذا يفشل الإملاء التقليدي للروائيين

جولة سريعة على البدائل، مع تقييم صادق:

Google Web Speech / إملاء Chrome — سريع، مجاني، يعمل في المتصفح. يعرف صفراً عن مخطوطتك. يستبدل أي شيء غير مألوف بأقرب كلمة شائعة. يتوقف عن الاستماع بعد ~60 ثانية من الصمت. الصوت يُرسل إلى Google.
إملاء Apple (iOS) — نموذج على الجهاز أفضل قليلاً منذ iOS 17، لكن المجموعة النصية لا تزال إنجليزية عامة. يمكنك إضافة بعض „استبدالات النص" لكنها لا تحيز النموذج، بل تعالج سلاسل محددة لاحقاً.
Otter.ai — مبني للاجتماعات. ممتاز في تحديد المتحدثين في مكالمة Zoom. عديم الفائدة في معرفة أن بطلك اسمه Soren وليس „soaring".
Dragon Naturally Speaking — الملك القديم. يمكنك تدريب قواميس مخصصة، لكن سير العمل صعب، الترخيص بمئات الجنيهات، وقصة الموبايل صعبة.
Whisper العادي (النموذج مفتوح المصدر) — محرك النسخ الفعلي خلف معظم الأدوات الحديثة. ممتاز، لكن بقدر جودة الـ prompt الذي تعطيه إياه. خارج الصندوق، صفر سياق روائي.

النمط: لا واحدة من هذه الأدوات تعرف عالمك. لا تستطيع، لأن لا واحدة منها داخل مخطوطتك. هي أدوات عامة مُركبة على عمل محدد.

كيف يعمل الإملاء الصوتي في MimicReader

محرر Writing Studio يبعد نقرة واحدة عن قائمة شخصياتك، الملخص، والفصل الذي تحرره حالياً. عند الضغط على زر الميكروفون، إليك ما يحدث خلف الكواليس:

متصفحك يسجل الصوت محلياً (واجهة MediaRecorder للمتصفح، بدون streaming).
عند إيقاف التسجيل، تُرفع كتلة الصوت إلى خادم MimicReader عبر HTTPS.
الخلفية تجلب بيانات مشروعك الوصفية — كل شخصية مسماة، الملخص، عنوان العمل، أسماء الأماكن الرئيسية.
تُصاغ تلك الأسماء في initial_prompt الخاص بـ Whisper — سلسلة سياق قصيرة يستخدمها Whisper لتحيز فك التشفير. „الصوت التالي من رواية تظهر فيها Ezra و Lyra و Saoirse… في مدينة Veridia نصف الغارقة…"
Whisper Large V3 Turbo ينسخ الصوت على بنيتنا التحتية. الـ prompt يحيزه نحو أسمائك العلَم — Ezra تبقى Ezra.
النص المنسوخ يُدرج عند موضع المؤشر في محرر الفصول.
الصوت الأصلي يُحفظ كملاحظة في حسابك حتى يمكنك إعادة الاستماع إذا أساء Whisper سماع كلمة وتريد إصلاحها من المصدر.

هذه هي الحيلة. Whisper يدعم initial_prompt منذ اليوم الأول، لكن لا أداة إملاء استهلاكية تربطه بالمخطوطة تلقائياً. نحن نفعل، لأن المخطوطة موجودة هناك.

        ماذا يعني „مدرك للمشروع" بشكل ملموس: إذا احتوت قائمة شخصياتك على Ezra Vance، Lyra Ó Dálaigh، و Saoirse Quinn، فإن تلك التهجئات بالضبط هي ما يُخرجه Whisper. لا تصحيح تلقائي إلى „Israel" أو „Lila" أو „Sersha". تحتفظ بأسماء شخصياتك.
    

صوتك يبقى هنا

هذا الجزء أهم مما يظنه الناس. أدوات الإملاء عليها أن تفعل شيئاً بصوتك. الإعدادات الافتراضية ليست دائماً ودودة.

Google Web Speech يرسل الصوت إلى خوادم Google. خاضع لأي شيء يستخدمونه له، وأي شيء يتفاوض عليه محامو الاتحاد الأوروبي والمملكة المتحدة في النهاية بشأن بيانات التدريب.
Otter و Rev و Trint يخزنون صوتك على سحابتهم، إلى أجل غير مسمى افتراضياً. يمكنك حذفه يدوياً. يدربون على بيانات مجمعة ومجهولة الهوية — الشروط تختلف حسب المستوى.
إملاء Apple يبقى على الجهاز للنطق القصير، لكن الإملاء المحسّن يمكنه الاتصال بالمنزل.

MimicReader مختلف بالبنية، لا بالوعد:

الصوت يُرسل إلى بنيتنا التحتية الخاصة (في خزانة خادم في اسكتلندا)، لا إلى OpenAI أو Google أو أي طرف ثالث.
النسخ يعمل على نموذج Whisper محلي نستضيفه. لا مفتاح API لخدمة نسخ طرف ثالث. لا طرف ثالث.
الصوت يُخزن كملاحظة في حسابك. أنت الوحيد القادر على الاستماع إليه. يمكنك حذفه من تبويب الملاحظات في أي وقت. حذف الحساب (المادة 17 من GDPR) يمسحه أيضاً.
لا ندرب أي نموذج على صوتك أو مخطوطتك. توقف كامل.

إذا شعرت يوماً بعدم الارتياح من إملاء مشهد حساس — فصل مذكرات، مقابلة سرية، ذروة الحبكة التي لا تريد أبداً أن يراها فريق Google ML — هذه هي النسخة التي تتيح لك ألا تقلق بشأن ذلك.

سير العمل على الموبايل

زر الميكروفون يعمل في Chrome و Safari على الموبايل. سير العمل الفعلي الذي أستخدمه، حيث الكلب لن يمشي بنفسه:

S24 Ultra في الجيب، سماعات في الأذن، مقود الكلب في اليد اليسرى.
افتح mimicreader.ai/app، انتقل إلى الفصل الذي أعمل عليه.
اضغط الميكروفون (نقطة حمراء كبيرة في أسفل شريط أدوات المحرر — يصعب تفويتها).
تحدث. فقرات كاملة. مشاهد كاملة. فصول كاملة إذا كان الصباح جيداً.
اضغط إيقاف. انتظر عشر ثوانٍ. النص المنسوخ يظهر في السطر.
امشِ. كرر للمشهد التالي.

Whisper Large V3 Turbo سريع. إملاء ثلاث دقائق يُنسخ في حوالي ثماني ثوانٍ على بنيتنا التحتية. بحلول الوقت الذي أعيد فيه الهاتف إلى جيبي وأشاهد الكلب يشم عمود إنارة، النص في الفصل.

لا تكلفة بطارية تستحق الذكر، لأن لا نموذج على الجهاز يعمل — التسجيل هو الشيء الوحيد الذي يفعله هاتفك، والتسجيل يستخدم تقريباً لا شيء. هناك بعض تكلفة الشبكة: كتلة Opus لثلاث دقائق حوالي 1 ميغابايت. رخيصة على 4G، مجانية على Wi-Fi المنزل.

ما يُحفظ (ولماذا)

شيئان، في كل مرة تنهي فيها الإملاء:

النص المنسوخ — يُدرج عند المؤشر، قابل للتحرير فوراً. هذا هو الناتج الأساسي.
الصوت الأصلي — مؤرشف كملاحظة في حسابك، مع طابع زمني للتسجيل ورابط للعودة إلى الفصل الذي أُمليّ فيه.

أرشيف الصوت يهم لأن Whisper، حتى مع التحيز، ليس مثالياً. ربما سمع „the morning when I" كـ „the moaning weather". ربما اختطفت الريح كلمة وحولتها إلى هراء. مع الصوت الأصلي على بعد ضغطة في الملاحظات، يمكنك تشغيل العبارة بالضبط، سماع ما قلته فعلاً، وإصلاح النص. لا إعادة بناء من الذاكرة بعد ثلاثة أيام.

عرض الملاحظات يتيح لك أيضاً تكديس صوت خام لاحقاً. أملِ أربع رسومات لمشاهد في نزهة الإثنين. مساء الأربعاء، اجلس مع قهوة، افتح تبويب الملاحظات، استمع، وقرر أيها يستحق الحفاظ. هذا نفس النمط الذي يستخدمه خط أنابيب الملاحظات الصوتية إلى الكتاب الصوتي، مُربط مباشرة بالمحرر بدلاً من زر Promote-to-chapter.

كيف تفعّله

Writing Studio حالياً خلف feature flag، لأن أجزاء من المحرر لا تزال تُصقل. لتشغيله:

افتح /settings في تطبيق MimicReader.
انزل إلى Writing Studio.
فعّل التبديل. احفظ.
افتح أي فصل من المشروع. شريط أدوات المحرر الآن يحوي أيقونة ميكروفون بجانب أزرار التنسيق.
انقرها. اسمح بالوصول إلى الميكروفون عندما يسأل المتصفح. تحدث.

هذا كل شيء. لا إضافة، لا تثبيت، لا تطبيق منفصل. زر الميكروفون جزء من المحرر منذ لحظة تفعيل Writing Studio.

جرب سير العمل

إذا فتحت يوماً مستنداً جديداً في السابعة صباحاً مع مشهد في رأسك وفقدته عند الفقرة الأولى من الكتابة، فهذا سير العمل الذي يصلح ذلك. الصوت يحفظ الشرارة. الإملاء المدرك للمشروع يحفظ أسماء شخصياتك.

أملِ فصلك التالي

مجاناً مع كل حساب MimicReader. لا أرصدة إضافية، لا تكلفة لكل طلب. فقط المحرر، الميكروفون، والأسماء التي كتبتها بالفعل.

ابدأ مجاناً

اكتب روايتك بصوتك: إملاء يعرف شخصياتك

اللحظة التي يفشل فيها الإملاء عادةً

لماذا يفشل الإملاء التقليدي للروائيين

كيف يعمل الإملاء الصوتي في MimicReader

صوتك يبقى هنا

سير العمل على الموبايل

ما يُحفظ (ولماذا)

كيف تفعّله

جرب سير العمل

أملِ فصلك التالي

إلى أين بعد ذلك

اللحظة التي يفشل فيها الإملاء عادةً

لماذا يفشل الإملاء التقليدي للروائيين

كيف يعمل الإملاء الصوتي في MimicReader

صوتك يبقى هنا

سير العمل على الموبايل

ما يُحفظ (ولماذا)

كيف تفعّله

جرب سير العمل

أملِ فصلك التالي

إلى أين بعد ذلك

تابع القراءة

من الملاحظات الصوتية إلى الكتاب الصوتي المنشور: خط الأنابيب الكامل من 4 خطوات

اكتب روايتك وأنتج الكتاب الصوتي — كل ذلك في مكان واحد

النشر الذاتي لكتاب صوتي