اللحظة التي يفشل فيها الإملاء عادةً

كنت أمشي مع الكلب صباح الثلاثاء الماضي، أرتب مشهداً في رأسي. شخصيتان، Ezra و Lyra، يتجادلان في قبو نصف غارق حول ما إذا كان النهر قد غيّر مساره عمداً. مشهد جيد. من النوع الذي يصلك كاملاً، ويختفي لحظة جلوسك أمام الكيبورد.

إذن فعلت ما يفعله كل كاتب يحمل هاتفاً. فتحت تطبيق إملاء وبدأت بالحديث. بعد ثلاث دقائق كان لدي المشهد. بعد خمس دقائق كان لدي النص المنسوخ. كل ظهور لـ „Ezra" تحوّل إلى „Israel". كل ظهور لـ „Lyra" تحوّل إلى „Lila". القبو أصبح „the bay"، والنهر أصبح „the reefer". بعد نصف ساعة من البحث والاستبدال، كان المشهد على الورق، لكن الشرارة اختفت.

هذه التجربة العالمية لكتابة الخيال بالصوت. نماذج الإملاء العامة لم تقرأ كتابك أبداً. لم تقرأ حتى قائمة شخصياتك. تخمن الأسماء العلَم من جدول تردد لمقالات الأخبار، ولهذا الأسماء غير الشائعة — بالضبط الأسماء التي يميل الخيال لاستخدامها — تُعاد كتابتها إلى أسماء شائعة. Ezra إلى Israel. Lyra إلى Lila. Saoirse إلى „Sersha". Caitlyn إلى „Caitlin" (أو أسوأ).

الإصلاح بنيوي. على نموذج الإملاء أن يعرف عن مشروعك قبل أن يبدأ بالنسخ. محرر Writing Studio في MimicReader يفعل ذلك بالضبط.

لماذا يفشل الإملاء التقليدي للروائيين

جولة سريعة على البدائل، مع تقييم صادق:

النمط: لا واحدة من هذه الأدوات تعرف عالمك. لا تستطيع، لأن لا واحدة منها داخل مخطوطتك. هي أدوات عامة مُركبة على عمل محدد.

كيف يعمل الإملاء الصوتي في MimicReader

محرر Writing Studio يبعد نقرة واحدة عن قائمة شخصياتك، الملخص، والفصل الذي تحرره حالياً. عند الضغط على زر الميكروفون، إليك ما يحدث خلف الكواليس:

  1. متصفحك يسجل الصوت محلياً (واجهة MediaRecorder للمتصفح، بدون streaming).
  2. عند إيقاف التسجيل، تُرفع كتلة الصوت إلى خادم MimicReader عبر HTTPS.
  3. الخلفية تجلب بيانات مشروعك الوصفية — كل شخصية مسماة، الملخص، عنوان العمل، أسماء الأماكن الرئيسية.
  4. تُصاغ تلك الأسماء في initial_prompt الخاص بـ Whisper — سلسلة سياق قصيرة يستخدمها Whisper لتحيز فك التشفير. „الصوت التالي من رواية تظهر فيها Ezra و Lyra و Saoirse… في مدينة Veridia نصف الغارقة…"
  5. Whisper Large V3 Turbo ينسخ الصوت على بنيتنا التحتية. الـ prompt يحيزه نحو أسمائك العلَم — Ezra تبقى Ezra.
  6. النص المنسوخ يُدرج عند موضع المؤشر في محرر الفصول.
  7. الصوت الأصلي يُحفظ كملاحظة في حسابك حتى يمكنك إعادة الاستماع إذا أساء Whisper سماع كلمة وتريد إصلاحها من المصدر.

هذه هي الحيلة. Whisper يدعم initial_prompt منذ اليوم الأول، لكن لا أداة إملاء استهلاكية تربطه بالمخطوطة تلقائياً. نحن نفعل، لأن المخطوطة موجودة هناك.

ماذا يعني „مدرك للمشروع" بشكل ملموس: إذا احتوت قائمة شخصياتك على Ezra Vance، Lyra Ó Dálaigh، و Saoirse Quinn، فإن تلك التهجئات بالضبط هي ما يُخرجه Whisper. لا تصحيح تلقائي إلى „Israel" أو „Lila" أو „Sersha". تحتفظ بأسماء شخصياتك.

صوتك يبقى هنا

هذا الجزء أهم مما يظنه الناس. أدوات الإملاء عليها أن تفعل شيئاً بصوتك. الإعدادات الافتراضية ليست دائماً ودودة.

MimicReader مختلف بالبنية، لا بالوعد:

إذا شعرت يوماً بعدم الارتياح من إملاء مشهد حساس — فصل مذكرات، مقابلة سرية، ذروة الحبكة التي لا تريد أبداً أن يراها فريق Google ML — هذه هي النسخة التي تتيح لك ألا تقلق بشأن ذلك.

سير العمل على الموبايل

زر الميكروفون يعمل في Chrome و Safari على الموبايل. سير العمل الفعلي الذي أستخدمه، حيث الكلب لن يمشي بنفسه:

  1. S24 Ultra في الجيب، سماعات في الأذن، مقود الكلب في اليد اليسرى.
  2. افتح mimicreader.ai/app، انتقل إلى الفصل الذي أعمل عليه.
  3. اضغط الميكروفون (نقطة حمراء كبيرة في أسفل شريط أدوات المحرر — يصعب تفويتها).
  4. تحدث. فقرات كاملة. مشاهد كاملة. فصول كاملة إذا كان الصباح جيداً.
  5. اضغط إيقاف. انتظر عشر ثوانٍ. النص المنسوخ يظهر في السطر.
  6. امشِ. كرر للمشهد التالي.

Whisper Large V3 Turbo سريع. إملاء ثلاث دقائق يُنسخ في حوالي ثماني ثوانٍ على بنيتنا التحتية. بحلول الوقت الذي أعيد فيه الهاتف إلى جيبي وأشاهد الكلب يشم عمود إنارة، النص في الفصل.

لا تكلفة بطارية تستحق الذكر، لأن لا نموذج على الجهاز يعمل — التسجيل هو الشيء الوحيد الذي يفعله هاتفك، والتسجيل يستخدم تقريباً لا شيء. هناك بعض تكلفة الشبكة: كتلة Opus لثلاث دقائق حوالي 1 ميغابايت. رخيصة على 4G، مجانية على Wi-Fi المنزل.

ما يُحفظ (ولماذا)

شيئان، في كل مرة تنهي فيها الإملاء:

  1. النص المنسوخ — يُدرج عند المؤشر، قابل للتحرير فوراً. هذا هو الناتج الأساسي.
  2. الصوت الأصلي — مؤرشف كملاحظة في حسابك، مع طابع زمني للتسجيل ورابط للعودة إلى الفصل الذي أُمليّ فيه.

أرشيف الصوت يهم لأن Whisper، حتى مع التحيز، ليس مثالياً. ربما سمع „the morning when I" كـ „the moaning weather". ربما اختطفت الريح كلمة وحولتها إلى هراء. مع الصوت الأصلي على بعد ضغطة في الملاحظات، يمكنك تشغيل العبارة بالضبط، سماع ما قلته فعلاً، وإصلاح النص. لا إعادة بناء من الذاكرة بعد ثلاثة أيام.

عرض الملاحظات يتيح لك أيضاً تكديس صوت خام لاحقاً. أملِ أربع رسومات لمشاهد في نزهة الإثنين. مساء الأربعاء، اجلس مع قهوة، افتح تبويب الملاحظات، استمع، وقرر أيها يستحق الحفاظ. هذا نفس النمط الذي يستخدمه خط أنابيب الملاحظات الصوتية إلى الكتاب الصوتي، مُربط مباشرة بالمحرر بدلاً من زر Promote-to-chapter.

كيف تفعّله

Writing Studio حالياً خلف feature flag، لأن أجزاء من المحرر لا تزال تُصقل. لتشغيله:

  1. افتح /settings في تطبيق MimicReader.
  2. انزل إلى Writing Studio.
  3. فعّل التبديل. احفظ.
  4. افتح أي فصل من المشروع. شريط أدوات المحرر الآن يحوي أيقونة ميكروفون بجانب أزرار التنسيق.
  5. انقرها. اسمح بالوصول إلى الميكروفون عندما يسأل المتصفح. تحدث.

هذا كل شيء. لا إضافة، لا تثبيت، لا تطبيق منفصل. زر الميكروفون جزء من المحرر منذ لحظة تفعيل Writing Studio.

جرب سير العمل

إذا فتحت يوماً مستنداً جديداً في السابعة صباحاً مع مشهد في رأسك وفقدته عند الفقرة الأولى من الكتابة، فهذا سير العمل الذي يصلح ذلك. الصوت يحفظ الشرارة. الإملاء المدرك للمشروع يحفظ أسماء شخصياتك.

أملِ فصلك التالي

مجاناً مع كل حساب MimicReader. لا أرصدة إضافية، لا تكلفة لكل طلب. فقط المحرر، الميكروفون، والأسماء التي كتبتها بالفعل.

ابدأ مجاناً

إلى أين بعد ذلك