كيفية قياس دقة الترجمة الآلية

7 مارس 2025

بقلم Marina Peterson

4 دقائق قراءة

دقة الترجمة الآلية
NLP
LLM
الترجمة

تقدّم أنظمة الترجمة الآلية (MT) الحديثة ترجمات أكثر سلاسة وغنى بالسياق من أي وقت مضى. ومع ذلك، فإن قياس مدى دقة هذه الترجمات قد يكون معقدًا على نحو مفاجئ. فيما يلي نستعرض أساليب التقييم البشرية والآلية لقياس جودة MT، إلى جانب نماذج QA وQE (تقدير الجودة) الناشئة. سواء كنت تعتمد على NMT (الترجمة الآلية العصبية) أو على النماذج اللغوية الكبيرة (LLMs)، فإن فهم هذه المقاييس يساعدك على تحسين سير العمل ورفع موثوقية الترجمة بشكل عام.

1. التقييم البشري المتخصص

يُعد التقييم البشري المعيار الذهبي عند تقييم مخرجات الترجمة الآلية. يقارن اللغويون ذوو الخبرة ترجمة النظام بنص مرجعي أو بمجموعة معايير محددة، مثل:

الاكتمال: هل تغطي الترجمة جميع معاني النص الأصلي؟
الطلاقة: هل النص الهدف صحيح نحويًا ويبدو طبيعيًا؟
السياق: هل نُقلت الإشارات الدقيقة أو الفروق الثقافية بدقة؟

مع أن التقييم البشري يقدّم رؤى أعمق، فإنه قد يكون مكلفًا زمنيًا وقد يتأثر بالذاتية. وغالبًا ما تعتمد المؤسسات على متوسط درجات عدة خبراء للحد من التحيز، خاصة عند مقارنة حلول MT المختلفة. ومع ذلك، فإن قيود التكلفة والسرعة تجعل المراجعات البشرية واسعة النطاق أمرًا صعبًا.

HTER (Human Translation Error Rate)

من المقاييس اليدوية الشائعة HTER، وهو يقيس عدد التعديلات اللازمة لإصلاح مخرجات MT حتى تطابق مستوى جودة بشرية. يتتبع المحررون عمليات الاستبدال والحذف والإضافة، ويشير مجموع هذه التعديلات إلى مدى ابتعاد المخرجات الآلية عن ترجمة مقبولة. وكلما انخفض HTER كانت الجودة أفضل.

2. مقاييس التقييم الآلية

عند التعامل مع كميات كبيرة من النصوص، يصبح الاعتماد فقط على المراجعين البشريين غير عملي. تساعد المقاييس الآلية على المقارنة المعيارية لأداء النظام بسرعة وعلى نطاق واسع:

BLEU ‏(Bilingual Evaluation Understudy): يركز على تداخل n-gram بين مخرجات MT والنص المرجعي. وتشير درجات BLEU الأعلى إلى تطابق أقرب.
METEOR: يأخذ في الاعتبار كلًا من الدقة (ما نسبة الكلمات المترجمة التي تطابق المرجع) والاسترجاع (كم عدد كلمات المرجع التي تظهر في MT)، إضافة إلى المرادفات وإعادة الصياغة.
TER ‏(Translation Edit Rate): يشبه HTER لكنه يُقاس آليًا، إذ يحسب عدد التعديلات اللازمة لتحويل مخرجات MT إلى مرجع.

تكشف كلُّ أداة قياس جانبًا مختلفًا من جودة الترجمة. ومع ذلك، لا توجد أداة آلية واحدة مثالية. فكثيرًا ما تعجز عن التقاط السياق العميق أو الفروق اللغوية الدقيقة، لذا فإن أفضل الممارسات تعتمد غالبًا على الجمع بين عدة مقاييس.

3. نماذج ضمان الجودة (QA) وتقدير الجودة (QE)

نماذج QA

تستخدم أساليب ضمان الجودة التعلّم الآلي لاكتشاف الأخطاء المحتملة في الترجمة قبل التوليد أو أثناءه. ويمكن لهذه النماذج أن تبرز المقاطع الأكثر عرضة للأخطاء، ما يساعد المحررين اللاحقين على تركيز جهودهم بكفاءة أكبر.

تقدير الجودة (QE)

يتنبأ QE بـ جودة الجمل أو المقاطع الفردية من خلال تحليل النصين المصدر والهدف معًا لإسناد درجة. وعلى الرغم من أنه ليس شاملًا مثل المراجعة البشرية الكاملة، فإنه يوفر مؤشرًا سريعًا إلى الأجزاء التي تحتاج إلى تدقيق أو تحرير أعمق.

4. الدقة في NMT مقابل الترجمة المعتمدة على LLM

تطورت الترجمة الآلية العصبية (NMT) بشكل كبير، لكنها قد تواجه صعوبة في الاتساق داخل المستندات الطويلة أو عند التعامل مع المصطلحات المتخصصة. في المقابل، غالبًا ما تنتج النماذج اللغوية الكبيرة (LLMs) ترجمات أكثر حساسية للسياق، لكنها تتطلب موارد حوسبة أعلى. ويمكن لكلا النهجين أن يعاني من الهلوسة أو سوء التفسير إذا لم يتم تعلم مصطلحات المجال بشكل كافٍ، مما يبرز أهمية وجود تقييم قوي.

5. تحسين سير عمل الترجمة باستخدام التفريغ النصي

بالنسبة إلى كثير من المؤسسات، يمكن أن يؤدي الجمع بين التقييم الآلي وحلول حوّل محتواك إلى إنشاء مسار نصي عالي الجودة وسهل الوصول. يبدأ التعرف على الكلام بتحويل الصوت أو الفيديو إلى نص، ثم تقوم أنظمة MT المتقدمة بترجمته، وأخيرًا تساعد نماذج QA أو QE في تحديد الموثوقية العامة للمخرجات. وهكذا لا يبذل المحررون اللاحقون جهدهم إلا في المواضع التي تحتاج إليه فعلًا، ما يوفر الوقت والتكلفة.

الخلاصة

إن قياس دقة الترجمة الآلية عملية متعددة الطبقات تجمع بين التقييم البشري والتسجيل الآلي للدرجات وتقنيات QA/QE المتقدمة. لا يوجد حل واحد يلتقط كل الفروق اللغوية الدقيقة، لكن من خلال المزج بين عدة أساليب يمكنك تحديد أقوى الأنظمة، وتحسين عملية التحرير اللاحق، وتقديم ترجمات تتسم بالدقة. سواء كنت تستخدم NMT أو أحدث LLMs، فإن اتباع نهج واعٍ في تقييم MT يضمن أن يلبّي المحتوى متعدد اللغات احتياجات التواصل ومعايير الجودة معًا.