برنامج التعرف التلقائي على اللهجات العربية (ADIDA)

بوجود 22 دولة عربيّة ممتدّة من المحيط إلى الخليج، تتعدد اللهجات المحكيّة للغة العربية على هذه الرقعة الجغرافيّة الواسعة مما يجعل من الصّعب على العرب نفسهم فهم اللهجات المحكيّة في بعض المناطق!

دفعت هذه المشكلة مجموعة من الباحثين المهتمين باللغة العربية وتقنيات الذكاء الصنعي لابتكار برنامج قادر على تصنيف وفهم الكلمات وإعادتها إلى أصلها المناطقّي(المكان الذي يستخدمها)، عن طريق برنامج التعرف التلقائي على اللهجات العربية (ADIDA).

ويعد هذا البرنامج نتاج تعاون بين فريق من الباحثين في جامعة نيويورك أبوظبي، تحت إشراف د. نزار حبش، الأستاذ المشارك في علوم الحاسوب مدير مختبر الأساليب الحاسوبية لنمذجة اللغة في جامعة نيويورك أبوظبي (CAMeL Lab)، بالشراكة مع باحثين من مؤسسات تعليمية أخرى.

وكانت صحيفة الشرق الأوسط قد نشرت في 11 يوليو 2019 معلومات من البيان الصحفي الذي حصلت عليه والصّادر من جامعة نيويورك أبوظبي، جاء فيه:

“أن مستخدمي البرنامج يمكنهم إدراج نص باللغة العربية في برنامج التعرف التلقائي على اللهجات العربية، للحصول على نتائج على شكل خريطة جغرافية للعالم العربي، تظهر فيها المدن التي تستخدم هذا النص من بين الـ25 مدينة، ثم تستعرض الواجهة الإلكترونية المدن الخمس الأولى، من حيث احتمال استخدامها للنص المكتوب، إلى جانب اللغة العربية الفصحى.”

تكمل الصحيفة:

“ويوضح البيان نموذجاً عملياً، حيث يمكن للبرنامج تحديد ما إذا كانت كلمة «ماشي» تعني «حسناً» في القاهرة وبيروت أو «لا» في صنعاء.
ويقول د. نزار حبش، الباحث الرئيسي للمشروع، في تصريحات خاصة لـ«الشرق الأوسط»: «قاعدة معلومات البرنامج تحتوي على 100 ألف جملة مترجمة من الإنجليزية أو الفرنسية إلى لهجات المدن الـ25، وتحتوي كذلك على 12 ألف جملة في العربية الفصحى، ويبلغ عدد الكلمات المستخدمة في كل الجمل نحو 800 ألف كلمة، كما تم بناء قاموس متعدد اللهجات يحتوي على 47 ألف مفردة.
ويضيف أن عدد المشاركين في هذا المشروع 55 شخصاً، من الألسنيين ومحبي اللهجات من كل المدن التي ركزنا عليها في المشروع، ومبرمجين وباحثي ذكاء اصطناعي.
وعن وجود أكثر من لهجة في الدولة الواحدة، ومدى قدرة البرنامج على التعامل مع كل هذه اللهجات، أوضح د. حبش أنهم يركزون على لهجات المدن، وليس الدول أو المناطق الجغرافية، لذلك تم اختيار المدن التي تمثل مناطق اللهجات المختلفة في العالم العربي. فمثلاً في مصر، اختاروا 3 مدن، هي: الإسكندرية والقاهرة وأسوان. ومن العراق، اختاروا الموصل وبغداد والبصرة.
ويطمح المشروع إلى إضافة مدن أخرى في المستقبل، لكنه ركز في هذه المرحلة على 25 مدينة فقط بسبب القيود الزمنية والمالية، كما أكد د. حبش.
ولا يخشى العاملون بالمشروع الانتقادات التي قد توجه لهم بتشجيع استخدام اللهجات المحلية، في وقت ينبغي أن يعطوا فيه الأولوية للعربية الفصحى، وقال د. حبش: «نحن كاختصاصيين عرب في الذكاء الاصطناعي وتقنيات اللغات هدفنا الأول والأخير هو تحسين القدرات الآلية لتحليل اللغة العربية (فصحى وعامية) لتناهض القدرات الآلية المتوفرة للغات الأجنبية (الإنجليزية والفرنسية خصوصاً)».”

ADIDA

اكتب تعليق

You don't have permission to register