تحليل مقارن لهندستي الشبكات العصبية التلافيفية (CNN) والمتكررة (RNN) لتصنيف النصوص العربية القائم على التعلم العميق

المؤلفون

  • عبدالمولى الناجح قسم الحاسوب، المعهد العالي للعلوم والتكنولوجيا، غريان، ليبيا Author
  • رمزي الشقف قسم علوم الحاسوب، كلية العلوم الأساسية، الأكاديمية الليبية، طرابلس، ليبيا Author
  • البهلول عبود كلية تكنولوجيا المعلومات، جامعة غريان، ليبيا Author
  • سالم الناجح المعهد العالي للعلوم والتكنولوجيا، قسم الحاسوب، طرابلس، ليبيا Author

DOI:

https://doi.org/10.26629/jtr.2025.46

الكلمات المفتاحية:

الشبكات العصبية التلافيفية (CNN) والمتكررة (RNN)، تحليل مقارن، تصنيف النصوص العربية

الملخص

إن الانتشار المتزايد للمحتوى الرقمي العربي قد خلق حاجة ملحة لأنظمة فعالة لتصنيف النصوص. ومع ذلك، فإن البنية الصرفية المعقدة للغة العربية، بما في ذلك الاشتقاق القائم على الجذور وطابعها اللاصقي، تشكل تحديات كبيرة للمعالجة الآلية. على الرغم من أن نماذج التعلم العميق مثل الشبكات العصبية التلافيفية (CNNs) والشبكات العصبية المتكررة (RNNs) أظهرت نتائج واعدة، إلا أن فعاليتها النسبية في معالجة النصوص العربية لا تزال غير مدروسة بشكل كاف. تقدم هذه الدراسة مقارنة تجريبية شاملة بين نموذجي CNN و RNN لتصنيف النصوص العربية متعددة الفئات. قمنا بتجميع مجموعة بيانات غير متجانسة تشمل سبعة مجالات متميزة—بما في ذلك الرياضة والسياسة والاقتصاد—لضمان متانة النماذج. تم تنفيذ خطوة معالجة مسبقة صارمة مخصصة للغة العربية، تشمل التصريف، وإزالة الكلمات غير الضرورية، والتقطيع. استخدم نموذج CNN تضمينات الكلمات GloVe لتمثيل الميزات، بينما استخدم نموذج RNN متجهات TF-IDF. أظهرت نتائجنا تفاوتًا كبيرًا في الأداء: حقق نموذج RNN دقة ملحوظة بلغت 98٪، متفوقًا بشكل كبير على نموذج CNN الذي حقق دقة 79٪. كشف تحليل منحنيات التعلم أن نموذج CNN عانى من الإفراط في التكيف، مما أدى إلى فشله في التعميم beyond بيانات التدريب. في المقابل، استطاع نموذج RNN التقاط التبعيات التسلسلية والمعلومات السياقية بكفاءة، وهي عناصر حاسمة لفهم تركيب اللغة العربية وصرفها. تشير النتائج بقوة إلى أن هياكل RNN تتفوق في مهام تصنيف النصوص العربية بسبب قدرتها الفطرية على نمذجة العلاقات الدلالية طويلة المدى. يقدم هذا البحث رؤى قيمة لاختيار وتطوير هياكل التعلم العميق المثلى لتطبيقات معالجة اللغة الطبيعية العربية.

التنزيلات

تنزيل البيانات ليس متاحًا بعد.

التنزيلات

منشور

2025-12-28

كيفية الاقتباس

تحليل مقارن لهندستي الشبكات العصبية التلافيفية (CNN) والمتكررة (RNN) لتصنيف النصوص العربية القائم على التعلم العميق. (2025). مجلة البحوث التقنية, 494-504. https://doi.org/10.26629/jtr.2025.46