الـواحــة الطلابيــة للجـامعــة الوطنيــة الخـاصــة
Student Oasis of Al-Wataniya Private University
الدكتورة : سمر الحلبي
عدنان ماهر كفري
الملخص
في ظل التقدم السريع للذكاء الاصطناعي، تُستخدم الشبكات العصبية التلافيفية (CNN) في تحليل البيانات البصرية، لكن ضبط معاملاتها الفائقة يمثل تحديًا مكلفًا زمنيًا وحسابيًا. تعتمد الطرق التقليدية على البحث العشوائي أو الشبكي، لكنها قد لا تحقق الأداء الأمثل.
تتناول هذه المقالة منهجية التعليم العميق التطوري والخوارزميات الجينية كحل أكثر كفاءة، حيث تستند إلى مبادئ التطور الطبيعي مثل الانتقاء والطفرات لتحسين أداء الشبكة تلقائيًا. يتيح هذا النهج تحسين دقة النماذج وتسريع عملية التدريب، مما يجعله خيارًا واعدًا لتطبيقات مثل التشخيص الطبي والسيارات ذاتية القيادة.
الكلمات المفتاحية: الشبكات العصبية التلافيفية، التعليم العميق التطوري، الخوارزمية الجينية.
مقدمة
في ظل الثورة التكنولوجية المتسارعة، أصبح الذكاء الاصطناعي عنصرًا أساسيًا في العديد من الابتكارات الحديثة التي تمس حياتنا اليومية، مثل التصنيف الذكي للصور، التعرف على الكلام، وتشخيص الأمراض الطبية. في صميم هذا التقدم يكمن التعلم العميق، حيث تُعتبر الشبكات العصبية التلافيفية (CNN) من أبرز تقنياته، نظرًا لقدرتها الفائقة على معالجة البيانات البصرية وتحقيق نتائج دقيقة في مهام متعددة [1].
على الرغم من نجاح هذه الشبكات في التطبيقات المتقدمة، إلا أن تحسين معاملاتها الفائقة (Hyperparameters) لا يزال يشكل تحديًا كبيرًا، إذ يتطلب ضبطها الأمثل تجارب يدوية متعددة تستغرق وقتًا طويلاً وتستهلك موارد كبيرة، مما يزيد من التعقيد ويبطئ عملية التطوير. بالإضافة إلى ذلك، يواجه الباحثون مشكلات تقليدية مثل الضبط الزائد (Overfitting) ونقص البيانات، مما يحد من قدرة هذه النماذج على التعميم والأداء الجيد في الحالات غير المألوفة [3][5].
هنا يظهر التعليم العميق التطوري باستخدام الخوارزميات الجينية كحل مبتكر. تعتمد هذه الخوارزميات على مفاهيم مستوحاة من الطبيعة، مثل الانتقاء الطبيعي والطفرة، لاستكشاف واسع النطاق للمعاملات الفائقة وتصميم البنى المثلى للشبكات بشكل تلقائي. وفقًا لـلدراسات، فإن أساليب التطور العصبي (Neuroevolution) قد أثبتت فعاليتها في تحسين هياكل الشبكات العصبية وتدريبها دون تدخل بشري مكثف. بفضل قدرتها على تحسين الأداء ديناميكيًا وتقليل الجهد البشري والوقت اللازم للتجريب، تُعد الخوارزميات الجينية أداة فعالة لمعالجة التحديات التقليدية، مما يفتح آفاقًا جديدة لتحسين الشبكات العصبية التلافيفية في مجالات حساسة مثل تحليل الصور الطبية، السيارات ذاتية القيادة، وتطبيقات الروبوتات الذكية [2][6][1].
الشبكات العصبية التلافيفية (Convolutional Neural Networks – CNNs)
تمثل الشبكات العصبية التلافيفية (CNNs) أحد أهم فروع التعلم العميق، حيث أثبتت فعاليتها العالية في معالجة وتحليل البيانات البصرية، مثل الصور والفيديوهات [1]. تُعد CNNs امتدادًا للشبكات العصبية الاصطناعية التقليدية (ANNs) ولكنها تتميز بقدرتها على استخراج الميزات التلقائية من البيانات، مما يقلل الحاجة إلى الهندسة اليدوية للخصائص (Feature Engineering) [3].
بفضل هذه الميزة، أصبحت CNNs التقنية الأساسية في تطبيقات مثل التعرف على الصور، تصنيف الكائنات، وتحليل المشاهد الطبية، كما أنها تشكل الأساس للعديد من أنظمة الذكاء الاصطناعي المستخدمة في السيارات ذاتية القيادة والتشخيص الطبي [4][5].
تتكون شبكات CNN من عدة طبقات رئيسية تعمل معًا لاستخراج الميزات من الصور المدخلة وتحليلها [3]:
وتستخدم في العديد من المجالات، من أهمها:
تصنيف الصور (Image Classification):
يتم استخدام CNNs في تصنيف الصور إلى فئات محددة، مثل التعرف على الحيوانات أو تصنيف الأمراض الجلدية. من أشهر النماذج المستخدمة في هذا المجال AlexNet و VGG وResNet .
الكشف عن الأشياء (Object Detection) :
تُستخدم CNNs في أنظمة مثل YOLO و Faster R-CNN لتحديد أماكن الأجسام داخل الصور، وهي أساسية في تطبيقات الأمن والمراقبة والسيارات ذاتية القيادة.
معالجة الفيديو (Video Analysis):
يتم استخدام CNNs في تحليل مقاطع الفيديو، مثل تتبع الأجسام والتعرف على الأنشطة. يمكن دمج CNNs مع الشبكات التكرارية (RNNs) لإنشاء نماذج قادرة على التعرف على الحركات والأنماط في الفيديوهات الزمنية .
تحليل الصور الطبية:
يُستخدم CNN في تشخيص الأمراض من خلال صور الأشعة السينية والتصوير بالرنين المغناطيسي، مما يساعد الأطباء على اكتشاف الأمراض مبكرًا مثل سرطان الثدي واعتلال الشبكية السكري [7].
آلية عمل الشبكات العصبية التلافيفية
تعتمد آلية التلافيف على تطبيق مرشح بحجم معين (مثل 3×3 أو 5×5) على الصورة المدخلة، بحيث يقوم هذا المرشح بتحليل أجزاء صغيرة من الصورة في كل مرة، ويتم تحريك المرشح عبر الصورة باستخدام خطوة تنقل (Stride) محددة. في كل خطوة، يتم حساب الناتج التلافيفي عبر الضرب النقطي بين قيم البكسلات في جزء الصورة وقيم المرشح، ثم يتم تجميع هذه القيم في خريطة الميزات [2][3].
من الميزات المهمة لطبقات التلافيف أنها تتعلم تلقائيًا أهم الأنماط في البيانات، حيث تصبح الطبقات الأولى مسؤولة عن التقاط الميزات الأساسية مثل الحواف والحدود، بينما تتخصص الطبقات العميقة في تحليل الأنماط الأكثر تعقيدًا مثل الأشكال والأجسام الكاملة [1][7]. هذا يتيح للشبكة القدرة على التعميم والتعامل مع أشكال مختلفة من نفس الفئة دون الحاجة إلى تصميم يدوي للميزات، مما يجعل CNNs قوية في مهام الرؤية الحاسوبية[6].
الشكل (1) : توضيح لطبقات شبكات CNN
آلية تحديث الأوزان باستخدام التدرج العكسي
تُعد آلية التدرج العكسي (Backpropagation) حجر الأساس في تدريب شبكات CNN، حيث تسمح بتحديث الأوزان داخل الشبكة بناءً على الخطأ الناتج عن التنبؤات. تتبع هذه العملية خوارزمية الانتشار العكسي للخطأ، والتي تعتمد على حساب مشتقات دالة التكلفة بالنسبة للأوزان عبر سلسلة من العمليات الحسابية العكسية من الطبقة الأخيرة إلى الأولى [1][3].
وينفذ التدرج العكسي وفق المراحل التالية:
تكرار هذه العملية عبر عدد كبير من الدورات (Epochs) يؤدي إلى تحسين أداء النموذج وجعله أكثر دقة في التعرف على الأنماط في البيانات المدخلة.
تحديات ضبط معاملات CNN:
تواجه شبكات CNN عدة تحديات أثناء التدريب، منها Overfitting، Underfitting، وزيادة التعقيد الحسابي:
يحدث عندما تتعلم الشبكة البيانات التدريبية بشكل دقيق جدًا، مما يجعلها تفشل في التعميم على بيانات جديدة. يظهر هذا عندما يكون أداء النموذج عاليًا على بيانات التدريب ولكنه ضعيف على بيانات الاختبار.
يحدث عندما يكون النموذج غير قادر على تعلم الأنماط الأساسية في البيانات بسبب نقص التعقيد في الشبكة أو نقص بيانات التدريب.
تُعد شبكات CNN مكلفة حسابيًا، خاصة مع زيادة عدد الطبقات والمعاملات الفائقة. مما يؤدي إلى ارتفاع متطلبات المعالجة (GPU Usage) وزمن التدريب.
كما يؤدي عدم اختيار المعاملات بشكل مناسب الى:
معدل التعلم (Learning Rate) :
يُعتبر من أهم المعاملات الفائقة، حيث يؤدي معدل تعلم مرتفع إلى تذبذب الشبكة وعدم استقرارها، بينما يؤدي المعدل المنخفض إلى تباطؤ عملية التعلم. غالبًا ما يتم استخدام معدلات تعلم ديناميكية مثل Scheduler Learning Rate لضبط القيم أثناء التدريب [4][5].
عدد الطبقات (Depth of CNN):
زيادة عدد الطبقات يعزز قدرة النموذج على التعرف على الميزات المعقدة، ولكنه قد يزيد من خطر Overfitting. تعتمد الشبكات الحديثة مثل ResNet على آلية التوصيلات الالتفافية (Skip Connections) للتغلب على مشكلة تلاشي التدرج (Vanishing Gradient) وتحقيق توازن بين العمق والكفاءة [6] .
حجم المرشحات (Filter Size):
يؤثر اختيار حجم المرشحات على كيفية التقاط الميزات من الصور:
الطرق التقليدية لضبط معاملات CNNs :
تعتمد كفاءة شبكات CNN بشكل كبير على اختيار المعاملات الفائقة (Hyperparameters)، حيث تؤثر هذه المعاملات على سرعة التدريب، جودة التعميم، والأداء النهائي للنموذج. يتطلب ضبط هذه المعاملات عملية دقيقة نظرًا لأن الاختيار غير المناسب قد يؤدي إلى زيادة وقت التدريب، انخفاض الدقة، أو مشاكل في استقرار النموذج. لتحقيق ذلك، استخدم الباحثون عدة طرق تقليدية، لكل منها مزايا وعيوب. يمكن تلخيص أهم هذه الطرق في الجدول التالي:
العيوب | المزايا | الوصف | الطريقة |
مكلف حسابيًا، خاصة في المساحات عالية الأبعاد. | يضمن إيجاد التركيبة المثلى إذا كان النطاق مناسبًا. يمكن تنفيذه بالتوازي لتسريع العمليات. | تجربة جميع التركيبات الممكنة للمعاملات الفائقة ضمن نطاق محدد مسبقًا. | البحث الشبكي [2][4] |
لا يضمن العثور على أفضل القيم. يعتمد على الحظ، مما قد يؤدي إلى نتائج غير متوقعة. | أكثر كفاءة من البحث الشبكي في المساحات الكبيرة. يمكنه العثور على قيم جيدة بسرعة أكبر. | اختيار القيم عشوائيًا ضمن النطاق المحدد دون تجربة جميع التركيبات الممكنة. | البحث العشوائي (Random Search) [2] |
أكثر تعقيدًا من الناحية الحسابية. يسوء عند التعامل مع بيئات تتغير فيها العلاقات بين المعاملات أثناء التدريب. | يقلل عدد التجارب المطلوبة مقارنة بالبحث الشبكي والعشوائي. أكثر كفاءة في المساحات ذات الأبعاد العالية. | يعتمد على بناء نموذج إحصائي يتعلم من النتائج السابقة لاختيار أفضل القيم الممكنة للتجربة التالية. | التحسين البايزي (Bayesian Optimization) [1][5][2] |
الجدول (1) : توضيح بعض الطرق التقليدية لضبط المعاملات
تشير الدراسات إلى أن Bayesian Optimization أكثر كفاءة من الطرق التقليدية الأخرى، حيث يقلل عدد التجارب المطلوبة مع تحقيق دقة أعلى [1]. ومع ذلك، لا تزال جميع هذه الطرق تعاني من محدودية في الأداء عند التعامل مع شبكات CNN العميقة جدًا، مما يستدعي البحث عن استراتيجيات أكثر تطورًا، مثل الخوارزميات التطورية والتعليم العميق التطوري.
محدودية الأساليب التقليدية ومشاكلها في شبكات CNN العميقة
أظهرت دراسة حول تحسين معاملات CNN أن تقنيات البحث التقليدي تتوقف عن العمل بفعالية عند التعامل مع أكثر من 10 معاملات فائقة، مما يتطلب استراتيجيات أكثر ذكاءً مثل الخوارزميات التطورية
(Evolutionary Algorithms) [6].
التعليم العميق التطوري (Evolutionary Deep Learning)
ظهر التعليم العميق التطوري كمجال بحثي يدمج بين التعلم العميق (Deep Learning) والخوارزميات التطورية (Evolutionary Algorithms) بهدف تحسين أداء الشبكات العصبية بشكل تلقائي وفعال. يعتمد هذا النهج على استلهام مبادئ التطور الطبيعي، مثل الانتقاء الطبيعي، الطفرة، وإعادة التركيب الجيني، لتحسين المعاملات الفائقة (Hyperparameters) وهياكل الشبكات العصبية دون الحاجة إلى تدخل بشري مكثف.
آلية عمل التعليم العميق التطوري في تحسين نماذج الذكاء الاصطناعي
يعتمد التعليم العميق التطوري على استراتيجيات مستوحاة من التطور الطبيعي لتحسين الشبكات العصبية العميقة مثل CNNs. يهدف هذا النهج إلى تحسين البنية الفوقية للشبكة العصبية عبر ضبط المعاملات الفائقة وتطوير الهياكل باستخدام خوارزميات تطورية مثل الخوارزميات الجينية (Genetic Algorithms – GA) والتطور التفاضلي (Differential Evolution – DE) [1].
تعتمد استراتيجية التحسين التطوري على دورة تكرارية من التوليد، التقييم، الانتقاء الطبيعي، والتحور كما يلي:
الخوارزميات الجينية (Genetic Algorithms – GAs)
الخوارزميات الجينية (GA) هي إحدى خوارزميات الحوسبة التطورية (Evolutionary Computation) المستوحاة من نظرية التطور الداروينية، حيث تعتمد على آليات مثل الانتقاء الطبيعي، التهجين، والطفرات لمحاكاة عملية التطور البيولوجي بهدف إيجاد حلول مثلى للمشكلات المعقدة.تمثل GA إطارًا حسابيًا يُستخدم على نطاق واسع في تحسين الشبكات العصبية، لا سيما في ضبط المعاملات الفائقة (Hyperparameter Optimization) وتصميم الهياكل الفوقية (Architecture Search) لشبكات CNN، تعمل هذه الخوارزميات من خلال تكرار العمليات التطورية، بحيث يتم تحسين جودة الحلول تدريجيًا عبر عدة أجيال [1] تعتمد الخوارزميات الجينية على دورة تكرارية من العمليات الأساسية التالية:
الوصف | العملية |
يتم تمثيل كل حل ممكن (فرد) في مجموعة الحلول (Population) باستخدام سلاسل رقمية (عادةً كروموسومات ثنائية أو متجهات عددية) تمثل معاملات الشبكة العصبية مثل عدد الطبقات، ومعدل التعلم. | التمثيل أو الترميز (Encoding) |
يتم قياس جودة كل فرد في المجموعة بناءً على دالة تقييم محددة، مثل دقة التصنيف في CNN أو قيمة دالة تكلفة معينة. | التقييم (Fitness Evaluation) |
يتم اختيار الأفراد الأفضل أداءً في المجموعة لإنتاج الجيل التالي، وذلك باستخدام استراتيجيات مثل الانتقاء العشوائي المتناسب مع التقييم (Roulette Wheel Selection) . | الانتقاء الطبيعي (Selection) |
يتم دمج معلومات من فردين لإنشاء أفراد جدد (الأبناء)، مما يسمح بنقل الميزات الجيدة من جيل إلى آخر وتحسين الاستكشاف في فضاء الحلول. | التهجين (Crossover) |
يتم تغيير بعض القيم في الأفراد بشكل عشوائي لإضافة التنوع الجيني ومنع وقوع الحلول في المحليات المثلى (Local Optima)، مما يساعد على استكشاف مساحات أوسع من الحلول الممكنة. | الطفرات (Mutation) |
يتم تكرار هذه العمليات لعدة أجيال حتى يتم الوصول إلى حل مثالي أو مستوى أداء مستقر. | التكرار (Iteration) |
الجدول (2) : العمليات التي تقوم بها الخوارزمية الجينية
في سياق تحسين شبكات CNN ، يتم استخدامGA لضبط المعاملات الفائقة أو حتى تطوير هياكل جديدة للشبكة بشكل تلقائي، مما يسمح بتحقيق أداء أعلى مقارنةً بالطرق التقليدية .
استخدام الخوارزميات الجينية لتحسين معاملات CNN
تُعد الخوارزميات الجينية (GA) من الأدوات الفعالة في تحسين المعاملات الفائقة (Hyperparameters) لشبكات CNN ، حيث تساعد في استكشاف نطاق واسع من القيم الممكنة للوصول إلى الإعدادات المثلى التي تعزز من أداء الشبكة [2]، يمكن استخدام GA لتحسين عدة معاملات مثل:
تعمل GA على تحسين هذه المعاملات عبر تنفيذ عمليات الانتقاء، التهجين، والطفرات، حيث يتم تجربة توليفات مختلفة منها بشكل تلقائي دون الحاجة إلى التجريب اليدوي المرهق. تُظهر العديد من الدراسات، أن GA تتفوق على الطرق التقليدية من حيث كفاءة البحث وسرعة الوصول إلى معاملات فعالة للشبكة [2][4].
وقد برزت كفاءة الخوارزمية الجينية GA مقارنة مع الطرق التقليدية من خلال النقاط التالية :
تمتاز الخوارزميات الجينية (GA) بقدرتها على البحث الفعّال في مساحات المعاملات عالية الأبعاد مقارنةً بالطرق التقليدية مثل البحث الشبكي (Grid Search) والبحث العشوائي
(Random Search). وذلك بفضل عمليات التهجين والطفرات التي تتيح استكشاف حلول جديدة بذكاء، مما يتجنب مشاكل البحث العشوائي المحدود أو البحث المكلف زمنيًا. [4]
بينما يتطلب البحث الشبكي (Grid Search) تجربة جميع التوليفات الممكنة، مما يجعله مكلفًا حسابيًا، تعتمد الخوارزميات الجينية (GA) على الانتقاء الذكي للأفراد الأنسب، مما يقلل عدد التجارب المطلوبة. وعلى الرغم من أن التحسين البايزي (Bayesian Optimization) قد يكون أسرع في بعض الحالات، إلا أنه قد يكون أقل دقة في المساحات البحثية الكبيرة. [2]
تتميز الخوارزميات الجينية (GA) بقابليتها للتكيف مع مشكلات متنوعة دون الحاجة إلى تعديلات جذرية في بنيتها، على عكس الطرق التقليدية التي تتطلب إعادة ضبط يدوي عند تغيير هيكل الشبكة أو حجم البيانات. وقد أثبتت الدراسات فعالية GA في تحسين شبكات CNN في تطبيقات مثل تصنيف الصور، التعرف على المشاعر، وتحليل البيانات الطبية، مما يجعلها أكثر مرونة [5][6].
خطوات تصميم نظام يجمع بين التعليم العميق التطوري والخوارزميات الجينية:
مع التزايد المستمر في تعقيد الشبكات العصبية التلافيفية (CNN) وارتفاع عدد المعاملات الفائقة (Hyperparameters) التي تحتاج إلى ضبط دقيق، ظهر نهج الجمع بين التعليم العميق التطوري (Neuroevolution) والخوارزميات الجينية (GA) كحلٍّ فعال يهدف إلى أتمتة تحسين البنية الداخلية لشبكات CNN وتقليل الحاجة إلى التدخل البشري [3][5]. يتيح هذا الدمج إمكانية البحث الديناميكي عن أفضل تركيبة للمعاملات الفائقة وتحسين أداء النموذج دون الاعتماد على عمليات الضبط اليدوي التقليدية، والتي غالبًا ما تكون مكلفة حسابيًا وزمنيًا.
يتم تنفيذ هذه المنهجية وفق خطوات متكاملة تبدأ من إنشاء جيل أولي من الشبكات العشوائية، مرورًا بتقييم أداء كل نموذج، ثم تطبيق آليات التطور مثل الانتقاء الطبيعي، التهجين، والطفرات، وصولًا إلى تحسين تدريجي مستمر حتى تحقيق هيكل أمثل لشبكة CNN .
يتم ترميز كل نموذج CNN كفرد داخل الجيل الأولي، حيث تُحدد خصائص كل نموذج عبر مجموعة من المعاملات الفائقة التي تشمل عدد الطبقات، حجم النواة، معدل التعلم، دوال التفعيل، وحجم الدُفعات التدريبية [5]. يتم إنشاء هذا الجيل الأول عشوائيًا لتغطية نطاق واسع من القيم الممكنة، مما يعزز قدرة GA على استكشاف فضاء الحلول منذ البداية. تُعد هذه الخطوة محورية لأنها تحدد تنوع الأفراد في الأجيال اللاحقة، مما يمنع وقوع البحث التطوري في حلول محلية غير مثالية.
بعد إنشاء الجيل الأول، يتم تدريب كل نموذج على مجموعة بيانات معيارية مثل CIFAR-10 أو ImageNet، ومن ثم يتم تقييم أدائه باستخدام دوال تكلفة مثل Cross-Entropy لقياس الخطأ أو مؤشرات الأداء مثل الدقة (Accuracy) [3]. هذا التقييم هو العامل الأساسي في تحديد الأفراد القادرين على الاستمرار في الأجيال القادمة، حيث يتم الاحتفاظ بالشبكات التي تحقق أداءً مرتفعًا واستبعاد تلك ذات الأداء الضعيف.
بعد تحديد النماذج الأعلى كفاءة، يتم تطبيق آليات التطور الجيني لضمان التحسين المستمر للأداء، وتشمل هذه العمليات
4. إعادة التدريب والتحسين التدريجي:
يتم تمرير الأفراد الجدد إلى دورة تدريبية جديدة حيث يخضعون لنفس عملية التقييم السابقة، ويتم إعادة اختيار أفضلهم ليدخلوا جولة أخرى من التطور والتكرار. يستمر هذا التكرار لعدة أجيال حتى يصل النموذج إلى مستوى أداء مستقر وأمثل. عند اكتمال هذه العملية، يتم اختبار أفضل نموذج نهائي باستخدام بيانات لم تُستخدم أثناء التدريب للتحقق من قابلية التعميم على بيانات جديدة [3][5].
تحسين اختيار المعاملات الفائقة لشبكات CNN باستخدام GA والتعلم العميق التطوري:
يعتمد أداء شبكات CNN بشكل كبير على ضبط المعاملات الفائقة بطريقة مثالية، إلا أن الطرق التقليدية مثل البحث الشبكي (Grid Search) والبحث العشوائي (Random Search) تعاني من ارتفاع التكلفة الحسابية وصعوبة التعامل مع المساحات البحثية الكبيرة [4]. في هذا السياق، توفر الخوارزميات الجينية إطارًا تكيفيًا أكثر كفاءة، حيث تستخدم استراتيجيات بحث تطورية وديناميكية لتحسين المعاملات بطريقة تدريجية دون الحاجة إلى اختبار جميع التركيبات الممكنة.
يتم تمثيل كل مجموعة من المعاملات كسلسلة رقمية يتم تحديثها عبر الأجيال. يتم تقييم أداء كل توليفة باستخدام دالة تكلفة (Loss Function) ، حيث يتم احتساب دقة التصنيف أو مدى تقليل الخطأ بناءً على نتائج التدريب. تُظهر الدراسات أن هذه الطريقة أكثر كفاءة من الطرق التقليدية، حيث يمكنها اكتشاف معاملات فائقة مناسبة في عدد أقل من التكرارات مقارنةً بطرق البحث العشوائية [3][5].
تعتمد GA على استراتيجيات متطورة للبحث داخل فضاء المعاملات، حيث يتم استخدام:
من أهم مزايا التعليم العميق التطوري والخوارزميات الجينية هو قدرتهما على التكيف التلقائي مع تغييرات البيانات. إذ يمكن لهذه الاستراتيجيات تعديل المعاملات وفقًا لاختلافات البيانات المستخدمة، مما يؤدي إلى تحسين تعميم النموذج وزيادة دقته مقارنةً بالأساليب الثابتة التي لا تتفاعل مع التغيرات [6] .
الخاتمة
يعد تحسين معاملات الشبكات العصبية التلافيفية (CNN) من أبرز التحديات في تطوير نماذج ذكاء اصطناعي دقيقة وفعالة، حيث تؤثر هذه المعاملات على دقة النموذج وسرعة التدريب وكفاءة استهلاك الموارد الحوسبية. رغم أن الطرق التقليدية مثل Grid Search و Bayesian Optimization تقدم حلولًا لتحسين هذه المعاملات، إلا أنها تعاني من ارتفاع التكلفة الحسابية وصعوبة التعامل مع الفضاءات البحثية واسعة الأبعاد.
استعرضت هذه المقالة نهجًا أكثر كفاءة قائمًا على التعليم العميق التطوري والخوارزميات الجينية، حيث يُستخدم التعليم العميق التطوري في تحسين بنية الشبكة بشكل ديناميكي، بينما تتيح الخوارزميات الجينية بحثًا تطوريًا عن أفضل المعاملات الفائقة عبر آليات الانتقاء الطبيعي والتهجين والطفرات. أظهرت النتائج أن هذا الدمج يحقق تحسينًا في دقة النماذج وتقليلًا في وقت التدريب مقارنة بالأساليب التقليدية، مع قدرة أفضل على التعميم على بيانات جديدة.
ورغم هذه الفوائد، لا تزال هناك تحديات قائمة مثل التعقيد الحسابي وزمن التنفيذ، مما يستدعي استكشاف تقنيات تكاملية جديدة، مثل الذكاء الاصطناعي التكيفي والحوسبة السحابية لتوزيع عمليات البحث بكفاءة أعلى. مستقبلًا، يمكن تعزيز أداء الخوارزميات الجينية من خلال مقاربات هجينة تجمع بين GA وتقنيات مثل Bayesian Optimization ، مع توسيع نطاق تطبيقاتها إلى مجالات مثل السيارات ذاتية القيادة، الأمن السيبراني، والتشخيص الطبي.
المراجع :
[1] Galván, E., & Mooney, P. (2020). “Neuroevolution in Deep Neural Networks: Current Trends and Future Challenges”. arXiv preprint arXiv:2006.05415.
[2]Schuchardt, J., Golkov, V., & Cremers, D. (2019).”Learning to Evolve”. arXiv preprint arXiv:2105.00826.
[3]Sun, Y., Xue, B., Zhang, M., Yen, G. G., & Lv, J. (2020).”Automatically Designing CNN Architectures Using Genetic Algorithm for Image Classification”. IEEE Transactions on Evolutionary Computation, 24(2), 394-407.
[4] براهيم، ك. ك.، ديوب، ي. ش.، & مقديسيان، ل. ر. (2021).” تحسين أداء الشبكات العصبية التلافيفية باستخدام الحوسبة التطورية”. مجلة اتحاد الجامعات العربية للدراسات والبحوث الهندسية، 28(3)، 53-61.
[5] Vetrimani, E., Arulselvi, M., & Ramesh, G. (2021). “Building convolutional neural network parameters using genetic algorithm for the croup cough classification problem”.
[6] Mohammadrezaei, P., Aminan, M., Soltanian, M., & Borna, K. (2022). “Improving CNN-based solutions for emotion recognition using evolutionary algorithms”.
[7]Zhang, Y., Wang, L., Zhao, J., Han, X., Wu, H., Li, M., & Deveci, M. (2024). “A convolutional neural network based on an evolutionary algorithm and its application”.