الـواحــة الطلابيــة للجـامعــة الوطنيــة الخـاصــة
Student Oasis of Al-Wataniya Private University
الدكتورة : سمر الحلبي
أنس كيلاني
الملخص:
شهدت تقنيات رؤية الكمبيوتر والتعلم العميق تطورًا ملحوظًا في السنوات الأخيرة، لا سيما في مجال تقدير وضعيات الجسم البشري سواءً في الأبعاد الثنائية أو الثلاثية. تعتمد هذه التقنيات على أجهزة متقدمة مثل كاميرات RGB وأنظمة LiDAR والرادارات، والتي تتيح دقة عالية في تتبع حركة الجسم. ومع ذلك، تواجه هذه التقنيات عدة تحديات، من بينها تأثير ظروف الإضاءة غير الملائمة على جودة البيانات، ووجود عوائق مادية قد تعيق الرؤية الكاملة للجسم. كما أن التكلفة المرتفعة لهذه الأجهزة والحاجة إلى بنية تحتية متخصصة تشكل عائقًا أمام انتشارها على نطاق واسع. إضافةً إلى ذلك، تثير هذه التقنيات مخاوف تتعلق بالخصوصية، خاصةً عند استخدامها في البيئات الشخصية مثل المنازل والأماكن الخاصة.
مقدمة:
شهد مجال تقدير وضعيات الجسم البشري تطورًا ملحوظًا في السنوات الأخيرة، بفضل استخدام تقنيات متقدمة تعتمد على مستشعرات متنوعة مثل كاميرات RGB ، أنظمة LiDAR (الكشف وتحديد المدى باستخدام الضوء)، والرادارات. وقد أثبتت هذه التقنيات كفاءتها العالية في تطبيقات متعددة، بما في ذلك الواقع المعزز والمراقبة الآلية [1]. ومع ذلك، تواجه هذه التقنيات تحديات تقنية وعملية تحد من انتشارها الواسع في الحياة اليومية، من أبرزها التكلفة العالية للأجهزة والحاجة إلى بنية تحتية متخصصة، مما يجعل استخدامها في البيئات المنزلية والعامة محدودًا.
بالإضافة إلى ذلك، تعتمد كاميرات RGB على ظروف إضاءة مناسبة لتحقيق أداء متميز، مما يجعلها أقل فعالية في البيئات ذات الإضاءة المنخفضة أو تلك التي تحتوي على عوائق مثل الأثاث والجدران، والتي قد تحول دون الحصول على رؤية شاملة للجسم. كما تُثير هذه التقنيات مخاوف جدية تتعلق بالخصوصية عند استخدامها في الأماكن الخاصة والمناطق المخصصة للفرد.
تزداد أهمية هذه التحديات في تطبيقات الرعاية الصحية التي تتجه نحو تقديم خدماتها في المنازل بدلاً من العيادات التقليدية، حيث تُستخدم الكاميرات في مراقبة كبار السن داخل منازلهم، مما قد يتعارض مع متطلبات الحفاظ على الخصوصية الشخصية.
في هذا السياق، برز استخدام إشارات Wi Fi كحل مبتكر لتجاوز القيود التي تواجهها المستشعرات التقليدية. إذ توفر إشارات Wi Fi بديلاً فعالًا من حيث التكلفة، حيث تتوفر أجهزة التوجيه المنزلية بأسعار معقولة ويمكن استخدامها لتغطية نطاقات واسعة، مما يجعلها ملائمة للاستخدام اليومي [1]. كما تتميز هذه التقنية بقدرتها على العمل في ظروف إضاءة متنوعة واختراق العوائق مثل الجدران والأثاث، مما يضمن تقدير وضعيات الجسم بدقة مع الحفاظ على خصوصية الأفراد.
تعتمد تقنيات الاستشعار القائمة على Wi Fi على معلومات حالة القناة (CSI: channel state information) التي تصف العلاقة بين الإشارة المرسلة والمستقبلة. ورغم تعقيد هذه الإشارات وافتقارها للمراسلات المكانية المباشرة كما هو الحال في الصور، إلا أن دمجها مع خوارزميات التعلم العميق يمكن من تحويلها إلى معلومات مكانية دقيقة تُسهم في تقدير وضعيات الجسم بشكل فعال حتى في البيئات التي تعاني من وجود عوائق متعددة. [1]
المنهجية:
تعتمد المنهجية المقترحة على استخدام بيانات CSI لشبكات Wi Fi لتحويلها إلى تمثيلات بصرية دقيقة تُستخدم في تقدير وضعيات الجسم البشري.
يوضح الشكل رقم 1 إعداد الأجهزة المستخدمة في التجربة، حيث تبدأ العملية بشرح الإعداد التجريبي، تُركب ثلاثة هوائيات إرسال وثلاثة هوائيات استقبال، مع استخدام كاميرا لأغراض التوضيح البصري فقط. تُعرض في الصفوف التالية إشارات السعة (amplitude) والطور (phase) المستخرجة من إشارة Wi Fi، لتكون بمثابة الأساس في تحليل وتقدير وضعيات الجسم حتى في وجود عوائق وتعدد أوضاع الأشخاص
الشكل 1: إعداد التجربة بإشارات Wi Fi
تتألف العملية من ست مراحل رئيسية تُشرح بالتفصيل فيما يلي:
أولا: جمع البيانات الأولية:
في البداية، تُوزَّع ثلاثة أجهزة إرسال Wi Fi وثلاثة أجهزة استقبال داخل بيئة الاختبار، مما يضمن تغطية شاملة تسمح بالتقاط كافة التغيرات الدقيقة في إشارات CSI تُسجَّل بيانات CSI الخاصة بالسعة والطور عند تفاعل الإشارات مع الأجسام البشرية. تُنظَّم هذه البيانات في مصفوفة ثلاثية الأبعاد بأبعاد 3 × 3؛ حيث تمثل كل خلية العلاقة بين جهاز إرسال محدد مثل E1 وجهاز استقبال معين مثل R1 يوضح الشكل رقم 2 إعداد الأجهزة والتجهيزات المستخدمة لجمع بيانات CSI وتحليلها، حيث تُجمع خمس عينات متتالية بمعدل 100 عينة في الثانية، تحتوي كل عينة على قيم معقدة مستمدة من 30 ترددًا فرعيًا للموجات الحاملة، مما يتيح تحليل التغيرات الزمنية بدقة وتوفير تسلسل زمني لتحليل ديناميكيات الحركة [3].
الشكل 2: عينات CSI من Wi Fi
ثانيا: معالجة وتنقية البيانات:
تُعتبر مرحلة تنقية الإشارات خطوة أساسية لتحسين جودة البيانات المُجمعة قبل استخدامها في المراحل التالية. في هذه المرحلة، يتم تطبيق تقنيات معالجة متقدمة لإزالة الضوضاء والتشويش عن الإشارات؛ مثل تعديل الطور وتنظيف السعة. تُستخدم معايير IEEE 802.11n/ac لضمان تسجيل البيانات من 30 ترددًا فرعيًا بشكل دقيق. يوضح الشكل رقم 3 خطوات التعقيم لتسلسلات CSI ، حيث تُبين العملية كيفية تحسين جودة الإشارات لتكون ملائمة للمعالجة اللاحقة دون إعادة شرح الاختصارات التي تم تعريفها مسبقًا
الشكل 3: خطوات التعقيم لتسلسلات CSI
ثالثا: تحويل البيانات إلى تمثيلات بصرية:
بعد تنقية البيانات، تُحوّل الإشارات إلى خرائط ميزات بصرية تُسهل عملية تحليل أوضاع الجسم. يتم ذلك باستخدام شبكة تحويل الأسلوب (Modality Translation Network)، حيث تُستخرج الميزات من إشارات السعة والطور عبر مشفرين منفصلين، ثم تُدمج النتائج وتُعاد تشكيلها لتوليد خريطة بصرية بأبعاد 3 × 720 × 1280. تُستخدم هذه الخريطة لاحقًا كنموذج أساسي لتحليل وتقدير الأوضاع الحركية. يوضح الشكل رقم 4 شبكة تحويل الأسلوب المستخدمة لتحويل إشارات CSI إلى خرائط ميزات بصرية. [5]
الشكل 4: شبكة تحويل الأسلوب (Modality Translation Network)
رابعا: تحليل وتمييز أوضاع الجسم:
تُمرر خريطة الميزات الناتجة إلى شبكة WiFi‑DensePose RCNN لتحليل وتمييز أوضاع الجسم. تبدأ هذه الشبكة بتحليل الخريطة باستخدام بنية ResNet‑FPN لاستخراج ميزات متعددة الدقة، ثم تُطبَّق تقنية تجميع مناطق الاهتمام (ROI pooling) لتحديد الأجزاء الحيوية مثل الأيدي، الأقدام، الرأس، والمفاصل. تُقسم العملية إلى وحدتين رئيسيتين:
يوضح الشكل رقم 5 شبكة WiFi‑DensePose RCNN المستخدمة في تحليل خريطة الميزات واستخلاص أوضاع الجسم بدقة. [6]
الشكل WiFi‑DensePose RCNN :5
خامسا: تحسين الأداء باستخدام التعلم النقلي:
لتسريع عملية التدريب وتحسين دقة النموذج، تُطبَّق تقنية التعلم النقلي (Transfer Learning)ويتم ذلك بنقل المعرفة من نموذج معتمد على صور RGB (Image-based Teacher Network) إلى نموذج يعتمد على إشارات Wi Fi فقط. تُدرَّب شبكة المعلم على مجموعات بيانات ضخمة لاستخلاص الميزات الأساسية وتوقع أوضاع الجسم، ثم تُستخدم هذه المعرفة لتدريب نموذج Wi Fi، مما يقلل من زمن التدريب ويحسن أداء النظام. يوضح الشكل رقم 6 عملية التعلم النقلي من شبكة معتمدة على الصور إلى شبكة [6] .Wi Fi
الشكل 6: التعلم النقلي من شبكة معتمدة على الصور إلى شبكة Wi Fi
سادسا: استخراج النتائج النهائية:
من خلال تكامل المراحل السابقة، يتم الحصول على نموذج قادر على تقدير وضعيات الجسم البشري بدقة عالية، حتى في البيئات المعقدة. يوفر النموذج تمثيلًا بصرىً شاملاً لحركة الجسم يُمكن استخدامه في تطبيقات متعددة مثل التفاعل مع الأنظمة الذكية، الرعاية الصحية، والمراقبة الذكية، مما يساهم في تقديم حلول متطورة لتحليل الحركات في الوقت الحقيقي.
يوضح الشكل رقم 7 مقارنة بين الاداء النتاج عن تقنية DensePose المستندة الى الصور وتقنية DensePose المستندةالى اشارات Wi Fi.
الشكل 7: امثلة للنتائج النهائية
مجموعة البيانات المستخدمة في التجربة:
تُعد مجموعة البيانات المستخدمة في هذه الدراسة أحد العناصر الرئيسية في تدريب واختبار النموذج المقترح لتقدير أوضاع الجسم البشري باستخدام إشارات Wi Fi وتشمل مجموعة البيانات عينات من بيانات CSI التي تُجمع من هوائيات الاستقبال بمعدل 100 هرتز، بالإضافة إلى تسجيل مقاطع فيديو بمعدل 20 إطارًا في الثانية. يتم تزامن هذه البيانات باستخدام طوابع زمنية دقيقة بحيث تُطابق خمس عينات من CSI مع كل إطار فيديو، مما يُتيح مقارنة فعالة بين الإشارات اللاسلكية والصور المرئية ويساهم في تحسين دقة التنبؤ بوضعيات الجسم [7].
تم جمع البيانات في 16 حالة مكانية مختلفة تشمل بيئات مختبرية وفصول دراسية. ففي البيئات المختبرية، تم الحصول على ستة لقطات من بيئة مكتب، بينما شملت التجربة عشرة لقطات من بيئة فصل دراسي. وقد تكررت التجارب في هذه البيئات مع توزيع متنوع للأشخاص والأثاث وأجهزة Wi Fi ، بحيث استغرقت كل عملية التقاط حوالي 13 دقيقة وشارك فيها من 1 إلى 5 أفراد. يوفر هذا التنوع البيئي فرصة لتحليل تأثير العوامل مثل توزيع الأثاث والتداخل بين إشارات Wi Fi على دقة تقدير أوضاع الأشخاص، مما يُساهم في تحسين قدرة النموذج على التكيف مع التغيرات سواء في بيئة ثابتة أو أثناء الحركة المستمرة [8].
وباستخدام هذه المجموعة المتنوعة من البيانات في تدريب النموذج، يتم تحسين أداء الخوارزميات المدمجة مما يؤدي إلى تقديم نتائج دقيقة وقابلة للتطبيق في مجالات متعددة مثل المراقبة الصحية في المنازل ورصد السلوكيات المشبوهة في الأماكن العامة.
حالات فشل النموذج:
أثناء تطوير النموذج واختباره، لوحظ حدوث نوعين رئيسيين من حالات الفشل أثرت على أداء النظام في بعض السيناريوهات:
يوضح الشكل رقم 8 أمثلة لحالات الفشل التي تم ملاحظتها خلال التجارب [9] .
الشكل 8: امثلة لحالات الفشل
ولتجاوز هذه المشكلات، يمكن تنفيذ عدد من التحسينات تشمل:
الخاتمة:
يسلط هذا المقال الضوء على إمكانية استخدام إشارات Wi Fi لتقدير أوضاع الجسم البشري بدقة باستخدام تقنيات التعلم العميق. يوفر النهج المُقترح بديلاً منخفض التكلفة وصديقاً للخصوصية مقارنة بالكاميرات التقليدية أو مستشعرات LiDAR، إذ يستفيد من البنية التحتية المتوفرة في العديد من البيئات. على الرغم من النجاحات التي تم تحقيقها، لا يزال أداء النموذج محدودًا بمدى جودة وتنوع بيانات التدريب، مما يؤدي إلى ظهور تحديات في التعامل مع الأوضاع النادرة وحالات الكثافة البشرية العالية.
في المستقبل، يهدف الباحثون إلى توسيع نطاق البيانات المُجمعة لتشمل حالات أكثر تنوعًا، مع تطوير قدرات النموذج لتقدير أشكال الجسم ثلاثية الأبعاد بدقة أعلى باستخدام إشارات Wi Fi فقط. يفتح هذا العمل آفاقًا واسعة لتطبيقات عملية تشمل الرعاية الصحية لمراقبة المرضى في المنازل، والمنازل الذكية لتحسين الأمان والكفاءة، ورصد السلوكيات المشبوهة مع الحفاظ على خصوصية الأفراد، مما يعزز من قيمة التكنولوجيا المقترحة في تحسين جودة الحياة وتوفير حلول ذكية ومستدامة.
المراجع والمصادر:
https://arxiv.org/abs/2001.05842
https://arxiv.org/abs/1802.00434
https://arxiv.org/abs/1904.00276
Zhao, L., & Ahmed, M. (2021).
Challenges and Solutions in Wi‑Fi-Based Human Pose Estimation: A Review. IEEE Transactions on Neural Networks and Learning Systems, 32(6), 2345–2356