التعلم الآلي (Machine learning)

التعلم الآلي (ML) هو مجال دراسة في الذكاء الاصطناعي يهتم بتطوير ودراسة الخوارزميات الإحصائية التي يمكن التعلم منها…

يشكل التعلم الآلي (ML) مجالًا ضمن الذكاء الاصطناعي مخصص لإنشاء وتحليل خوارزميات إحصائية قادرة على التعلم من البيانات، والتعميم على مجموعات البيانات الجديدة، وتنفيذ المهام دون توجيهات برمجة صريحة. ضمن هذا المجال الأوسع، مكنت التطورات في التعلم العميق، وهو نظام فرعي متخصص، الشبكات العصبية - وهي فئة محددة من الخوارزميات الإحصائية - من التفوق بشكل كبير على العديد من منهجيات التعلم الآلي السابقة.

التعلم الآلي (ML) هو مجال دراسة في الذكاء الاصطناعي يهتم بتطوير ودراسة الخوارزميات الإحصائية التي يمكنها التعلم من البيانات والتعميم على البيانات غير المرئية، وبالتالي أداء المهام دون تعليمات لغة برمجة صريحة. ضمن أحد التخصصات الفرعية للتعلم الآلي، سمحت التطورات في مجال التعلم العميق للشبكات العصبية، وهي فئة من الخوارزميات الإحصائية، بتجاوز العديد من أساليب التعلم الآلي السابقة في الأداء.

ترتكز المبادئ الأساسية للتعلم الآلي على أساليب مستمدة من الإحصائيات والتحسين الرياضي (المعروف أيضًا باسم البرمجة الرياضية). يمثل استخراج البيانات نظامًا مرتبطًا ارتباطًا وثيقًا، ويركز في المقام الأول على تحليل البيانات الاستكشافية (EDA) من خلال تطبيق تقنيات التعلم غير الخاضعة للرقابة.

من منظور نظري، ربما يوفر التعلم الصحيح تقريبًا (تعلم PAC) إطارًا رياضيًا وإحصائيًا قويًا لوضع تصور للتعلم الآلي. ضمن هذا الإطار، يمكن وصف غالبية خوارزميات التعلم الآلي والتعلم العميق بأنها عمليات تجريبية لتقليل المخاطر.

التاريخ

تم تقديم مصطلح التعلم الآلي في عام 1959 على يد آرثر صامويل، وهو موظف في شركة IBM وشخصية رائدة في ألعاب الكمبيوتر والذكاء الاصطناعي. في الوقت نفسه، تم أيضًا استخدام مرادف أجهزة الكمبيوتر ذاتية التعليم خلال هذه الحقبة.

ظهر برنامج رائد للتعلم الآلي في الخمسينيات من القرن العشرين، طوره آرثر صامويل، والذي قام بحساب احتمالات الفوز لكل جانب في لعبة الداما. ومع ذلك، فإن السوابق التاريخية للتعلم الآلي تمتد إلى عقود مضت، وهي نابعة من المساعي البشرية لفهم العمليات المعرفية. في عام 1949، نشر عالم النفس الكندي دونالد هيب تنظيم السلوك، حيث افترض بنية عصبية نظرية تنشأ من تفاعلات محددة بين الخلايا العصبية. أنشأ نموذج هب للتفاعل العصبي أساسًا أساسيًا لتشغيل الذكاء الاصطناعي وخوارزميات التعلم الآلي، خاصة فيما يتعلق بالعقد أو الخلايا العصبية الاصطناعية المستخدمة لاتصالات البيانات في الحوسبة. كما قدم باحثون آخرون يدرسون الأنظمة المعرفية البشرية مساهمات كبيرة في تقنيات التعلم الآلي المعاصرة، ولا سيما عالم المنطق والتر بيتس ووارن ماكولوتش، اللذين اقترحا نماذج رياضية مبكرة للشبكات العصبية المصممة لمحاكاة عمليات التفكير البشري.

بحلول أوائل الستينيات، طورت شركة رايثيون سايبرترون، وهي "آلة تعلم" تجريبية تتميز بذاكرة شريطية مثقوبة. تم تصميم هذا الجهاز لتحليل إشارات السونار ومخططات القلب الكهربائية وأنماط الكلام من خلال التعلم المعزز البدائي. قام عامل بشري أو معلم بتدريبه بشكل منهجي على التعرف على الأنماط، وتضمن زر "الأبله" للحث على إعادة تقييم القرارات غير الصحيحة. يعد كتاب آلات التعلم لنيلز نيلسون، الذي نُشر في ستينيات القرن العشرين، بمثابة عمل أساسي في أبحاث التعلم الآلي خلال ذلك العقد، حيث تناول في المقام الأول تصنيف الأنماط. استمر الاهتمام بالتعرف على الأنماط حتى سبعينيات القرن العشرين، كما وثقه دودا وهارت في عام 1973. وفي وقت لاحق، في عام 1981، قدم تقرير تفصيلي التطبيق الناجح لاستراتيجيات التدريس التي تمكن شبكة عصبية اصطناعية من التعرف على 40 حرفًا (تتكون من 26 حرفًا و10 أرقام و4 رموز خاصة) من محطة الكمبيوتر.

لقد أوضح توم إم ميتشل تعريفًا رسميًا أكثر استشهادًا به على نطاق واسع للخوارزميات في مجال التعلم الآلي: "يقال إن برنامج الكمبيوتر يتعلم من الخبرة E فيما يتعلق ببعض فئات المهام T ويقيس الأداء P إذا كان أدائه في المهام في T، كما تم قياسه بـ P، يتحسن مع الخبرة E." يوفر هذا التعريف، الذي يركز على المهام ذات الصلة بالتعلم الآلي، توصيفًا تشغيليًا أساسيًا بدلاً من وصف يعتمد على المصطلحات المعرفية. يتوافق هذا النهج مع اقتراح آلان تورينج في بحثه الرائد "آلات الحوسبة والذكاء"، حيث كان الاستفسار "هل تستطيع الآلات التفكير؟" تمت إعادة صياغتها على أنها "هل تستطيع الآلات أن تفعل ما يمكننا (ككيانات تفكير) فعله؟".

يتم تصنيف خوارزميات التعلم الآلي المعاصرة على نطاق واسع إلى ثلاثة أنواع أساسية: خوارزميات التعلم الخاضعة للإشراف، وخوارزميات التعلم غير الخاضعة للإشراف، وخوارزميات التعلم المعزز.

تشمل أهداف خوارزميات التعلم الخاضعة للإشراف الحالية في المقام الأول مهام التصنيف والانحدار.
تركز خوارزميات التعلم الحالية غير الخاضعة للرقابة عادةً على أهداف مثل التجميع وتقليل الأبعاد واكتشاف قواعد الارتباط.
تتناول خوارزميات التعلم المعزز المعاصرة في المقام الأول عمليات صنع القرار المشروطة بحالات زمنية سابقة وغير ملحوظة ويتم تصنيفها على نطاق واسع إلى منهجيات قائمة على النماذج أو خالية من النماذج.

في عام 2014، كان إيان جودفيلو ومعاونوه رائدين في شبكات الخصومة التوليدية (GANs)، مما أدى إلى تسهيل تركيب بيانات واقعية للغاية. وفي وقت لاحق، بحلول عام 2016، حقق AlphaGo انتصارات ملحوظة ضد نخبة المنافسين من البشر من خلال تطبيق تقنيات التعلم المعزز.

اتصالات متعددة التخصصات

الذكاء الاصطناعي

ظهر التعلم الآلي كمسعى علمي من خلال السعي الأوسع للذكاء الاصطناعي (AI). خلال المراحل الأولى للذكاء الاصطناعي كمجال أكاديمي، ركز بعض الباحثين على تمكين الآلات من اكتساب المعرفة من البيانات. شملت منهجياتهم مناهج رمزية متنوعة وما تمت الإشارة إليه بعد ذلك باسم "الشبكات العصبية"، والتي تشتمل في المقام الأول على الإدراك الحسي والنماذج المماثلة التي تم التعرف عليها لاحقًا على أنها إعادة تعبيرات للنماذج الإحصائية الخطية المعممة. علاوة على ذلك، وجد المنطق الاحتمالي تطبيقًا، لا سيما في مجال التشخيص الطبي الآلي.

ومع ذلك، أدى التركيز المتزايد على المنهجيات المنطقية القائمة على المعرفة إلى التعجيل بالاختلاف بين الذكاء الاصطناعي والتعلم الآلي. واجهت الأنظمة الاحتمالية تحديات نظرية وعملية كبيرة فيما يتعلق بالحصول على البيانات وتمثيلها. بحلول عام 1980، أصبحت الأنظمة الخبيرة هي النموذج السائد في الذكاء الاصطناعي، في حين فقدت الأساليب الإحصائية شعبيتها. على الرغم من استمرار البحث في التعلم الرمزي والمبني على المعرفة في الذكاء الاصطناعي، والذي بلغ ذروته في البرمجة المنطقية الاستقرائية (ILP)، إلا أن مسار البحث الأكثر توجهاً إحصائيًا هاجر إلى ما هو أبعد من المجال الأساسي للذكاء الاصطناعي، ليجد مكانه في التعرف على الأنماط واسترجاع المعلومات. في الوقت نفسه، توقف البحث في الشبكات العصبية إلى حد كبير من قبل مجتمعات الذكاء الاصطناعي وعلوم الكمبيوتر. تم الحفاظ على هذا الاتجاه البحثي، الذي تم تغيير اسمه إلى "الاتصالية"، خارج نطاق الذكاء الاصطناعي وعلوم الكمبيوتر من قبل علماء من مجالات متنوعة، ولا سيما جون هوبفيلد، وديفيد روملهارت، وجيفري هينتون. حدث إنجاز محوري لهذه المجموعة في منتصف الثمانينيات مع إعادة اكتشاف الانتشار العكسي.

شهد التعلم الآلي (ML) انتعاشًا وأثبت نفسه كنظام متميز خلال التسعينيات. تطورت أهدافها من السعي وراء الذكاء الاصطناعي العام إلى معالجة المشكلات العملية والسهلة. وتضمن ذلك محورًا استراتيجيًا بعيدًا عن المنهجيات الرمزية الموروثة من الذكاء الاصطناعي، وتفضيل الأساليب والنماذج المستمدة من الإحصائيات والمنطق الغامض ونظرية الاحتمالات بدلاً من ذلك.

ضغط البيانات

استخراج البيانات

بينما يستخدم التعلم الآلي واستخراج البيانات في كثير من الأحيان منهجيات مماثلة ويظهران تداخلًا كبيرًا، فإن أهدافهما الأساسية تتباين: يركز التعلم الآلي على التنبؤ، ويستفيد من الخصائص المعروفة المكتسبة من مجموعات بيانات التدريب، في حين يركز استخراج البيانات على تحديد (حتى الآن) الخصائص غير المعروفة داخل البيانات، مما يشكل المرحلة التحليلية لاكتشاف المعرفة في قواعد البيانات. يتضمن استخراج البيانات العديد من تقنيات التعلم الآلي، وإن كان لها أهداف مميزة؛ على العكس من ذلك، يدمج التعلم الآلي أساليب استخراج البيانات، والتي يطلق عليها غالبًا "التعلم غير الخاضع للرقابة"، أو كمرحلة معالجة أولية لتعزيز دقة خوارزميات التعلم. ينبع مصدر كبير للغموض بين هذين المجالين البحثيين (اللذان يحتفظان في كثير من الأحيان بمؤتمرات ومجلات متميزة، مع كون ECML PKDD استثناءً ملحوظًا) من افتراضاتهما الأساسية: في التعلم الآلي، يرتبط تقييم الأداء عادةً بالقدرة على إعادة إنتاج المعرفة المعروفة، بينما في اكتشاف المعرفة واستخراج البيانات (KDD)، يكون الهدف الأسمى هو تحديد المعرفة غير المعروفة سابقًا. عند تقييمها مقابل المعرفة المعروفة، يتم تجاوز المنهجية غير المطلعة (غير الخاضعة للرقابة) بسهولة من خلال البدائل الخاضعة للإشراف؛ ومع ذلك، في سيناريو KDD المميز، غالبًا ما تكون الأساليب الخاضعة للإشراف غير عملية بسبب غياب بيانات التدريب المطلوبة.

يحافظ التعلم الآلي على علاقة وثيقة مع التحسين، حيث يتم تصور العديد من تحديات التعلم على أنها تقليل وظيفة خسارة محددة عبر مجموعة بيانات التدريب. تحدد دوال الخسارة التباعد بين تنبؤات النموذج أثناء التدريب والحالات الفعلية للمشكلة؛ على سبيل المثال، في مهام التصنيف، يتم تدريب النماذج للتنبؤ بدقة بالتسميات المعينة مسبقًا لمجموعة معينة من الأمثلة.

التعميم

يشكل توصيف قدرات التعميم عبر خوارزميات التعلم المتنوعة مجالًا نشطًا للبحث المعاصر، لا سيما فيما يتعلق بمنهجيات التعلم العميق.

الإحصائيات

على الرغم من التشابه المنهجي بين التعلم الآلي والإحصاءات، إلا أنهما يختلفان في أهدافهما الأساسية: تهدف الإحصائيات إلى استخلاص الاستدلالات السكانية من العينات، في حين يركز التعلم الآلي على تحديد الأنماط التنبؤية القابلة للتعميم.

تتطلب التحليلات الإحصائية التقليدية الاختيار *المسبق* لنموذج مناسب على النحو الأمثل لمجموعة البيانات المحددة، وعادةً ما يتضمن فقط المتغيرات التي تعتبر مهمة أو ذات صلة من الناحية النظرية بناءً على المعرفة السابقة. وعلى العكس من ذلك، يعمل التعلم الآلي بدون نموذج محدد مسبقًا؛ بدلاً من ذلك، تقوم البيانات نفسها ببناء النموذج من خلال تحديد الأنماط الجوهرية. تزداد دقة النموذج الناتج بشكل عام مع عدد متغيرات المدخلات المستخدمة أثناء التدريب.

حدد ليو بريمان نموذجين متميزين للنمذجة الإحصائية: نموذج البيانات والنموذج الخوارزمي، حيث يشمل الأخير على نطاق واسع خوارزميات التعلم الآلي مثل Random Forest.

قامت مجموعة فرعية من الإحصائيين بدمج منهجيات من التعلم الآلي، وبالتالي إنشاء نظام هجين يسمى التعلم الإحصائي.

الفيزياء الإحصائية

تنطبق المنهجيات التحليلية والحسابية الناشئة عن الفيزياء الأساسية للأنظمة المضطربة على مشكلات واسعة النطاق، بما في ذلك تلك المتعلقة بالتعلم الآلي، مثل تحليل مساحات الوزن داخل الشبكات العصبية العميقة. ونتيجة لذلك، يتم استخدام الفيزياء الإحصائية بشكل متزايد في التشخيص الطبي.

النظرية

الهدف الأساسي لأي نظام تعليمي هو التعميم من خلال خبرته المكتسبة. ضمن هذا المجال، يشير التعميم إلى قدرة آلة التعلم على الأداء بدقة في أمثلة أو مهام جديدة لم تتم مواجهتها سابقًا، بعد تعرضها لمجموعة بيانات التدريب. يتم استخلاص هذه الأمثلة التدريبية من توزيع احتمالي غير معروف عادة، والذي يفترض أنه يمثل المساحة الإجمالية للأحداث. هدف المتعلم هو بناء نموذج شامل لهذه المساحة، مما يمكنه من توليد تنبؤات دقيقة بشكل مناسب للحالات الجديدة.

يشكل التحليل الحسابي لخوارزميات التعلم الآلي وفعاليتها مجالًا فرعيًا من علوم الكمبيوتر النظرية، والمعروف على وجه التحديد باسم نظرية التعلم الحسابي، وغالبًا ما يتم استكشافه من خلال نموذج التعلم الصحيح تقريبًا (PAC). نظرًا للطبيعة المحدودة لمجموعات التدريب والشكوك المستقبلية المتأصلة، فإن نظرية التعلم عادةً لا توفر ضمانات مطلقة فيما يتعلق بأداء الخوارزمية. وبدلاً من ذلك، يتم وضع الحدود الاحتمالية للأداء بشكل متكرر. يوفر تحليل التحيز والتباين طريقة لقياس خطأ التعميم.

يتطلب أداء التعميم الأمثل أن يتوافق تعقيد الفرضية مع التعقيد المتأصل في وظيفة توليد البيانات الأساسية. إذا كانت الفرضية أقل تعقيدًا من الوظيفة، فسيظهر النموذج عدم ملائمة. على العكس من ذلك، في حين أن زيادة تعقيد النموذج قد تقلل من أخطاء التدريب، فإن الفرضية المعقدة للغاية تؤدي إلى الإفراط في التجهيز، مما يؤدي إلى تضاؤل قدرات التعميم.

وبعيدًا عن تحديد حدود الأداء، يبحث واضعو نظريات التعلم أيضًا في التعقيد الزمني وجدوى عمليات التعلم. في إطار نظرية التعلم الحسابي، تعتبر العملية الحسابية ممكنة إذا كان من الممكن تنفيذها خلال وقت متعدد الحدود. تنقسم نتائج التعقيد الزمني عادةً إلى فئتين: النتائج الإيجابية، التي توضح أن فئات معينة من الوظائف قابلة للتعلم في وقت كثير الحدود، والنتائج السلبية، التي تشير إلى أنه لا يمكن تعلم فئات معينة خلال وقت كثير الحدود.

المقاربات

يتم تصنيف منهجيات التعلم الآلي بشكل تقليدي إلى ثلاثة نماذج أساسية، تتميز بنوع "الإشارة" أو "التعليقات" التي يمكن لنظام التعلم الوصول إليها:

التعلم الخاضع للإشراف: في هذا النموذج، يتلقى النظام الحسابي أمثلة على المدخلات المقترنة بالمخرجات المطلوبة المقابلة لها، والتي يقدمها "المعلم"، بهدف الحصول على قاعدة عامة تربط هذه المدخلات بمخرجاتها المعنية.
التعلم غير الخاضع للرقابة: يتضمن هذا النهج تزويد خوارزمية التعلم ببيانات إدخال غير مصنفة، وتكليفها بتحديد الهياكل المتأصلة بشكل مستقل. يمكن أن يكون التعلم غير الخاضع للرقابة بمثابة غاية في حد ذاته، مما يسهل اكتشاف أنماط البيانات الكامنة، أو كخطوة أولية، كما هو الحال في التعلم المميز.
التعلم المعزز: هنا، يتفاعل برنامج الكمبيوتر مع بيئة ديناميكية، بهدف تحقيق هدف محدد، مثل تشغيل السيارة المستقلة أو اللعب التنافسي. خلال استكشافه لمساحة المشكلة، يتلقى البرنامج تعليقات مشابهة للمكافآت، ويسعى إلى تعظيمها.

على الرغم من أن كل خوارزمية تتمتع بمزايا وقيود مميزة، إلا أنه لا توجد خوارزمية فردية فعالة عالميًا في جميع مجالات المشكلات.

التعلم الخاضع للإشراف

تقوم خوارزميات التعلم الخاضعة للإشراف ببناء نماذج رياضية من مجموعات البيانات التي تشتمل على ميزات الإدخال والمخرجات المطلوبة المقابلة. تتكون مجموعة البيانات هذه، التي تسمى بيانات التدريب، من أمثلة تدريب فردية. يتضمن كل مثال واحدًا أو أكثر من متغيرات الإدخال جنبًا إلى جنب مع المخرج المحدد، والذي يشار إليه كثيرًا بالإشارة الإشرافية. ضمن الإطار الرياضي، يتم تمثيل كل مثيل تدريبي عادةً كمصفوفة أو متجه، وغالبًا ما يطلق عليه ناقل الميزات، في حين يتم تصور مجموعة بيانات التدريب بأكملها كمصفوفة. من خلال التحسين التكراري لوظيفة موضوعية محددة مسبقًا، تستمد هذه الخوارزميات وظيفة قادرة على التنبؤ بمخرجات المدخلات الجديدة. تتيح الوظيفة المشتقة على النحو الأمثل للخوارزمية التأكد بدقة من مخرجات نقاط البيانات غير المدرجة في مجموعة التدريب الأولية. تعتبر الخوارزمية التي توضح التحسين التدريجي في دقة تنبؤاتها بمرور الوقت قد تعلمت المهمة المعينة بنجاح.

تشمل خوارزميات التعلم الخاضعة للإشراف فئات مثل التعلم النشط والتصنيف والانحدار. يتم استخدام خوارزميات التصنيف عندما تقتصر المخرجات المتوقعة على مجموعة منفصلة ومحدودة من الفئات، في حين يتم استخدام خوارزميات الانحدار للتنبؤ بالقيم العددية المستمرة ضمن نطاق محدد. على سبيل المثال، تقوم خوارزمية تصنيف تصفية البريد الإلكتروني بمعالجة البريد الإلكتروني الوارد كمدخل وتخصيصه لمجلد معين كمخرج له. على العكس من ذلك، تتناول نماذج الانحدار مهام مثل التنبؤ بطول الفرد بناءً على سمات مثل العمر والاستعداد الوراثي، أو توقع درجات الحرارة المستقبلية باستخدام بيانات الأرصاد الجوية التاريخية.

يمثل التعلم بالتشابه مجالًا متخصصًا ضمن التعلم الآلي الخاضع للإشراف، مما يُظهر روابط وثيقة مع كل من الانحدار والتصنيف. هدفها الأساسي هو استنتاج العلاقات من أمثلة البيانات من خلال استخدام دالة التشابه التي تحدد درجة التشابه أو الارتباط بين كيانين متميزين. تجد هذه المنهجية فائدة في تطبيقات متنوعة، بما في ذلك خوارزميات التصنيف، ومحركات التوصية، وتتبع الهوية المرئية، والتحقق من الوجه، وأنظمة مصادقة المتحدث.

التعلم غير الخاضع للإشراف

تم تصميم خوارزميات التعلم غير الخاضعة للرقابة لتمييز الهياكل المتأصلة ضمن مجموعات البيانات غير المسماة أو غير المصنفة أو غير المصنفة. بدلاً من الاعتماد على تعليقات صريحة، تحدد هذه الخوارزميات القواسم المشتركة الجوهرية داخل البيانات وتستجيب لاحقًا لوجود أو عدم وجود هذه الخصائص المشتركة في مثيلات البيانات الجديدة. تشمل التطبيقات الرئيسية للتعلم الآلي غير الخاضع للرقابة التجميع وتقليل الأبعاد وتقدير الكثافة.

يتضمن تحليل المجموعة تقسيم مجموعة من الملاحظات إلى مجموعات فرعية متميزة، تسمى المجموعات، بحيث تظهر العناصر الموجودة داخل المجموعة نفسها تشابهًا بناءً على واحد أو أكثر من المعايير المحددة مسبقًا، بينما تظهر العناصر من مجموعات مختلفة اختلافًا. تعمل منهجيات التجميع المختلفة في ظل افتراضات مختلفة فيما يتعلق ببنية البيانات، والتي تتميز في كثير من الأحيان بـ مقياس تشابه محدد. غالبًا ما يتم تقييم فعاليتها من خلال مقاييس مثل الاكتناز الداخلي، الذي يقيس التشابه بين الأعضاء داخل مجموعة واحدة، والفصل، الذي يحدد مدى التمييز بين المجموعات المختلفة. وتعتمد الأساليب الإضافية على مفاهيم مثل الكثافة المقدرة واتصال الرسم البياني.

يشكل التعلم الخاضع للإشراف الذاتي فئة متميزة من التعلم غير الخاضع للإشراف، حيث يتم تدريب النموذج من خلال استخلاص الإشارة الإشرافية الخاصة به مباشرةً من الخصائص الجوهرية للبيانات نفسها.

تقليل الأبعاد

يشير تقليل الأبعاد إلى إجراء تقليل عدد المتغيرات العشوائية الخاضعة للتدقيق عن طريق تحديد مجموعة فرعية من المتغيرات الرئيسية. في الأساس، يستلزم ذلك تقليل أبعاد مجموعة الميزات، والتي يطلق عليها غالبًا "عدد الميزات". يمكن تصنيف غالبية منهجيات تقليل الأبعاد على نطاق واسع على أنها إما إزالة الميزات أو استخراج الميزات. من الأساليب البارزة لتقليل الأبعاد تحليل المكونات الرئيسية (PCA). يقوم PCA بتحويل البيانات عالية الأبعاد، مثل مجموعات البيانات ثلاثية الأبعاد، إلى تمثيل منخفض الأبعاد، على سبيل المثال، مساحة ثنائية الأبعاد. تفترض فرضية المتشعبات أن مجموعات البيانات عالية الأبعاد موجودة بشكل جوهري في المتشعبات ذات الأبعاد المنخفضة. يدعم هذا الافتراض العديد من تقنيات تقليل الأبعاد، مما يؤدي إلى ظهور مجالات متخصصة مثل التعلم المتشعب وتنظيم المتشعب.

التعلم شبه الخاضع للإشراف

يحتل التعلم شبه الخاضع للإشراف موقعًا متوسطًا بين التعلم غير الخاضع للإشراف، والذي يعمل بدون أي بيانات تدريب مصنفة، والتعلم الخاضع للإشراف، والذي يعتمد كليًا على بيانات التدريب المصنفة بالكامل. على الرغم من أن بعض أمثلة التدريب تفتقر إلى التصنيفات، فقد أثبت العديد من الباحثين في مجال التعلم الآلي أن دمج البيانات غير المسماة مع كمية محدودة من البيانات المصنفة يمكن أن يعزز دقة التعلم بشكل كبير.

يتضمن التعلم الخاضع للإشراف الضعيف تسميات تدريبية تتميز بالتشويش أو القيود أو عدم الدقة. ومع ذلك، غالبًا ما يكون الحصول على هذه العلامات أكثر اقتصادًا، مما يسهل إنشاء مجموعات بيانات تدريب أكبر وأكثر فعالية.

التعلم المعزز

يشكل التعلم المعزز مجالًا ضمن التعلم الآلي يركز على الآليات التي يجب على وكلاء البرامج من خلالها تنفيذ الإجراءات داخل بيئة لتحسين المكافأة التراكمية المحددة مسبقًا. يؤدي تطبيقه على نطاق واسع إلى تحقيقه عبر مختلف التخصصات الأخرى، بما في ذلك نظرية اللعبة، ونظرية التحكم، وأبحاث العمليات، ونظرية المعلومات، والتحسين القائم على المحاكاة، والأنظمة متعددة الوكلاء، وذكاء السرب، والإحصاءات، والخوارزميات الجينية. في إطار التعلم المعزز، يتم تصميم البيئة التشغيلية بشكل شائع على أنها عملية اتخاذ قرار ماركوف (MDP). في حين أن العديد من خوارزميات التعلم المعزز تتضمن منهجيات البرمجة الديناميكية، فإنها لا تتطلب معرفة مسبقة بنموذج رياضي دقيق لـ MDP، مما يجعلها مناسبة للسيناريوهات التي تكون فيها النماذج الدقيقة غير عملية. تتضمن تطبيقات خوارزميات التعلم المعزز المركبات المستقلة وتطوير استراتيجيات ممارسة الألعاب ضد الخصوم البشريين.

فئات أخرى

وظهرت منهجيات إضافية لا تتوافق بدقة مع هذا التصنيف الثلاثي؛ علاوة على ذلك، قد يقوم نظام واحد للتعلم الآلي في بعض الأحيان بدمج العديد من هذه الأساليب. تشمل الأمثلة البارزة نمذجة الموضوع والتعلم الوصفي.

التعلم الذاتي

تم تقديم نموذج التعلم الذاتي في التعلم الآلي في عام 1982، بالتزامن مع شبكة عصبية للتعلم الذاتي تسمى المصفوفة التكيفية ذات العارضة (CAA). يعالج هذا النهج التحدي المتمثل في التعلم بدون مكافآت خارجية من خلال دمج العاطفة كآلية مكافأة جوهرية. تعمل العاطفة بمثابة تقييم حالة لعامل التعلم الذاتي. تستخدم خوارزمية التعلم الذاتي الخاصة بـ CAA بنية العارضة لحساب قرارات العمل والاستجابات العاطفية (المشاعر) المتعلقة بالمواقف التبعية. إن تشغيل النظام مدفوع بشكل أساسي بالتفاعل بين الإدراك والعاطفة. تقوم خوارزمية التعلم الذاتي بتحديث مصفوفة الذاكرة بشكل متكرر، W =||w(a,s)||، عن طريق تنفيذ روتين التعلم الآلي اللاحق في كل دورة:

في الموقف s، قم بتنفيذ الإجراء a.
تلقي موقف نتيجة لاحقة، يُشار إليه بـ s'.
احسب القيمة العاطفية المرتبطة بالموقف الناتج، والممثلة بـ v(s').
قم بتحديث ذاكرة العارضة وفقًا للصيغة w'(a,s) = w(a,s) + v(s').

يعمل هذا النظام بمدخل فردي، والموقف، ومخرجات فردية، وهي الإجراء (أو السلوك) "أ". إنه يميز نفسه بافتقاره إلى مدخلات تعزيزية منفصلة ومدخلات استشارية من البيئة. إن القيمة ذات الانتشار العكسي، التي تعمل كشكل من أشكال التعزيز الثانوي، هي الاستجابة العاطفية الموجهة نحو الموقف الناتج. يعمل CAA ضمن بيئتين متميزتين: بيئة سلوكية تتكشف فيها أفعاله، وبيئة وراثية يكتسب منها في البداية، ولمرة واحدة فقط، استجابات عاطفية أساسية فيما يتعلق بالمواقف التي سيواجهها في البيئة السلوكية. عند تلقي ناقل الجينوم (الأنواع) من البيئة الوراثية، تشرع هيئة الطيران المدني في تعلم سلوكيات البحث عن الهدف داخل بيئة تشتمل على مواقف مرغوبة وغير مرغوب فيها.

التعرف على الميزات

تم تصميم خوارزميات التعلم المختلفة لتحديد التمثيلات المتميزة لبيانات الإدخال المقدمة أثناء التدريب. تشمل الأمثلة البارزة تحليل المكونات الرئيسية والتحليل العنقودي. تسعى خوارزميات تعلم الميزات، والمعروفة أيضًا باسم خوارزميات التعلم التمثيلي، عادةً إلى الاحتفاظ بالمعلومات المتأصلة داخل مدخلاتها مع تحويلها في الوقت نفسه إلى تنسيق أكثر فائدة، وغالبًا ما تكون بمثابة مرحلة معالجة مسبقة قبل مهام التصنيف أو التنبؤ. تسهل هذه المنهجية إعادة بناء المدخلات الناشئة من توزيع غير معروف لتوليد البيانات، دون الالتزام بالضرورة بالتكوينات التي تعتبر غير معقولة في ظل هذا التوزيع. وبالتالي، فإن هذا النهج يغني عن الحاجة إلى هندسة الميزات اليدوية، مما يمكّن الجهاز من الحصول على الميزات ثم استخدامها لاحقًا لتنفيذ مهمة معينة.

يتم تصنيف منهجيات تعلم الميزات على نطاق واسع إلى مناهج خاضعة للإشراف وغير خاضعة للإشراف. يستخدم تعلم الميزات الخاضع للإشراف مجموعات بيانات الإدخال المسمى لاستخراج الميزات ذات الصلة. تشمل الأمثلة التوضيحية الشبكات العصبية الاصطناعية، والإدراك الحسي متعدد الطبقات، وتعلم القاموس الخاضع للإشراف. وعلى العكس من ذلك، فإن تعلم الميزات غير الخاضع للرقابة يستمد الميزات من بيانات الإدخال غير المسماة. تشمل التقنيات الرئيسية في هذا المجال تعلم القاموس، وتحليل المكونات المستقلة، وأجهزة التشفير التلقائي، وعوامل المصفوفة، وخوارزميات التجميع المتنوعة.

تسعى خوارزميات التعلم المتعددة إلى تحقيق هذا الهدف من خلال فرض قيد يتمثل في أن التمثيل المشتق يحافظ على أبعاد منخفضة. وبالمثل، تعمل خوارزميات التشفير المتفرق في ظل فرضية مفادها أن التمثيل المتعلم يجب أن يكون متناثرًا، مما يعني أن النموذج الرياضي الأساسي يحتوي على عدد كبير من القيم الصفرية. تم تصميم خوارزميات تعلم الفضاء الجزئي متعدد الخطوط لاستخراج تمثيلات منخفضة الأبعاد مباشرة من بيانات الموتر، والتي تتعامل بطبيعتها مع المعلومات متعددة الأبعاد، وبالتالي تجنب الحاجة إلى إعادة تشكيلها إلى ناقلات ذات أبعاد أعلى. تتميز خوارزميات التعلم العميق بقدرتها على الكشف عن مستويات هرمية متعددة من التمثيل، حيث يتم تصور ميزات أكثر تجريدًا وعالية المستوى أو يتم إنشاؤها من ميزات أساسية ذات مستوى أدنى. تفترض إحدى الحجج البارزة أن الآلة الذكية تطور تمثيلات قادرة على تفكيك عوامل التباين الكامنة التي تفسر البيانات المرصودة.

ينبع الدافع لتعلم الميزات من ملاحظة أن العديد من مهام التعلم الآلي، وخاصة التصنيف، تتطلب بيانات مدخلة يمكن معالجتها رياضيًا وفعالة من الناحية الحسابية. ومع ذلك، فإن محاولات تحديد ميزات محددة خوارزميًا لبيانات العالم الحقيقي المعقدة، بما في ذلك الصور والفيديو والمدخلات الحسية المختلفة، أثبتت أنها صعبة. وبالتالي، يتضمن النهج البديل اكتشاف هذه الميزات أو التمثيلات من خلال عملية استكشافية، بدلاً من الاعتماد على خوارزميات صريحة محددة مسبقًا.

تعلم القاموس المتناثر

يشكل تعلم القاموس المتفرق منهجية تعلم الميزات حيث يتم تصور مثيل التدريب على أنه مزيج خطي من الوظائف الأساسية، بافتراض عادةً تمثيل مصفوفة متفرقة. يتم التعرف على هذه الطريقة على أنها NP-hard، مما يجعل حلها التقريبي صعبًا من الناحية الحسابية. من الأساليب الإرشادية المعتمدة على نطاق واسع لتعلم القاموس المتناثر هي خوارزمية k-SVD. لقد وجد تعلم القاموس المتناثر فائدة عبر مجالات التطبيق المختلفة. ضمن مهام التصنيف، الهدف هو التأكد من الفئة المناسبة لمثال تدريبي جديد لم يتم ملاحظته من قبل. عندما يتم إنشاء قاموس لكل فصل، يتم تعيين مثيل تدريب جديد للفئة التي يوفر القاموس المقابل لها التمثيل المتناثر الأكثر فعالية. علاوة على ذلك، تم استخدام تعلم القاموس المتناثر بنجاح في تطبيقات تقليل ضوضاء الصورة. المبدأ الأساسي الذي يقوم عليه هذا التطبيق هو أنه يمكن تمثيل تصحيح الصورة الأصلية بشكل متناثر بواسطة قاموس الصور، في حين لا يمكن ذلك لمكونات الضوضاء.

اكتشاف الحالات الشاذة

في مجال استخراج البيانات، يتضمن اكتشاف الحالات الشاذة، والذي يُطلق عليه بدلاً من ذلك الكشف الخارجي، تحديد العناصر أو الأحداث أو الملاحظات النادرة التي تثير الشك بسبب انحرافها الكبير عن أنماط البيانات السائدة. تشير هذه الحالات الشاذة عادةً إلى مشكلات حرجة، مثل الاحتيال المالي أو العيوب الهيكلية أو الحالات الطبية أو الأخطاء النصية. يتم تصنيف الحالات الشاذة بشكل مختلف على أنها قيم متطرفة أو مستجدات أو ضوضاء أو انحرافات أو استثناءات.

على وجه التحديد، في سياق إساءة الاستخدام واكتشاف التطفل على الشبكة، غالبًا ما تتميز الكائنات البارزة ليس بندرتها، ولكن بموجات غير متوقعة من عدم النشاط. تنحرف مثل هذه الأنماط عن التعريف الإحصائي التقليدي للشيء المتطرف، والذي يصف عادة كائنًا نادرًا. وبالتالي، فإن العديد من منهجيات الكشف الخارجية، وخاصة الخوارزميات غير الخاضعة للرقابة، تكون عرضة للفشل عند تطبيقها على مثل هذه البيانات ما لم يتم استخدام تقنيات التجميع المناسبة. على العكس من ذلك، قد تحدد خوارزمية تحليل المجموعة بشكل فعال المجموعات الصغيرة الناتجة عن هذه الأنماط المميزة.

يمكن تصنيف تقنيات الكشف عن الشذوذ على نطاق واسع إلى ثلاث فئات رئيسية. تحدد طرق الكشف عن الحالات الشاذة غير الخاضعة للرقابة الحالات الشاذة ضمن مجموعات بيانات الاختبار غير المسماة، وتعمل تحت فرضية أن معظم الحالات طبيعية، وبالتالي تبحث عن نقاط البيانات التي تظهر أقل قدر من التوافق مع البنية السائدة لمجموعة البيانات. تتطلب تقنيات الكشف عن الحالات الشاذة الخاضعة للإشراف مجموعة بيانات تم تصنيفها مسبقًا بمثيلات "طبيعية" و"غير طبيعية"، وتتضمن لاحقًا تدريب أحد المصنفين؛ هناك تمييز حاسم عن العديد من مشاكل التصنيف الإحصائي الأخرى وهو عدم التوازن الجوهري الذي يميز مجموعات بيانات الكشف الخارجية. وعلى العكس من ذلك، تقوم تقنيات الكشف عن الحالات الشاذة شبه الخاضعة للإشراف ببناء نموذج للسلوك الطبيعي من مجموعة بيانات تدريب عادية معينة، ثم تقييم احتمالية إنشاء مثيل اختبار معين بواسطة هذا النموذج المحدد.

تعلم الروبوت

يستمد التعلم الآلي الإلهام من مجموعة متنوعة من منهجيات التعلم الآلي، بما في ذلك التعلم الخاضع للإشراف، والتعلم المعزز، والتقنيات المتقدمة مثل التعلم التلوي (على سبيل المثال، MAML).

قواعد الاقتران

يشكل تعلم قواعد الارتباط منهجية تعلم آلي قائمة على القواعد ومصممة للكشف عن العلاقات بين المتغيرات ضمن مجموعات بيانات واسعة النطاق. هدفها الأساسي هو تحديد القواعد القوية ضمن قواعد البيانات هذه، والتي يتم تقييمها عادةً من خلال مقياس محدد مسبقًا لـ "الاهتمام".

يعمل التعلم الآلي القائم على القواعد بمثابة تسمية واسعة لأي نهج تعلم آلي يحدد "القواعد" أو يكتسبها أو يطورها لغرض تخزين المعرفة أو معالجتها أو تطبيقها. السمة المميزة لخوارزميات التعلم الآلي القائمة على القواعد هي قدرتها على تحديد مجموعة من القواعد العلائقية والاستفادة منها، والتي تلخص بشكل جماعي المعرفة المكتسبة للنظام. ويختلف هذا النموذج عن خوارزميات التعلم الآلي الأخرى، والتي تستمد عادةً نموذجًا فريدًا ينطبق عالميًا للتنبؤ في جميع الحالات. تتضمن أمثلة منهجيات التعلم الآلي القائمة على القواعد أنظمة تصنيف التعلم، وتعلم قواعد الارتباط، وأنظمة المناعة الاصطناعية.

بناءً على مفهوم القواعد القوية، كان راكيش أغراوال، وتوماس إيميلينسكي، وأرون سوامي رائدين في قواعد الارتباط لتحديد الأنماط المتكررة بين المنتجات ضمن مجموعات بيانات المعاملات الشاملة التي تم التقاطها بواسطة أنظمة نقاط البيع (POS) في محلات السوبر ماركت. على سبيل المثال، القاعدة $\{\mathrm {onions,potatoes} \}\Rightarrow \{\mathrm {burger} \}$ ، عند ملاحظته في بيانات مبيعات السوبر ماركت، يشير إلى أن العملاء الذين يشترون البصل والبطاطس في نفس الوقت هم أيضًا عرضة لشراء لحم الهامبرغر. يمكن لهذا النوع من الرؤى أن يرشد استراتيجيات التسويق، مثل الأسعار الترويجية أو مواضع المنتجات المحسنة. وبعيدًا عن تحليل سلة السوق، يتم تطبيق قواعد الارتباط حاليًا في مجالات متنوعة، بما في ذلك التعدين باستخدام الويب، وكشف التسلل، وعمليات الإنتاج المستمرة، والمعلوماتية الحيوية. على عكس التعدين التسلسلي، يتجاهل تعلم قواعد الارتباط عمومًا الترتيب الزمني للعناصر، سواء ضمن معاملة واحدة أو عبر معاملات متعددة.

تمثل أنظمة تصنيف التعلم (LCS) فئة من خوارزميات التعلم الآلي القائمة على القواعد والتي تدمج آلية الاكتشاف، والتي غالبًا ما تكون خوارزمية جينية، مع مكون تعليمي قادر على تنفيذ التعلم الخاضع للإشراف أو التعزيز أو غير الخاضع للإشراف. هدفهم هو تمييز مجموعة من القواعد المعتمدة على السياق والتي تعمل بشكل تعاوني على تخزين وتطبيق المعرفة بشكل متزايد لتوليد التنبؤات.

البرمجة المنطقية الاستقرائية (ILP) هي منهجية لتعلم القواعد التي تستخدم البرمجة المنطقية كتمثيل موحد لأمثلة المدخلات والمعرفة الأساسية والفرضيات. عند تزويده بمجموعة مشفرة من المعرفة الأساسية المعروفة ومجموعة من الأمثلة المنظمة كقاعدة بيانات منطقية للحقائق، يقوم نظام ILP بإنشاء برنامج منطقي مفترض يأخذ في الاعتبار جميع الأمثلة الإيجابية مع استبعاد جميع الأمثلة السلبية. البرمجة الاستقرائية هي مجال متحالف يشمل استخدام أي لغة برمجة، وليس البرمجة المنطقية حصريًا، لتمثيل الفرضيات، بما في ذلك، على سبيل المثال، البرامج الوظيفية.

تجد البرمجة المنطقية الاستقرائية فائدة كبيرة في مجالات مثل المعلوماتية الحيوية ومعالجة اللغة الطبيعية. أنشأ جوردون بلوتكين وإيهود شابيرو الإطار النظري التأسيسي للتعلم الآلي الاستقرائي ضمن سياق منطقي. في عام 1981، طور شابيرو التطبيق الأول، المعروف باسم نظام الاستدلال النموذجي، والذي كان عبارة عن برنامج برولوج قادر على استنتاج البرامج المنطقية استقرائيًا من الأمثلة الإيجابية والسلبية. يتعلق المصطلح الاستقرائي في هذا السياق بالاستقراء الفلسفي، والذي يتضمن اقتراح نظرية لتوضيح الحقائق المرصودة، على عكس الاستقراء الرياضي، الذي يهدف إلى إثبات خاصية لجميع العناصر ضمن مجموعة منظمة جيدًا.

النماذج

يشكل نموذج التعلم الآلي إطارًا رياضيًا قادرًا على توليد تنبؤات أو تصنيفات لمجموعات بيانات جديدة بعد "التدريب" على مجموعة بيانات محددة. تتضمن عملية التدريب خوارزمية تعليمية تعمل بشكل منهجي على تحسين المعلمات الداخلية للنموذج لتقليل الأخطاء التنبؤية. وبالتالي، فإن تسمية "النموذج" تشمل مستويات مختلفة من التفصيل، بدءًا من فئة واسعة من النماذج مع خوارزميات التعلم المقابلة لها إلى نموذج مدرب بشكل شامل يمتلك معلمات داخلية محسنة بالكامل.

تم استخدام بنيات نموذجية متنوعة والتحقيق فيها ضمن أنظمة التعلم الآلي؛ عملية تحديد النموذج الأكثر ملاءمة لمهمة معينة تسمى اختيار النموذج.

الشبكات العصبية الاصطناعية

تمثل الشبكات العصبية الاصطناعية (ANNs)، والمعروفة أيضًا باسم الأنظمة الاتصالية، أطرًا حسابية تستمد الإلهام المفاهيمي من الشبكات العصبية البيولوجية الموجودة في أدمغة الحيوانات. تكتسب هذه الأنظمة القدرة على تنفيذ المهام من خلال التعرض للأمثلة، عادةً بدون برمجة واضحة لقواعد خاصة بالمهام.

تتأسس الشبكة العصبية الاصطناعية (ANN) حول مجموعة من الوحدات أو العقد المترابطة، والتي يطلق عليها "الخلايا العصبية الاصطناعية"، والتي تحاكي بشكل فضفاض الخلايا العصبية الموجودة في الأدمغة البيولوجية. وعلى غرار المشابك العصبية البيولوجية، يسهل كل اتصال نقل المعلومات، أو "الإشارة"، بين الخلايا العصبية الاصطناعية. عند تلقي إشارة، تقوم خلية عصبية صناعية بمعالجتها ثم تنقل الإشارات بعد ذلك إلى خلايا عصبية صناعية أخرى متصلة. في تطبيقات ANN النموذجية، يتم تمثيل الإشارة التي تعبر الاتصال بين الخلايا العصبية الاصطناعية برقم حقيقي، ويتم اشتقاق مخرجات كل خلية عصبية اصطناعية من دالة غير خطية مطبقة على جمع مدخلاتها. يتم تحديد الترابطات بين الخلايا العصبية الاصطناعية على أنها "حواف". تتمتع كل من الخلايا العصبية الاصطناعية وحوافها المتصلة عمومًا بوزن يخضع للتعديل أثناء عملية التعلم. ينظم هذا الوزن شدة الإشارة المرسلة عبر الاتصال. علاوة على ذلك، قد تتضمن الخلايا العصبية الاصطناعية آلية عتبة، حيث يتم نشر الإشارة فقط إذا تجاوزت إشارة الإدخال التراكمية هذه العتبة المحددة مسبقًا. تقليديًا، يتم تنظيم الخلايا العصبية الاصطناعية في طبقات متميزة، حيث من المحتمل أن تنفذ طبقات مختلفة تحولات متنوعة على مدخلاتها الخاصة. تنتشر الإشارات بشكل تسلسلي من الطبقة الأولية (طبقة الإدخال) إلى الطبقة النهائية (طبقة الإخراج)، ومن المحتمل أن تعبر الطبقات المتوسطة عدة مرات.

في البداية، كان الهدف من نموذج ANN هو تكرار منهجيات حل مشكلات الدماغ البشري. ومع ذلك، فإن التطورات اللاحقة حولت التركيز نحو تنفيذ المهام المتخصصة، مما أدى إلى اختلافات معمارية ووظيفية عن النماذج البيولوجية. تم تطبيق الشبكات العصبية الاصطناعية بنجاح عبر مجموعة واسعة من التطبيقات، بما في ذلك رؤية الكمبيوتر، والتعرف على الكلام، والترجمة الآلية، وتصفية الشبكات الاجتماعية، واللعب الاستراتيجي (ألعاب الطاولة وألعاب الفيديو)، والتشخيص الطبي.

يتضمن التعلم العميق استخدام الشبكات العصبية الاصطناعية التي تتميز بالعديد من الطبقات المخفية. تسعى هذه المنهجية إلى محاكاة آليات الدماغ البشري لمعالجة الضوء والصوت إلى تصورات بصرية وسمعية. تشمل التطبيقات الناجحة البارزة للتعلم العميق التطورات في رؤية الكمبيوتر والتعرف على الكلام.

أشجار القرار

يستخدم تعلم شجرة القرار شجرة القرار كنموذج تنبؤي، مما يتيح استخلاص استنتاجات بشأن القيمة المستهدفة لعنصر ما (ممثلة بالأوراق) من الملاحظات المتعلقة بهذا العنصر (ممثلة بالفروع). ويشكل هذا منهجية نمذجة تنبؤية بارزة تستخدم في الإحصاء واستخراج البيانات والتعلم الآلي. نماذج الشجرة المصممة للمتغيرات المستهدفة التي تفترض قيمًا منفصلة تسمى أشجار التصنيف؛ ضمن هذه الهياكل، تشير الأوراق إلى تسميات الفئة، في حين تشير الفروع إلى مجموعات من الميزات التي تؤدي إلى تلك التسميات الطبقية المحددة. على العكس من ذلك، يُشار إلى أشجار القرار حيث يمكن للمتغير المستهدف أن يتبنى قيمًا مستمرة (عادةً أرقام حقيقية) باسم أشجار الانحدار. في مجال تحليل القرار، تعمل شجرة القرار كأداة للتصوير المرئي والصريح للقرارات وعملية صنع القرار. في سياقات استخراج البيانات، تعمل شجرة القرار على وصف البيانات، ومع ذلك يمكن لشجرة التصنيف الناتجة أن تفيد عمليات صنع القرار لاحقًا.

انحدار الغابة العشوائي

يتم تصنيف الانحدار العشوائي للغابات (RFR) ضمن النماذج القائمة على شجرة القرار، ويعمل كمنهجية تعلم جماعية. يقوم هذا النهج ببناء أشجار قرارات متعددة ثم يقوم بعد ذلك بحساب متوسط تنبؤاتها لتعزيز الدقة وتخفيف التجاوز. يستخدم RFR أخذ العينات التمهيدية لبناء شجرة القرار، مما يعني أن كل شجرة يتم تدريبها على مجموعة فرعية مميزة ومختارة عشوائيًا من بيانات التدريب. تساهم عملية الاختيار العشوائي هذه أثناء التدريب على RFR في تقليل تحيز التنبؤ وتحقيق الدقة الفائقة. علاوة على ذلك، يقوم RFR بإنشاء أشجار قرارات مستقلة، مما يجعلها قابلة للتكيف مع كل من البيانات ذات المخرجات الفردية والمهام متعددة الانحدار، وبالتالي تمكين تطبيقها عبر سيناريوهات متنوعة.

أجهزة دعم المتجهات

تشكل أجهزة ناقل الدعم (SVMs)، والتي يشار إليها أيضًا بشبكات ناقل الدعم، مجموعة من تقنيات التعلم الخاضعة للإشراف المستخدمة في كل من مهام التصنيف والانحدار. بالنظر إلى مجموعة بيانات من أمثلة التدريب، تم تخصيص كل منها لواحدة من فئتين، تقوم خوارزمية تدريب SVM بتطوير نموذج قادر على التنبؤ بالفئة لمثال جديد. في الأساس، تعمل خوارزمية تدريب SVM كمصنف خطي ثنائي غير احتمالي، على الرغم من أن أساليب مثل مقياس بلات تسمح بتطبيقها في سياقات التصنيف الاحتمالية. بعيدًا عن التصنيف الخطي، يمكن لـ SVMs إجراء تصنيف غير خطي بشكل فعال من خلال استخدام خدعة kernel، والتي تقوم ضمنيًا بتعيين بيانات الإدخال في مساحات ميزات ذات أبعاد أعلى.

تحليل الانحدار

يشمل تحليل الانحدار نطاقًا واسعًا من المنهجيات الإحصائية المصممة لتقدير العلاقات بين متغيرات الإدخال والميزات المقابلة لها. الشكل الأكثر شيوعًا هو الانحدار الخطي، والذي يتضمن تركيب سطر واحد لتمثيل البيانات المعطاة بشكل أفضل بناءً على معيار رياضي، مثل المربعات الصغرى العادية. يتم تعزيز هذه التقنية في كثير من الأحيان بطرق التنظيم، مثل انحدار التلال، لمواجهة التجهيز الزائد والتحيز. بالنسبة للمشكلات غير الخطية، تتضمن النماذج الشائعة الانحدار متعدد الحدود (على سبيل المثال، لملاءمة خط الاتجاه في Microsoft Excel)، والانحدار اللوجستي (الذي يستخدم بشكل متكرر في التصنيف الإحصائي)، وانحدار kernel، الذي يقدم اللاخطية من خلال الاستفادة من خدعة kernel لتعيين متغيرات الإدخال بشكل ضمني للمساحات ذات الأبعاد الأعلى.

يعمل الانحدار الخطي متعدد المتغيرات على توسيع مبادئ الانحدار الخطي لإدارة المتغيرات التابعة المتعددة بشكل متزامن. تقوم هذه المنهجية بتقدير العلاقات بين مجموعة من متغيرات المدخلات والعديد من متغيرات المخرجات من خلال بناء نموذج خطي متعدد الأبعاد. وتثبت أهميتها بشكل خاص في المواقف التي تكون فيها المخرجات مترابطة أو تعرض أنماطًا أساسية مشتركة، مثل التنبؤ بمؤشرات اقتصادية متعددة أو إعادة بناء صور متعددة الأبعاد بطبيعتها.

الشبكات الافتراضية

الشبكة البايزية، والمعروفة أيضًا باسم شبكة المعتقدات أو النموذج الرسومي غير الدوري الموجه، هي نموذج رسومي احتمالي يوضح مجموعة من المتغيرات العشوائية واستقلالياتها الشرطية من خلال رسم بياني غير حلقي موجه (DAG). على سبيل المثال، يمكن لشبكة بايزي أن تضع نموذجًا للارتباطات الاحتمالية بين الأمراض والأعراض. ونظرًا لأعراض محددة، يمكن بعد ذلك استخدام الشبكة لحساب احتمالات وجود أمراض مختلفة. تتوفر خوارزميات فعالة لإجراء الاستدلال والتعلم داخل هذه الشبكات. الشبكات البايزية المصممة لنموذج تسلسل المتغيرات، مثل إشارات الكلام أو تسلسل البروتين، تسمى الشبكات البايزية الديناميكية. تُعرف تعميمات الشبكات الافتراضية التي يمكنها تمثيل وحل مشكلات القرار في ظل عدم اليقين باسم مخططات التأثير.

العمليات الغوسية

العملية الغوسية هي عملية عشوائية تتميز بخاصية أن كل مجموعة محدودة من متغيراتها العشوائية تمتلك توزيعًا طبيعيًا متعدد المتغيرات. يعتمد تشغيلها على دالة التغاير المحددة مسبقًا، أو النواة، التي تصمم العلاقة بين أزواج النقاط بناءً على مواقعها الخاصة.

بالنظر إلى مجموعة من نقاط البيانات المرصودة، والتي تشتمل على أمثلة المدخلات والمخرجات، يمكن حساب توزيع المخرجات غير المرصودة لنقطة جديدة مباشرة. يتم إجراء هذا الحساب من خلال النظر في النقاط المرصودة والتباينات بين هذه النقاط المرصودة والنقطة الجديدة غير المرصودة.

تُستخدم العمليات الغوسية على نطاق واسع كنماذج بديلة في تحسين بايزي، خاصة لمهام تحسين المعلمات الفائقة.

الخوارزميات الجينية

تعمل الخوارزمية الجينية (GA) كخوارزمية بحث وتقنية إرشادية تحاكي عملية الانتقاء الطبيعي، وتستخدم آليات مثل الطفرة والتقاطع لتوليد أنماط وراثية جديدة بهدف تحديد حلول فعالة لمشكلة محددة. في مجال التعلم الآلي، شهدت الخوارزميات الجينية تطبيقًا خلال الثمانينيات والتسعينيات. وعلى العكس من ذلك، تم استخدام منهجيات التعلم الآلي لتعزيز فعالية الخوارزميات الجينية والتطورية.

وظائف الاعتقاد

توفر نظرية وظائف الاعتقاد، المعروفة أيضًا باسم نظرية الأدلة أو نظرية ديمبستر-شافر، إطارًا شاملاً للاستدلال في ظل عدم اليقين، وتظهر علاقات راسخة مع بنيات نظرية أخرى مثل الاحتمالية والاحتمالية ونظريات الاحتمالية غير الدقيقة. يمكن تصور هذه الأطر النظرية كشكل من أشكال آلية التعلم، التي تمتلك خصائص مماثلة فيما يتعلق بتجميع الأدلة (على سبيل المثال، قاعدة ديمبستر للجمع)، على غرار آليات الجمع بين الاحتمالات في منهجية بايزي القائمة على دالة الاحتمالية (PMF). ومع ذلك، توجد العديد من القيود المتأصلة في وظائف الاعتقاد هذه عند مقارنتها بالنهج بايزي لمعالجة الجهل وقياس عدم اليقين. عادةً ما تدمج مناهج وظيفة الاعتقاد المطبقة في مجال التعلم الآلي استراتيجية دمج تتضمن أساليب جماعية متنوعة لإدارة التحديات بشكل أكثر فعالية مثل تعريف حدود القرار، وأحجام العينات المحدودة، والتخصيصات الطبقية الغامضة، والتي غالبًا ما تشكل صعوبات لتقنيات التعلم الآلي التقليدية. ومع ذلك، فإن التعقيد الحسابي لهذه الخوارزميات يتناسب مع عدد المقترحات (الفئات)، مما قد يؤدي إلى زيادة كبيرة في أوقات المعالجة مقارنة بأساليب التعلم الآلي الأخرى.

النماذج القائمة على القواعد

يشكل التعلم الآلي القائم على القواعد (RBML) فرعًا من التعلم الآلي الذي يحدد القواعد ويستخرجها من مجموعات البيانات بشكل مستقل. وينتج عن هذا النهج نماذج قابلة للتفسير، مما يجعلها ذات قيمة لدعم القرار في مجالات مثل الرعاية الصحية، واكتشاف الاحتيال، والأمن السيبراني. تشمل منهجيات RBML البارزة أنظمة تصنيف التعلم، وتعلم قواعد الارتباط، وأنظمة المناعة الاصطناعية، ونماذج مماثلة أخرى. تسهل هذه التقنيات استخلاص أنماط البيانات والتطور الديناميكي للقواعد.

نماذج التدريب

عادةً، تتطلب نماذج التعلم الآلي كميات كبيرة من البيانات الموثوقة لتحقيق تنبؤات دقيقة. عند تدريب نموذج التعلم الآلي، يجب على المهندسين تحديد والحصول على عينة بيانات شاملة وتمثيلية. قد تشمل البيانات من مجموعة التدريب أشكالًا متنوعة، مثل النصوص النصية، ومجموعات الصور، وقراءات أجهزة الاستشعار، وبيانات الخدمة التي ينشئها المستخدم. يمثل التجهيز الزائد مصدر قلق بالغ أثناء تدريب نموذج التعلم الآلي. قد تؤدي النماذج المدربة التي تم تطويرها باستخدام بيانات متحيزة أو تم تقييمها بشكل غير مناسب إلى تنبؤات مشوهة أو غير مرغوب فيها. يمكن أن تؤدي النماذج المتحيزة إلى نتائج سلبية، مما يؤدي إلى تفاقم العواقب الاجتماعية أو التنظيمية السلبية. يمكن أن يظهر التحيز الخوارزمي عندما لا يتم إعداد البيانات بشكل كافٍ لعملية التدريب. تتطور أخلاقيات التعلم الآلي إلى تخصص أكاديمي متميز ويتم دمجها بشكل متزايد في ممارسات فرق هندسة التعلم الآلي.

التعلم الموحد

يمثل التعلم الموحد شكلاً معدلاً من الذكاء الاصطناعي الموزع، مما يسهل التدريب اللامركزي لنماذج التعلم الآلي، وبالتالي الحفاظ على خصوصية المستخدم من خلال القضاء على ضرورة نقل البيانات إلى خادم مركزي. علاوة على ذلك، يعزز هذا النهج الكفاءة من خلال توزيع عملية التدريب عبر العديد من الأجهزة. على سبيل المثال، تستخدم Gboard التعلم الآلي الموحد لتطوير نماذج التنبؤ باستعلام البحث مباشرة على الأجهزة المحمولة للمستخدمين، مما يتجنب الحاجة إلى نقل استعلامات البحث الفردية إلى خادم Google مركزي.

التطبيقات

يشمل التعلم الآلي العديد من التطبيقات، مثل:

في عام 2006، أطلقت Netflix، وهي شركة تقدم خدمات الوسائط، مسابقة "جائزة Netflix" الافتتاحية، بهدف تحديد برنامج قادر على تعزيز التنبؤ بتفضيلات المستخدم وتحسين دقة خوارزمية توصية أفلام Cinematch الحالية بنسبة لا تقل عن 10%. قام فريق تعاوني يضم باحثين من AT&T Labs-Research، جنبًا إلى جنب مع Big Chaos وPragmatic Theory، بتطوير نموذج جماعي حصل على الجائزة الكبرى التي تبلغ مليون دولار في عام 2009. وفي وقت لاحق للجائزة، أدركت Netflix أن تقييمات المشاهدين لم تكن المؤشرات المثالية لأنماط المشاهدة، مما أدى إلى إعادة معايرة محرك التوصيات الخاص بها. بحلول عام 2010، سلط مقال في صحيفة وول ستريت جورنال الضوء على تطبيق شركة Rebellion Research للتعلم الآلي للتنبؤ بالأزمة المالية لعام 2008. في عام 2012، توقع فينود خوسلا، المؤسس المشارك لشركة صن مايكروسيستمز، أن برامج التشخيص الطبي الآلية التي تعتمد على التعلم الآلي ستؤدي إلى أتمتة 80% من وظائف الأطباء في غضون عقدين من الزمن. أشار تقرير صدر عام 2014 إلى تطبيق خوارزمية التعلم الآلي في تاريخ الفن لتحليل اللوحات الفنية الجميلة، مما قد يكشف عن تأثيرات فنية لم يتم التعرف عليها سابقًا. في عام 2019، أصدرت Springer Nature أول كتاب بحثي تم إنشاؤه باستخدام التعلم الآلي. بحلول عام 2020، تم نشر تكنولوجيا التعلم الآلي للمساعدة في تشخيص كوفيد-19 ودعم الباحثين في تطوير العلاجات. في الآونة الأخيرة، تم استخدام التعلم الآلي للتنبؤ بسلوك المسافرين المؤيد للبيئة ولتحسين أداء الهاتف الذكي والإدارة الحرارية بناءً على تفاعل المستخدم. عند تنفيذها بشكل فعال، يمكن لخوارزميات التعلم الآلي (MLAs) الاستفادة من خصائص الشركة المتنوعة للتنبؤ بعوائد الأسهم دون الإفراط في التجهيز. من خلال هندسة الميزات المتقنة وتجميع التوقعات، يمكن أن تسفر MLAs عن نتائج تتفوق بشكل كبير على تلك المستمدة من الأساليب الخطية الأساسية مثل المربعات الصغرى العادية (OLS).

وقد وسع التقدم المعاصر في التعلم الآلي نطاقه إلى كيمياء الكم، حيث تسهل الخوارزميات المبتكرة الآن التنبؤ بتأثيرات المذيبات على التفاعلات الكيميائية، مما يوفر للكيميائيين أدوات متقدمة لتحسين المعلمات التجريبية للحصول على نتائج متفوقة.

يعمل التعلم الآلي كأداة ذات قيمة متزايدة للتحقيق والتحليل. التنبؤ باتخاذ قرارات الإخلاء عبر الكوارث واسعة النطاق والمحلية. تم تقييم طرق مختلفة للتنبؤ بما إذا كان أصحاب المنازل سيختارون الإخلاء أثناء أحداث مثل حرائق الغابات والأعاصير ومتى. وقد ركزت التطبيقات الإضافية على قرارات ما قبل الإخلاء في سياق حرائق المباني.

القيود

على الرغم من أن التعلم الآلي قد أحدث تحولًا عميقًا في مجالات معينة، فإن برامج التعلم الآلي في كثير من الأحيان لا تحقق النتائج المتوقعة. يمكن أن تعزى هذه الظاهرة إلى عدة عوامل، بما في ذلك البيانات غير الكافية أو غير المناسبة، وتقييد الوصول إلى البيانات، والتحيز المتأصل في البيانات، والمخاوف المتعلقة بالخصوصية، واختيار المهام والخوارزميات دون المستوى الأمثل، وعدم كفاية الأدوات والموظفين، وندرة الموارد، والتحديات في التقييم.

يمثل مفهوم "الصندوق الأسود" تحديًا كبيرًا آخر. يصف سيناريو الصندوق الأسود موقفًا تكون فيه الخوارزمية أو العملية التي تولد المخرجات مبهمة تمامًا، مما يعني أنه حتى مطوري الخوارزمية لا يمكنهم تمييز الأنماط المستخرجة من البيانات بواسطة الجهاز بشكل كامل. أكدت اللجنة المختارة بمجلس اللوردات أن "نظام الاستخبارات" الذي يحتمل أن يكون له "تأثير كبير على حياة الفرد" سيعتبر غير مقبول دون تقديم "تفسير كامل ومرضي للقرارات" التي تتخذها.

في عام 2018، لم تكتشف مركبة أوبر ذاتية القيادة أحد المشاة، مما أدى إلى وقوع تصادم مميت. لم تسفر الجهود المبذولة لدمج التعلم الآلي في الرعاية الصحية من خلال نظام IBM Watson عن النتائج المتوقعة، على الرغم من سنوات التطوير واستثمار مليارات الدولارات. علاوة على ذلك، يُقال إن روبوت الدردشة Bing Chat من Microsoft قد ولّد ردودًا عدائية ومسيئة لمستخدميه.

تم استخدام التعلم الآلي كاستراتيجية لتحديث الأدلة الخاصة بالمراجعات المنهجية، ومع ذلك فقد أدى هذا التطبيق في الوقت نفسه إلى زيادة عبء المراجعين بسبب الحجم المتزايد للأدبيات الطبية الحيوية. على الرغم من ملاحظة التحسينات في مجموعات التدريب، إلا أن التكنولوجيا لم تنضج بعد بما يكفي لتخفيف عبء العمل دون المساس بالحساسية المطلوبة لنتائج الأبحاث.

قابلية التفسير

يشير الذكاء الاصطناعي القابل للتفسير (XAI)، والمعروف أيضًا باسم الذكاء الاصطناعي القابل للتفسير أو التعلم الآلي القابل للتفسير (XML)، إلى أنظمة الذكاء الاصطناعي (AI) التي تكون قراراتها أو تنبؤاتها مفهومة للبشر. ويتناقض هذا المفهوم مع ظاهرة "الصندوق الأسود" السائدة في التعلم الآلي، حيث يظل الأساس المنطقي وراء قرار محدد للذكاء الاصطناعي غامضًا في كثير من الأحيان، حتى بالنسبة لمبدعيه. تهدف XAI إلى تحسين أداء المستخدم من خلال تحسين نماذجهم العقلية للأنظمة التي تعمل بالذكاء الاصطناعي ومعالجة المفاهيم الخاطئة المحتملة. علاوة على ذلك، يمكن أن يكون XAI بمثابة تحقيق عملي للحق المجتمعي في التفسير.

التركيب الزائد

يحدث التجاوز عندما يتبنى النموذج نظرية معقدة للغاية، ومصممة بدقة لاستيعاب جميع بيانات التدريب التاريخية، مما قد يؤدي إلى ضعف التعميم. تسعى العديد من الأنظمة إلى التخفيف من التجاوز عن طريق موازنة ملاءمة النموذج للبيانات مع عقوبة التعقيد المتأصل فيه.

القيود ونقاط الضعف الإضافية

قد تُظهر نماذج التعلم الآلي أيضًا ميلًا إلى "تعلم الدرس الخاطئ". على سبيل المثال، قد يستنتج مصنف الصور الذي تم تدريبه حصريًا على صور الخيول البنية والقطط السوداء بشكل خاطئ أن جميع المناطق البنية تمثل الخيول. في السياق العملي، كثيرًا ما تختلف مصنفات الصور المعاصرة عن الإدراك البشري من خلال عدم الاعتماد بشكل أساسي على العلاقات المكانية بين مكونات الصورة. وبدلاً من ذلك، فإنهم غالبًا ما يحددون علاقات البكسل غير المحسوسة للبشر، ولكنها مرتبطة بأنواع محددة من الكائنات في العالم الحقيقي. يمكن أن يؤدي التعامل مع هذه الأنماط الدقيقة داخل صورة مشروعة إلى إنشاء صور "عدائية"، مما يؤدي إلى سوء التصنيف من قبل النظام.

يمكن أن تنشأ نقاط الضعف العدائية أيضًا في الأنظمة غير الخطية أو من الاضطرابات التي لا تتوافق مع الأنماط النموذجية. في بعض الأنظمة، قد يكون تغيير بكسل واحد محدد بشكل عدائي كافيًا لتغيير مخرجات النموذج. وبالتالي، تُظهر نماذج التعلم الآلي في كثير من الأحيان قابلية التلاعب أو التهرب من خلال تقنيات التعلم الآلي العدائية.

أوضح الباحثون جدوى تضمين أبواب خلفية خلسة في نماذج التعلم الآلي التصنيفية، مثل تلك التي تصنف المنشورات إلى "رسائل غير مرغوب فيها" و"ليست رسائل غير مرغوب فيها". يتم تطوير هذه النماذج أو تدريبها بشكل متكرر بواسطة أطراف ثالثة. تتيح هذه الأبواب الخلفية للكيانات غير المصرح لها تغيير تصنيف أي مدخلات، حتى في السيناريوهات التي يتم فيها توفير شفافية البيانات أو البرامج، بما في ذلك الوصول إلى المربع الأبيض، ظاهريًا.

منهجيات تقييم النماذج

يمكن التحقق من صحة أداء التصنيف لنماذج التعلم الآلي باستخدام تقنيات مختلفة لتقدير الدقة. إحدى هذه التقنيات هي طريقة الإيقاف، التي تقسم مجموعة البيانات إلى مجموعة تدريب (عادة 2/3) ومجموعة اختبار (عادة 1/3) لتقييم أداء النموذج المدرب. في المقابل، تتضمن طريقة التحقق المتقاطع K-fold تقسيم البيانات بشكل عشوائي إلى مجموعات فرعية K؛ يتم بعد ذلك إجراء تجارب K، مع استخدام مجموعة فرعية واحدة للتقييم ومجموعات فرعية K-1 المتبقية للتدريب النموذجي. بعيدًا عن نهجي الرفض والتحقق المتبادل، فإن أخذ عينات التمهيد، والذي يتضمن رسم مثيلات مع الاستبدال من مجموعة البيانات، يعمل أيضًا كطريقة لتقييم دقة النموذج.

وبخلاف الدقة الشاملة، يبلغ الباحثون عادةً عن الحساسية والنوعية، والتي تتوافق مع المعدل الإيجابي الحقيقي (TPR) والمعدل السلبي الحقيقي (TNR)، على التوالي. وبالمثل، يتم عرض المعدل الإيجابي الكاذب (FPR) والمعدل السلبي الكاذب (FNR) في بعض الأحيان. ومع ذلك، فإن هذه المعدلات هي نسب لا تكشف بطبيعتها عن البسط والمقامات الأساسية. يوفر منحنى خاصية تشغيل المستقبِل (ROC)، إلى جانب المنطقة المرتبطة به أسفل منحنى ROC (AUC)، أدوات تكميلية لتقييم نماذج التصنيف. تشير قيمة AUC الأعلى إلى الأداء الفائق للنموذج.

الاعتبارات الأخلاقية

التحيز

تتعرض منهجيات التعلم الآلي المختلفة لأشكال مختلفة من تحيز البيانات. على سبيل المثال، قد يواجه النظام الذي تم تدريبه حصريًا على بيانات العملاء الحالية صعوبة في التنبؤ بدقة بمتطلبات شرائح العملاء الجديدة غير الممثلة في مجموعة بيانات التدريب الخاصة به. علاوة على ذلك، عندما يتم تدريب النماذج باستخدام البيانات التي يولدها الإنسان، فإنها تكون عرضة لاستيعاب التحيزات الدستورية وغير الواعية المتأصلة السائدة داخل المجتمع.

يمكن لأنظمة التعلم الآلي، عند تدريبها على مجموعات البيانات المتحيزة، إدامة هذه التحيزات أثناء النشر. هذه الظاهرة، المعروفة باسم التحيز الخوارزمي، تعمل بشكل فعال على رقمنة ونشر التحيزات الثقافية. على سبيل المثال، في عام 1988، حددت لجنة المساواة العنصرية في المملكة المتحدة أن كلية الطب في سانت جورج استخدمت برنامج كمبيوتر، تم تدريبه على بيانات القبول التاريخية، والتي رفضت فيما بعد ما يقرب من 60 متقدمًا بسبب جنسهم أو أسمائهم غير الأوروبية. وبالمثل، إذا تم تدريب نظام التعلم الآلي على بيانات التوظيف من منظمة ذات سياسات تمييزية، فقد يكرر هذه التحيزات من خلال تقييم المتقدمين الجدد على أساس تشابههم مع المرشحين الناجحين سابقًا، والمفضلين المحتملين. يتضمن التوضيح الآخر خوارزمية الشرطة التنبؤية لشركة Geolitica، والتي أدت، بعد التدريب على بيانات الجريمة التاريخية، إلى "مستويات عالية بشكل غير متناسب من الإفراط في ضبط الأمن في المجتمعات ذات الدخل المنخفض والأقليات".

على الرغم من أن جمع البيانات بشكل مسؤول والتوثيق الشامل لقواعد الخوارزمية يعتبران ضروريين في تطوير التعلم الآلي، فإن بعض الباحثين يعزو قابلية التعلم الآلي للتحيز إلى عدم كفاية المشاركة والتمثيل للأقليات في مجال الذكاء الاصطناعي. في الواقع، كشفت دراسة أجرتها جمعية أبحاث الحوسبة عام 2021 أن أعضاء هيئة التدريس الإناث يشكلون 16.1% فقط من جميع أعضاء هيئة التدريس الذين يركزون على الذكاء الاصطناعي في العديد من الجامعات العالمية. علاوة على ذلك، من بين خريجي الدكتوراه في الذكاء الاصطناعي المقيمين حديثًا في الولايات المتحدة، تم تحديد 45% على أنهم من البيض، و22.4% من الآسيويين، و3.2% من ذوي الأصول الأسبانية، و2.4% من الأمريكيين من أصل أفريقي، مما يؤكد النقص المستمر في التنوع داخل مجال الذكاء الاصطناعي.

أثبتت النماذج اللغوية، عند تدريبها على مجموعات بيانات واسعة النطاق، القدرة على استيعاب التحيزات الشبيهة بالإنسان. وبما أن اللغات البشرية تحتوي بطبيعتها على تحيزات، فإن الأنظمة المدربة على مجموعات اللغة تكتسب حتماً هذه التحيزات وتعكسها. حدث مثال ملحوظ في عام 2016 عندما تبنى برنامج الدردشة الآلي التابع لشركة Microsoft، Tay، والذي تعلم من تفاعلات Twitter، لغة عنصرية وجنسية بسرعة.

كشف تحقيق أجرته ProPublica، وهي منظمة للصحافة الاستقصائية، أن خوارزمية التعلم الآلي التي تقيم معدلات العودة إلى الإجرام بين الأفراد المسجونين صنفت بشكل خاطئ المدعى عليهم السود على أنهم معرضون للخطر الشديد بمعدل ضعف عدد المدعى عليهم البيض. في عام 2015، قامت خدمة Google Photos بشكل مثير للجدل بتسمية صورة لأفراد سود على أنها غوريلا. على الرغم من إزالة علامة "الغوريلا" على الفور، يُقال إن النظام ظل غير قادر على التعرف على الغوريلا اعتبارًا من عام 2023. وقد تم توثيق تحديات مماثلة في تحديد الأفراد غير البيض بدقة عبر العديد من الأنظمة الأخرى.

وبالتالي، قد تعيق هذه التحديات الاعتماد الواسع النطاق والفعال للتعلم الآلي عبر مختلف المجالات. إن التركيز المتزايد على العدالة في التعلم الآلي، بما في ذلك الحد من التحيز وتعزيز تطبيقه لتحقيق المنفعة المجتمعية، يتم التعبير عنه بشكل متزايد من قبل علماء الذكاء الاصطناعي. على سبيل المثال، لاحظ Fei-Fei Li، "[لا] يوجد شيء مصطنع في الذكاء الاصطناعي. إنه مستوحى من الناس، وقد ابتكره الناس، والأهم من ذلك أنه يؤثر على الناس. إنه أداة قوية بدأنا للتو في فهمها، وهذه مسؤولية عميقة."

الحوافز المالية

لقد أعرب متخصصو الرعاية الصحية عن مخاوفهم من إمكانية تطوير هذه الأنظمة ليس من أجل الصالح العام في المقام الأول، بل كآليات لتوليد الإيرادات. ويتجلى هذا التخوف بشكل خاص في الولايات المتحدة، حيث يوجد توتر أخلاقي مستمر بين تحسين جودة الرعاية الصحية وتعظيم العائدات المالية. على سبيل المثال، يمكن تصميم الخوارزميات للتوصية باختبارات أو أدوية غير ضرورية، خاصة إذا كان أصحاب ملكية هذه الخوارزميات لديهم مصالح مالية في مثل هذه التدخلات. في حين أن التعلم الآلي يوفر إمكانات كبيرة لتعزيز قدرات المتخصصين في الرعاية الصحية في التشخيص والعلاج والتخطيط لتعافي المرضى، فإن نشره الأخلاقي يستلزم التخفيف الصارم من التحيزات المتأصلة.

الأجهزة

منذ عام 2010، سهّلت التطورات التآزرية في كل من خوارزميات التعلم الآلي وأجهزة الكمبيوتر تطوير منهجيات أكثر كفاءة لتدريب الشبكات العصبية العميقة، وهو مجال فرعي متخصص للتعلم الآلي يتميز بطبقات متعددة من الوحدات المخفية غير الخطية. بحلول عام 2019، حلت وحدات معالجة الرسومات (GPUs)، التي يتم تعزيزها بشكل متكرر بتحسينات خاصة بالذكاء الاصطناعي، محل وحدات المعالجة المركزية (CPUs) إلى حد كبير باعتبارها المورد الحسابي الأساسي لتدريب أنظمة الذكاء الاصطناعي السحابية التجارية الشاملة. أشار تحليل OpenAI لاستخدام حوسبة الأجهزة في مشاريع التعلم العميق الكبرى، الممتدة من AlexNet (2012) إلى AlphaZero (2017)، إلى زيادة مذهلة بمقدار 300000 ضعف في الطلب الحسابي، مما يُظهر خط اتجاه مضاعف يبلغ حوالي 3.4 أشهر.

وحدات معالجة الموتر (TPUs)

وحدات معالجة Tensor (TPUs) عبارة عن مسرعات أجهزة متخصصة صممتها Google في المقام الأول لعمليات التعلم الآلي. وعلى النقيض من وحدات معالجة الرسومات ذات الأغراض العامة (GPUs) ومصفوفات البوابات القابلة للبرمجة ميدانيًا (FPGAs)، تم تحسين وحدات TPU خصيصًا لحسابات الموتر، وبالتالي تعزيز كفاءتها في تطبيقات التعلم العميق، بما في ذلك التدريب والاستدلال. يتم نشر هذه الوحدات على نطاق واسع ضمن خدمات Google Cloud AI وتدعم نماذج التعلم الآلي واسعة النطاق، مثل DeepMind AlphaFold من Google والعديد من نماذج اللغات الكبيرة. تستخدم وحدات TPU وحدات مضاعفة المصفوفة المخصصة وذاكرة النطاق الترددي العالي لتسريع العمليات الحسابية مع الحفاظ في نفس الوقت على كفاءة الطاقة. منذ نشرها الأولي في عام 2016، برزت وحدات TPU كعنصر محوري في البنية التحتية للذكاء الاصطناعي، لا سيما داخل النظم البيئية القائمة على السحابة.

الحوسبة العصبية

تشير الحوسبة العصبية إلى فئة من الأنظمة الحسابية المصممة لتكرار الخصائص الهيكلية والوظيفية للشبكات العصبية البيولوجية. يمكن تحقيق مثل هذه الأنظمة إما من خلال عمليات المحاكاة المعتمدة على البرامج على منصات الأجهزة القياسية أو من خلال بنيات الأجهزة المصممة لهذا الغرض.

الشبكات العصبية المادية

تشكل الشبكة العصبية المادية شكلًا متميزًا من الأجهزة العصبية، التي تستخدم مواد قابلة للضبط كهربائيًا، مثل الميمرستورات، لمحاكاة وظيفة المشابك العصبية. تؤكد تسمية "الشبكة العصبية المادية" على استخدام الأجهزة الملموسة للعمليات الحسابية، مما يميزها عن التطبيقات القائمة على البرمجيات البحتة. وعلى نطاق أوسع، فهي تشمل الشبكات العصبية الاصطناعية التي تتضمن مواد تظهر مقاومة قابلة للتعديل لمحاكاة السلوك المتشابك.

التعلم الآلي المضمن

يمثل التعلم الآلي المضمن مجالًا متخصصًا في التعلم الآلي يركز على نشر النماذج على الأنظمة المدمجة التي تتميز بموارد حسابية محدودة، بما في ذلك أجهزة الكمبيوتر القابلة للارتداء، وأجهزة الحافة، ووحدات التحكم الدقيقة. يؤدي التنفيذ المباشر للنماذج على هذه الأجهزة إلى تجنب ضرورة نقل البيانات وتخزينها على خوادم سحابية للمعالجة اللاحقة، وبالتالي تخفيف المخاطر المرتبطة بانتهاكات البيانات وتسويات الخصوصية واختلاس الملكية الفكرية والمعلومات الشخصية وبيانات الأعمال الخاصة. يمكن تنفيذ التعلم الآلي المضمن عبر منهجيات متنوعة، بما في ذلك تسريع الأجهزة والحوسبة التقريبية وتحسين النموذج. تشمل تقنيات التحسين السائدة التقليم، والتكميم، وتقطير المعرفة، والتحليل منخفض الرتبة، والبحث في بنية الشبكة، ومشاركة المعلمات.

البرامج

تشتمل مجموعات البرامج التي تتضمن مجموعة متنوعة من خوارزميات التعلم الآلي على ما يلي:

برامج مفتوحة المصدر ومتاحة مجانًا

عروض البرامج الاحتكارية التي تتميز أيضًا بإصدارات مجانية ومفتوحة المصدر

نايم
RapidMiner

البرمجيات الاحتكارية

الدوريات

مجلة أبحاث التعلم الآلي
التعلم الآلي
ذكاء الآلة الطبيعي
الحساب العصبي
معاملات IEEE حول تحليل الأنماط والذكاء الآلي

المؤتمرات

مؤتمر AAAI حول الذكاء الاصطناعي
جمعية اللغويات الحاسوبية (ACL)
المؤتمر الأوروبي حول التعلم الآلي ومبادئ وممارسة اكتشاف المعرفة في قواعد البيانات (ECML PKDD)
المؤتمر الدولي حول أساليب الذكاء الحسابي للمعلوماتية الحيوية والإحصاء الحيوي (CIBB)
المؤتمر الدولي للتعلم الآلي (ICML)
المؤتمر الدولي لتمثيلات التعلم (ICLR)
المؤتمر الدولي للروبوتات والأنظمة الذكية (IROS)
مؤتمر اكتشاف المعرفة والتنقيب عن البيانات (KDD)
مؤتمر أنظمة معالجة المعلومات العصبية (NeurIPS)

التعلم الآلي الآلي – عملية أتمتة تطبيق التعلم الآلي.

التعلم الآلي الآلي - عملية أتمتة تطبيق التعلم الآلي
البيانات الضخمة – مجموعات البيانات التي تتميز بالحجم الشديد أو التعقيد.
التعلم العميق – مجال فرعي من التعلم الآلي يركز بشكل أساسي على الشبكات العصبية الاصطناعية.
البرمجة التفاضلية – نموذج برمجة متميز.
مجموعة من مجموعات البيانات المستخدمة في أبحاث التعلم الآلي.
مجموعات من خوارزميات التعلم الآلي والخوارزميات المصممة خصيصًا للتعلم الآلي والتصنيف الإحصائي.
نظرية M (إطار التعلم) – إطار مفاهيمي ضمن التعلم الآلي.
تعلم الآلة - مجال ناشئ للدراسة في مجال الذكاء الاصطناعي.
نظرة عامة تحدد مجال التعلم الآلي.
نظرية سولومونوف في الاستدلال الاستقرائي – نظرية رياضية تأسيسية.

المراجع

المصادر

دومينغوس، بيدرو (22 سبتمبر 2015). الخوارزمية الرئيسية: كيف سيعيد البحث عن آلة التعلم النهائية تشكيل عالمنا. الكتب الأساسية. رقم ISBN 978-0-465-06570-7.
نيلسون، نيلز (1998). الذكاء الاصطناعي: تركيب جديد. مورغان كوفمان. ISBN 978-1-55860-467-4. مؤرشفة من الأصلي في 26 يوليو 2020. 18 نوفمبر 2019.
ديفيد بول; ماكوورث، آلان. جوبل ، راندي (1998). الذكاء الحسابي: نهج منطقي. نيويورك: مطبعة جامعة أكسفورد. رقم ISBN 978-0-19-510270-3. مؤرشفة من الأصلي في 26 يوليو 2020. تم الاسترجاع 22 أغسطس 2020.
راسل، ستيوارت جيه.; نورفيج، بيتر (2003)، الذكاء الاصطناعي: نهج حديث (الطبعة الثانية)، أبر سادل ريفر، نيو جيرسي: برنتيس هول، ISBN 0-13-790395-2
الجمعية الدولية للتعلم الآلي.

يعمل MLOSS كمستودع أكاديمي لبرامج التعلم الآلي مفتوحة المصدر.

التعلم الآلي (Machine learning)