مقدمة لتحليل الانحدار متعدد المتغيرات

في عالم اليوم، البيانات موجودة في كل مكان. البيانات في حد ذاتها هي مجرد حقائق وأرقام، ويجب استكشاف ذلك للحصول على معلومات ذات معنى. وبالتالي، تحليل البيانات مهم.
تحليل البيانات هو عملية تطبيق التحليل الإحصائي والتقنيات المنطقية لوصف البيانات وتصورها وتقليلها ومراجعتها وتلخيصها وتقييمها وتحويلها إلى معلومات مفيدة توفر سياقًا أفضل للبيانات.
قم بالاطلاع على دورة التحليل الإحصائي للتعرف على الأساليب الإحصائية المستخدمة في تحليل البيانات.
يلعب تحليل البيانات دورًا مهمًا في العثور على معلومات مفيدة تساعد الشركات على اتخاذ قرارات أفضل بناءً على النتائج. جنبا إلى جنب مع تحليل البيانات، يأتي علم البيانات أيضا في الصورة.
علم البيانات هو مجال يجمع بين العديد من أساليب المنهجية العلمية والعمليات والخوارزميات والأدوات اللازمة لاستخراج المعلومات منها، وخاصة مجموعات البيانات الضخمة للحصول على رؤى حول البيانات المنظمة وغير المنظمة.
غالبًا ما يتم استخدام مجموعة مختلفة من المصطلحات المتعلقة باستخراج البيانات وتنظيفها وتحليلها وتفسيرها بالتبادل في علم البيانات.
دعونا نلقي نظرة على أحد النماذج المهمة لعلم البيانات.
تحليل الانحدار
يعد تحليل الانحدار أحد أكثر الطرق المستخدمة في تحليل البيانات. وهو يتبع خوارزمية التعلم الآلي الخاضعة للإشراف. يعد تحليل الانحدار طريقة إحصائية مهمة تسمح لنا بفحص العلاقة بين متغيرين أو أكثر في مجموعة البيانات.
تحليل الانحدار هو وسيلة للتمييز رياضيا بين المتغيرات التي لها تأثير. يجيب على الأسئلة: المتغيرات الهامة؟ والتي يمكن تجاهلها؟ كيف يتفاعلون مع بعضهم البعض؟ والأهم هو مدى تأكدنا من هذه المتغيرات.
لدينا متغير تابع، وهو العامل الرئيسي الذي نحاول فهمه أو التنبؤ به. ثم لدينا متغيرات مستقلة، وهي العوامل التي نعتقد أن لها تأثيرًا على المتغير التابع.
الانحدار الخطي البسيط هو نموذج انحدار يقوم بتقدير العلاقة بين متغير تابع ومتغير مستقل باستخدام خط مستقيم.
من ناحية أخرى، يقوم الانحدار الخطي المتعدد بتقدير العلاقة بين متغيرين مستقلين أو أكثر ومتغير تابع واحد.
الفرق بين هذين النموذجين هو عدد المتغيرات المستقلة.
في بعض الأحيان لن تعمل نماذج الانحدار المذكورة أعلاه. هذا هو السبب.
كما هو معروف، يستخدم تحليل الانحدار بشكل رئيسي في فهم العلاقة بين المتغير التابع والمتغير المستقل.
في العالم الحقيقي، هناك عدد كبير من المواقف التي تتأثر فيها العديد من المتغيرات المستقلة بمتغيرات أخرى، لذا يتعين علينا البحث عن خيارات أخرى بدلاً من نموذج انحدار واحد يمكنه العمل فقط مع متغير مستقل واحد.
مع وجود هذه النكسات في متناول اليد، نرغب في نموذج أفضل يسد عيوب الانحدار الخطي البسيط والمتعدد وهذا النموذج هو الانحدار متعدد المتغيرات.
إذا كنت مبتدئًا في هذا المجال وترغب في تعلم المزيد من هذه المفاهيم لبدء حياتك المهنية في التعلم الآلي، فيمكنك التوجه إلى Great Learning Academy وتعلم أساسيات التعلم الآلي، الانحدار الخطي. ستغطي الدورة جميع المفاهيم الأساسية المطلوبة لبدء رحلة التعلم الآلي الخاصة بك.
هل تبحث عن تحسين مهاراتك في تحليل الانحدار؟ سيعلمك تحليل الانحدار باستخدام دورة Excel جميع التقنيات التي تحتاج إلى معرفتها لتحقيق أقصى استفادة من بياناتك.
ستتعلم كيفية بناء النماذج وتفسير النتائج واستخدام تحليل الانحدار لاتخاذ قرارات أفضل لشركتك. سجل اليوم وابدأ في طريقك لتصبح صانع قرار يعتمد على البيانات!
ما هو الانحدار متعدد المتغيرات؟
الانحدار متعدد المتغيرات عبارة عن خوارزمية تعلم آلي خاضعة للإشراف تتضمن متغيرات بيانات متعددة للتحليل. الانحدار متعدد المتغيرات هو امتداد للانحدار المتعدد مع متغير تابع واحد ومتغيرات مستقلة متعددة.
استنادا إلى عدد المتغيرات المستقلة، نحاول التنبؤ بالناتج.
يحاول الانحدار متعدد المتغيرات اكتشاف صيغة يمكنها تفسير كيفية استجابة العوامل في المتغيرات في وقت واحد للتغيرات في المتغيرات الأخرى.
هناك العديد من المجالات التي يمكن فيها استخدام الانحدار متعدد المتغيرات. دعونا نلقي نظرة على بعض الأمثلة لفهم الانحدار متعدد المتغيرات بشكل أفضل.
- تريد برانيتا تقدير سعر المنزل. ستقوم بجمع تفاصيل مثل موقع المنزل وعدد غرف النوم وحجمه بالقدم المربع ووسائل الراحة المتوفرة أم لا. على أساس هذه التفاصيل، يمكن التنبؤ بسعر المنزل وكيفية ترابط كل المتغيرات.
- يريد أحد علماء الزراعة التنبؤ بإجمالي إنتاجية المحاصيل المتوقعة لفصل الصيف. وقام بجمع تفاصيل عن كمية الأمطار المتوقعة والأسمدة التي سيتم استخدامها وظروف التربة. من خلال بناء نموذج الانحدار متعدد المتغيرات، يمكن للعلماء التنبؤ بإنتاجية محصوله. وفيما يتعلق بإنتاجية المحصول، يحاول العالم أيضًا فهم العلاقة بين المتغيرات.
- إذا أرادت إحدى المنظمات معرفة المبلغ الذي يتعين عليها دفعه لموظف جديد، فسوف تأخذ في الاعتبار العديد من التفاصيل مثل مستوى التعليم، وعدد الخبرة، وموقع العمل، وما إذا كان لديه مهارة متخصصة أم لا. على أساس هذه المعلومات يمكن التنبؤ براتب الموظف، وكيف تساعد هذه المتغيرات في تقدير الراتب.
- يمكن للاقتصاديين استخدام الانحدار متعدد المتغيرات للتنبؤ بنمو الناتج المحلي الإجمالي لدولة أو دولة بناءً على معايير مثل إجمالي المبلغ الذي ينفقه المستهلكون، ونفقات الواردات، وإجمالي المكاسب من الصادرات، وإجمالي المدخرات، وما إلى ذلك.
- تريد إحدى الشركات التنبؤ بفاتورة الكهرباء لشقة، والتفاصيل المطلوبة هنا هي عدد الشقق، وعدد الأجهزة المستخدمة، وعدد الأشخاص في المنزل، وما إلى ذلك. وبمساعدة هذه المتغيرات، يمكن تحديد فاتورة الكهرباء وتوقع.
يستخدم المثال أعلاه الانحدار متعدد المتغيرات، حيث لدينا العديد من المتغيرات المستقلة ومتغير تابع واحد.
معادلة رياضية
يمثل نموذج الانحدار الخطي البسيط خطًا مستقيمًا مما يعني أن y هي دالة لـ x. عندما يكون لدينا بعد إضافي (z)، يصبح الخط المستقيم مستوى.
هنا، المستوى هو الدالة التي تعبر عن y كدالة لـ x وz. يمكن الآن التعبير عن معادلة الانحدار الخطي على النحو التالي:
ص = m1.x + m2. z+ ج
y هو المتغير التابع، أي المتغير الذي يجب التنبؤ به.
x هو المتغير المستقل الأول. وهو الإدخال الأول.
m1 هو ميل x1. يتيح لنا معرفة زاوية الخط (x).
z هو المتغير المستقل الثاني. وهو الإدخال الثاني.
m2 هو ميل z. يساعدنا على معرفة زاوية الخط (z).
ج هو التقاطع. ثابت يجد قيمة y عندما يكون x وz يساوي 0.
يمكن كتابة معادلة النموذج الذي يحتوي على متغيرين مدخلين على النحو التالي:
ص = β0 + β1.x1 + β2.x2
ماذا لو كان هناك ثلاث متغيرات كمدخلات؟ التصورات البشرية يمكن أن تكون ثلاثة أبعاد فقط.
في عالم التعلم الآلي، يمكن أن يكون هناك عدد لا يحصى من الأبعاد. يمكن كتابة معادلة النموذج الذي يحتوي على ثلاث متغيرات مدخلة على النحو التالي:
ص = β0 + β1.x1 + β2.x2 + β3.x3
فيما يلي المعادلة المعممة لنموذج الانحدار متعدد المتغيرات-
y = β0 + β1.x1 + β2.x2 +….. + βn.xn
حيث يمثل n عدد المتغيرات المستقلة، ويمثل β0~ βn المعاملات، وx1~xn هو المتغير المستقل.
يساعدنا النموذج متعدد المتغيرات في فهم ومقارنة المعاملات عبر المخرجات. هنا، تجعل دالة التكلفة الصغيرة الانحدار الخطي متعدد المتغيرات نموذجًا أفضل.
اقرأ أيضًا: 100+ أسئلة مقابلة للتعلم الآلي
ما هي وظيفة التكلفة؟
دالة التكلفة هي دالة تسمح بتحديد التكلفة للعينات عندما يختلف النموذج عن البيانات المرصودة.
هذه المعادلة هي مجموع مربع الفرق بين القيمة المتوقعة والقيمة الفعلية مقسومًا على ضعف طول مجموعة البيانات. يشير الخطأ التربيعي الأصغر إلى أداء أفضل. التكلفة هنا هي مجموع الأخطاء المربعة.
تكلفة الانحدار الخطي المتعدد:
خطوات تحليل الانحدار متعدد المتغيرات
الخطوات المتضمنة في تحليل الانحدار متعدد المتغيرات هي اختيار الميزات وهندسة الميزات، وتطبيع الميزات، واختيار دالة الخسارة والفرضية، وتعيين معلمات الفرضية، وتقليل دالة الخسارة، واختبار الفرضية، وإنشاء نموذج الانحدار.
- اختيار الميزة –
يعد اختيار الميزات خطوة مهمة في الانحدار متعدد المتغيرات. يُعرف اختيار الميزة أيضًا باسم التحديد المتغير. يصبح من المهم بالنسبة لنا اختيار متغيرات مهمة لبناء نموذج أفضل. - تطبيع الميزات –
نحتاج إلى توسيع نطاق الميزات لأنها تحافظ على التوزيع العام والنسب في البيانات. وهذا سوف يؤدي إلى تحليل فعال. ويمكن أيضًا تغيير قيمة كل ميزة. - حدد وظيفة الخسارة والفرضية-
تتنبأ وظيفة الخسارة عندما يكون هناك خطأ. بمعنى، عندما ينحرف التنبؤ الفرضي عن القيم الفعلية. هنا، الفرضية هي القيمة المتوقعة من الميزة/المتغير. - تعيين معلمات الفرضية –
يجب تعيين معلمة الفرضية بطريقة تقلل من وظيفة الخسارة وتتنبأ بشكل جيد. - تقليل دالة الخسارة –
يجب تقليل دالة الخسارة إلى الحد الأدنى باستخدام خوارزمية تقليل الخسارة في مجموعة البيانات، مما سيساعد في تعديل معلمات الفرضية. بعد تقليل الخسارة، يمكن استخدامها لمزيد من الإجراءات. يعد النزول المتدرج أحد الخوارزميات المستخدمة بشكل شائع لتقليل الخسارة. - اختبار وظيفة الفرضية –
تحتاج وظيفة الفرضية إلى التحقق منها أيضًا، لأنها تتنبأ بالقيم. وبمجرد الانتهاء من ذلك، يجب اختباره على بيانات الاختبار.
مزايا الانحدار متعدد المتغيرات
الميزة الأكثر أهمية للانحدار متعدد المتغيرات هي أنه يساعدنا على فهم العلاقات بين المتغيرات الموجودة في مجموعة البيانات. سيساعد هذا أيضًا في فهم العلاقة بين المتغيرات التابعة والمستقلة.
الانحدار الخطي متعدد المتغيرات هو خوارزمية تعلم الآلة المستخدمة على نطاق واسع.
مساوئ الانحدار متعدد المتغيرات
- تعد التقنيات متعددة المتغيرات معقدة بعض الشيء وتتطلب مستويات عالية من الحساب الرياضي.
- ليس من السهل تفسير مخرجات نموذج الانحدار متعدد المتغيرات في بعض الأحيان، لأنه يحتوي على بعض مخرجات الخسارة والخطأ غير المتطابقة.
- لا يحتوي هذا النموذج على مجال كبير لمجموعات البيانات الأصغر. وبالتالي لا يمكن أن ينطبق عليهم نفس الشيء. النتائج أفضل لمجموعات البيانات الأكبر.
خاتمة
يظهر الانحدار متعدد المتغيرات في الصورة عندما يكون لدينا أكثر من متغير مستقل، ولا يعمل الانحدار الخطي البسيط
تتضمن بيانات العالم الحقيقي متغيرات أو ميزات متعددة، وعندما تكون هذه المتغيرات موجودة في البيانات، فإننا نطلب الانحدار متعدد المتغيرات لتحليل أفضل.
المصدر: mygreatlearning
قد يهمك: