اختبار الفروض الإحصائية
يتعرض الإنسان في كثير من الحالات وفي مجالات العمل إلى مواقف معينة تتطلب منه اتخاذ قرار بناء على معلومات محسوبة من عينة. وطبيعي أن يتخذ هذا القرار بشيء من الحكمة أو بأقل قدر ممكن من المخاطر،
مثال 1
نفرض أن باحثا اجتماعيا ادعى أن متوسط أعمار طلاب الجامعة لا يختلف عن متوسط أعمار الطالبات. للتأكد من ذلك فإن الشيء الطبيعي أن نقوم بحصر أعمار الطلاب والطالبات ومنها نحسب المتوسط لكل منهما ثم نقرر من منهما أكبر.. ولكن عملية الحصر صعبة ومجهدة لذلك نضطر إلى اختيار عينة عشوائية من بين الطلاب وعينة عشوائية من بين الطالبات ونحسب متوسط العمر في كل عينة منهما، فإذا كان متوسط عمر الطالب هو 24 وكان متوسط عمر الطالبة هو 22 فهل يعني ذلك أن متوسط عمر الطالب أكبر من متوسط عمر الطالبة؟ هل الفرق راجع لمجرد المصادفة؟ متى يكون الفرق نتيجة للمصادفة؟ متى يكون الفرق دالا على وجود اختلاف حقيقي أو جوهري بين متوسطي العينتين.
مثال 1
نفرض أن باحثا اجتماعيا ادعى أن متوسط أعمار طلاب الجامعة لا يختلف عن متوسط أعمار الطالبات. للتأكد من ذلك فإن الشيء الطبيعي أن نقوم بحصر أعمار الطلاب والطالبات ومنها نحسب المتوسط لكل منهما ثم نقرر من منهما أكبر.. ولكن عملية الحصر صعبة ومجهدة لذلك نضطر إلى اختيار عينة عشوائية من بين الطلاب وعينة عشوائية من بين الطالبات ونحسب متوسط العمر في كل عينة منهما، فإذا كان متوسط عمر الطالب هو 24 وكان متوسط عمر الطالبة هو 22 فهل يعني ذلك أن متوسط عمر الطالب أكبر من متوسط عمر الطالبة؟ هل الفرق راجع لمجرد المصادفة؟ متى يكون الفرق نتيجة للمصادفة؟ متى يكون الفرق دالا على وجود اختلاف حقيقي أو جوهري بين متوسطي العينتين.
مفاهيم مهمة:
صياغة الفرض الإحصائي Statistical Hypothesis
هو عبارة عن ادعاء أو تخمين معين حول معلمة من معالم المجتمع ويكون المطلوب اختبار صحة هذا الادعاء أو التخمين ...هناك نوعين من الفروض:
فرض العدم Null Hypothesis ويرمز له بالرمز ف. Ho ويصاغ في صورة عدم وجود فرق أو عدم وجود علاقة أو عدم وجود تغير.
مثال: في مثال أعمار الطلاب وطالبات الجامعة فإن فرض العدم هو
ف. Ho : نفترض عدم وجود اختلاف بين متوسطي أعمار الطلاب والطالبات.
الفرض البديل Alternative Hypothesis ويرمز له بالرمز ف1 H1 وهو الفرض الذي يجب أن يكون صحيحا إذا كان فرض العدم غير صحيح
مثال : في مثال أعمار الطلاب وطالبات الجامعة فإن الفرض البديل هو
ف1 H1 : يوجد اختلاف حقيقي وليس ظاهري بين متوسط أعمار الطلاب والطالبات.
الصور المختلفة للفروض الإحصائية:
إذا كان المطلوب هو اختبار فرض العدم حول أحد معالم المجتمع مـ فإن فرض العدم هو
ف.: مـ = مـ 0
الفرض البديل هو أحد الحالات التالية:
1- ف1: مـ ? مـ0
2- ف1: مـ < مـ0
3- ف1: مـ > مـ0
- مستوى المعنوية Level of Significant
عند اختبار فرض العدم ف. ضد الفرض البديل ف1 نجد أننا أمام إحدى الحالات الأربع الآتية:
1- أن يكون فرض العدم صحيحا ويكون القرار بقبوله ...وهذا قرار سليم.
2- أن يكون فرض العدم صحيحا ويكون القرار برفضه... وهذا قرار خاطئ.
الخطأ من النوع الأول: رفض ف. عندما يكون ف. صحيحا ويرمز لحجم هذا الخطأ بالرمز ?
3- أن يكون فرض العدم خطأ ويكون القرار برفضه... وهذا قرار سليم.
4- أن يكون فرض العدم خطأ ويكون القرار بقبوله ...وهذا قرار خاطئ
الخطأ من النوع الثاني: قبول ف. عندما يكون ف. خاطئ ويرمز لحجم هذا الخطأ بالرمز?
- احتمال الوقوع في الخطأ من النوع الأول يسمى مستوى المعنوية Level of Significant ويسمى أحيانا بحجم منطقة الرفض Size of Rejection Region ويرمزله بالرمز ? أي أن
? = احتمال رفض فرض العدم ف. عندما يكون صحيحا.
= مستوى المعنوية = حجم منطقة الرفض = حجم الاختبار
- احتمال الوقوع في خطأ من النوع الثاني يرمز له بالرمز ? أي أن
? = احتمال قبول فرض العدم ف. عندما يكون خطأ.
ملاحظة: الاختبار الجيد هو الاختبار الذي يجعل قيمة كل من ? , ? أقل ما يمكن.
- إذا استخدمنا مستوى معنوية ?= 0.05 مثلا فهذا يعني أن احتمال الوقوع في خطأ من النوع الأول أي احتمال رفض ف. وهو صحيح هو 0.05 وهذا يعني أنه في المتوسط من بين كل 100 حالة يكون في 95 حالة منها قرارنا سليم وفي الحالات الخمس الباقية قرارنا خطأ.
صياغة الفرض الإحصائي Statistical Hypothesis
هو عبارة عن ادعاء أو تخمين معين حول معلمة من معالم المجتمع ويكون المطلوب اختبار صحة هذا الادعاء أو التخمين ...هناك نوعين من الفروض:
فرض العدم Null Hypothesis ويرمز له بالرمز ف. Ho ويصاغ في صورة عدم وجود فرق أو عدم وجود علاقة أو عدم وجود تغير.
مثال: في مثال أعمار الطلاب وطالبات الجامعة فإن فرض العدم هو
ف. Ho : نفترض عدم وجود اختلاف بين متوسطي أعمار الطلاب والطالبات.
الفرض البديل Alternative Hypothesis ويرمز له بالرمز ف1 H1 وهو الفرض الذي يجب أن يكون صحيحا إذا كان فرض العدم غير صحيح
مثال : في مثال أعمار الطلاب وطالبات الجامعة فإن الفرض البديل هو
ف1 H1 : يوجد اختلاف حقيقي وليس ظاهري بين متوسط أعمار الطلاب والطالبات.
الصور المختلفة للفروض الإحصائية:
إذا كان المطلوب هو اختبار فرض العدم حول أحد معالم المجتمع مـ فإن فرض العدم هو
ف.: مـ = مـ 0
الفرض البديل هو أحد الحالات التالية:
1- ف1: مـ ? مـ0
2- ف1: مـ < مـ0
3- ف1: مـ > مـ0
- مستوى المعنوية Level of Significant
عند اختبار فرض العدم ف. ضد الفرض البديل ف1 نجد أننا أمام إحدى الحالات الأربع الآتية:
1- أن يكون فرض العدم صحيحا ويكون القرار بقبوله ...وهذا قرار سليم.
2- أن يكون فرض العدم صحيحا ويكون القرار برفضه... وهذا قرار خاطئ.
الخطأ من النوع الأول: رفض ف. عندما يكون ف. صحيحا ويرمز لحجم هذا الخطأ بالرمز ?
3- أن يكون فرض العدم خطأ ويكون القرار برفضه... وهذا قرار سليم.
4- أن يكون فرض العدم خطأ ويكون القرار بقبوله ...وهذا قرار خاطئ
الخطأ من النوع الثاني: قبول ف. عندما يكون ف. خاطئ ويرمز لحجم هذا الخطأ بالرمز?
- احتمال الوقوع في الخطأ من النوع الأول يسمى مستوى المعنوية Level of Significant ويسمى أحيانا بحجم منطقة الرفض Size of Rejection Region ويرمزله بالرمز ? أي أن
? = احتمال رفض فرض العدم ف. عندما يكون صحيحا.
= مستوى المعنوية = حجم منطقة الرفض = حجم الاختبار
- احتمال الوقوع في خطأ من النوع الثاني يرمز له بالرمز ? أي أن
? = احتمال قبول فرض العدم ف. عندما يكون خطأ.
ملاحظة: الاختبار الجيد هو الاختبار الذي يجعل قيمة كل من ? , ? أقل ما يمكن.
- إذا استخدمنا مستوى معنوية ?= 0.05 مثلا فهذا يعني أن احتمال الوقوع في خطأ من النوع الأول أي احتمال رفض ف. وهو صحيح هو 0.05 وهذا يعني أنه في المتوسط من بين كل 100 حالة يكون في 95 حالة منها قرارنا سليم وفي الحالات الخمس الباقية قرارنا خطأ.
- اختبار الفرض الإحصائي Test of Statistical Hypothesis
لإجراء الاختبار الإحصائي فإننا نتبع الخطوات التالية:
نفرض أن لدينا مجتمعا أو مجتمعين يتبع كل منهما توزيعا احتماليا معينا وأن هذا التوزيع يعتمد على بعض المعالم.
نفرض أن المطلوب اختبار فرض العدم ف. حول أحد هذه المعالم وليكن فرض العدم هو
ف. : مـ = مـ0
والفرض البديل هو أحد الحالات التالية:
1- ف1: مـ ? مـ0
2- ف1: مـ < مـ0
3- ف1: مـ > مـ0
نبحث عن إحصاء وليكن ز ويسمى إحصاء الاختبار وهو يحتوي على مقدر للمعلمة مـ التي يدور حولها فرض العدم.
باعتبار أن فرض العدم صحيح نبحث عن التوزيع الاحتمالي للإحصاء ز.
بناء على مستوى المعنوية ? وعلى الفرض البديل ف1 يمكن تقسيم محور قيم الإحصاء ز إلى منطقتين أحداهما تسمى منطقة الرفض Rejection Region والأخرى تسمى منطقة القبول Acceptance Region بحيث أن المساحة تحت المنحنى وأعلى منطقة الرفض هي مستوى المعنوية ? أو بمعنى آخر نحدد القيمة الحرجة Critical Value وهي زo بحيث يكون
? = احتمال أن تكون ز< زo او ز> زo أو ز < ز1 و ز > ز2
إذا كانت ف1: مـ < مـ0 فإن قيم ز المحسوبة من العينة والتي لا تؤيد فرض العدم تقع في منطقة الرفض أي تكون أكبر من زo وقيم ز المحسوبة من العينة والتي تؤيد فرض العدم تقع في منطقة القبول أي اصغر من زo ويسمى اختبار من جانب واحد (الأيمن)
? = احتمال ان تكون ز< زo
اذاكانت ف1: مـ > مـ0 فإن القيمة الحرجة زo تتحدد من العلاقة
? = احتمال ان تكون ز> زo
و تكون قيم ز المحسوبة من العينة والتي لا تؤيد فرض العدم تقع في منطقة الرفض أي تكون أصغر من زo وقيم ز المحسوبة من العينة والتي تؤيد فرض العدم تقع في منطقة القبول أي أكبر من زo ويسمى اختبار من جانب واحد (الأيسر)
إذا كانت ف1: مـ ? مـ0 فإن منطقة الرفض تكون موزعة بالتساوي على جانبي المنحنى ومساحة كل جزء منها يساوي ? / 2 ،وتتحدد القيم الحرجة من العلاقتين الاتيتين
2\ ? = احتمال أن تكون ز < ز1 و 2\ ? = احتمال ان تكون ز > ز2
وفي هذه الحالة تكون قيم ز التي لاتؤيد فرض العدم أكبر من ز 1
وأصغر من ز2 وتسمى اختبار من جانبين الأيمن والأيسر.
لإجراء الاختبار الإحصائي فإننا نتبع الخطوات التالية:
نفرض أن لدينا مجتمعا أو مجتمعين يتبع كل منهما توزيعا احتماليا معينا وأن هذا التوزيع يعتمد على بعض المعالم.
نفرض أن المطلوب اختبار فرض العدم ف. حول أحد هذه المعالم وليكن فرض العدم هو
ف. : مـ = مـ0
والفرض البديل هو أحد الحالات التالية:
1- ف1: مـ ? مـ0
2- ف1: مـ < مـ0
3- ف1: مـ > مـ0
نبحث عن إحصاء وليكن ز ويسمى إحصاء الاختبار وهو يحتوي على مقدر للمعلمة مـ التي يدور حولها فرض العدم.
باعتبار أن فرض العدم صحيح نبحث عن التوزيع الاحتمالي للإحصاء ز.
بناء على مستوى المعنوية ? وعلى الفرض البديل ف1 يمكن تقسيم محور قيم الإحصاء ز إلى منطقتين أحداهما تسمى منطقة الرفض Rejection Region والأخرى تسمى منطقة القبول Acceptance Region بحيث أن المساحة تحت المنحنى وأعلى منطقة الرفض هي مستوى المعنوية ? أو بمعنى آخر نحدد القيمة الحرجة Critical Value وهي زo بحيث يكون
? = احتمال أن تكون ز< زo او ز> زo أو ز < ز1 و ز > ز2
إذا كانت ف1: مـ < مـ0 فإن قيم ز المحسوبة من العينة والتي لا تؤيد فرض العدم تقع في منطقة الرفض أي تكون أكبر من زo وقيم ز المحسوبة من العينة والتي تؤيد فرض العدم تقع في منطقة القبول أي اصغر من زo ويسمى اختبار من جانب واحد (الأيمن)
? = احتمال ان تكون ز< زo
اذاكانت ف1: مـ > مـ0 فإن القيمة الحرجة زo تتحدد من العلاقة
? = احتمال ان تكون ز> زo
و تكون قيم ز المحسوبة من العينة والتي لا تؤيد فرض العدم تقع في منطقة الرفض أي تكون أصغر من زo وقيم ز المحسوبة من العينة والتي تؤيد فرض العدم تقع في منطقة القبول أي أكبر من زo ويسمى اختبار من جانب واحد (الأيسر)
إذا كانت ف1: مـ ? مـ0 فإن منطقة الرفض تكون موزعة بالتساوي على جانبي المنحنى ومساحة كل جزء منها يساوي ? / 2 ،وتتحدد القيم الحرجة من العلاقتين الاتيتين
2\ ? = احتمال أن تكون ز < ز1 و 2\ ? = احتمال ان تكون ز > ز2
وفي هذه الحالة تكون قيم ز التي لاتؤيد فرض العدم أكبر من ز 1
وأصغر من ز2 وتسمى اختبار من جانبين الأيمن والأيسر.
https://www.mik1111.blogspot.com https://www.facebook.com/kauifi