الاختبارات غير البارامترية: المفاهيم والاحتياطات والمزايا

بعد قراءة هذا المقال سوف تتعرف على: - 1. مفاهيم الاختبارات غير الحدودية 2. افتراضات الاختبارات غير البارامترية 3. الاحتياطات 4. بعض الاختبارات غير البارامترية 5. المزايا 6. العيوب.

مفاهيم الاختبارات غير البارامترية:

لقد شهدنا في الآونة الأخيرة تطور عدد كبير من أساليب الاستدلال التي لا تضع افتراضات عديدة أو صارمة حول السكان التي أخذنا منها عينات من البيانات. هذه التقنيات الحرة أو غير المعهودة للتوزيع تؤدي إلى استنتاجات تتطلب مؤهلات أقل.

بعد استخدام واحدة منها ، قد نكون قادرين على قول ذلك ، "بغض النظر عن شكل السكان (السكان) ، يمكننا أن نستنتج ذلك ..."

الاسمان البديلان اللذان كثيرا ما يتم إعطاؤهما لهذه الاختبارات هما:

توزيع مجاني:

الاختبارات غير القياسية هي "خالية من التوزيع". لا تفترض أن الدرجات التي يتم تحليلها مستقاة من مجموعة من السكان موزعة بطريقة معينة ، على سبيل المثال ، من السكان الموزعين بشكل طبيعي.

عند إجراء اختبارات لأهمية الفرق بين وسيلتين (من حيث CR أو t ، على سبيل المثال) ، نفترض أن النتائج التي تستند إليها إحصاءاتنا توزع عادة على السكان. إن ما نفعل فعلاً - تحت فرضية العدم - هو تقدير احتمالية وجود اختلاف حقيقي بين المعلمتين من إحصاءات العينة.

عندما يكون N صغيراً جداً أو تكون البيانات مشوهة بشكل سيئ ، بحيث يكون افتراض الوضع الطبيعي مشكوكاً فيه ، فإن "الأساليب البارامترية" تكون ذات قيمة مشكوك فيها أو لا تنطبق على الإطلاق. ما نحتاجه في مثل هذه الحالات هو التقنيات التي ستمكننا من مقارنة العينات وإجراء استنتاجات أو اختبارات ذات دلالة دون الاضطرار إلى افتراض الوضع الطبيعي في السكان.

وتسمى هذه الأساليب غير بارامترية أو التوزيع المجاني. اختبار اختبار كاي 2 X على سبيل المثال ، هو تقنية غير بارامترية. تعتمد أهمية X 2 فقط على درجات الحرية في الجدول ؛ لا يلزم إجراء افتراض على شكل توزيع للمتغيرات المصنفة ضمن فئات جدول X 2 .

معامل ارتباط فرق الاختلاف (rho) هو أيضًا أسلوب غير بارامتري. عندما يتم حساب p من الدرجات المرتبة حسب ترتيب الاستحقاق ، فإن التوزيع الذي يتم من خلاله أخذ الدرجات يكون عرضة للالتواء بشكل سيء ويكون N تقريباً صغيرًا تقريبًا.

اختبارات الترتيب:

بدلا من ذلك ، يتم تحديد العديد من هذه الاختبارات على أنها "اختبارات الترتيب" ، وهذا العنوان يوحي بالجدارة الرئيسية الأخرى: يمكن استخدام تقنيات غير بارامترية مع درجات ليست دقيقة بأي من المعنى العددي ، ولكن في الواقع هي ببساطة الرتب.

افتراضات الاختبارات غير البارامترية:

ويستند الاختبار الإحصائي غير المعلمة على نموذج يحدد فقط الشروط العامة جدا ولا شيء يتعلق بالشكل المحدد للتوزيع الذي تم سحب العينة منه.

ترتبط بعض الافتراضات بمعظم الاختبارات الإحصائية غير المعلمة ، وهي:

1. أن الملاحظات مستقلة ؛

2. المتغير تحت الدراسة لديه استمرارية الكامنة ؛

3. إجراءات غير بارامترية لئلا الفرضيات المختلفة عن السكان مما تفعل الإجراءات parametric.

4. بخلاف الاختبارات البارامترية ، هناك اختبارات غير بارامترية يمكن تطبيقها بشكل مناسب على البيانات التي يتم قياسها في نطاق ترتيبي ، والبعض الآخر على البيانات في نطاق اسمي أو فئوي.

الاحتياطات في استخدام الاختبارات غير البارامترية:

في استخدام الاختبارات غير المعلمية ، يتم تحذير الطالب من الهفوات التالية:

1. عندما تكون القياسات من حيث الفترات الزمنية ونطاقات النسبة ، فإن تحويل القياسات على المقاييس الاسمية أو الترتيبية سيؤدي إلى فقدان الكثير من المعلومات. وبالتالي ، بقدر ما يمكن تطبيق الاختبارات البارامترية في مثل هذه الحالات. في استخدام طريقة غير parametric كاختصار ، نحن نرمي الدولارات من أجل إنقاذ البنسات.

2. في الحالات التي يتم فيها استيفاء الافتراضات التي يقوم عليها اختبار حدودي ، ويمكن تطبيق كل من الاختبارات البارامترية وغير المعتبرة ، يجب أن يكون الاختيار على الاختبار البارامتيري لأن معظم الاختبارات البارامترية لها قدرة أكبر في مثل هذه الحالات.

3 - لا شك أن الاختبارات غير المعلمية توفر وسيلة لتجنب افتراض التوزيع الطبيعي. لكن هذه الأساليب لا تفعل شيئًا لتجنب الافتراضات المتعلقة بالاستقلالية في المعاملة المثلية حيثما كان ذلك ساريًا.

4. يجب على عالم السلوك أن يحدد فرضية العدم ، والفرضية البديلة ، والاختبار الإحصائي ، وتوزيع العينات ، ومستوى الأهمية قبل جمع البيانات. إن الالتفاف حول اختبار إحصائي بعد جمع البيانات يميل إلى تعظيم تأثيرات أي اختلافات في الفرص التي تفضل اختبارًا على آخر.

ونتيجة لذلك ، فإن إمكانية رفض الفرضية الصفرية عندما تكون صحيحة (خطأ من النوع I) تزداد بشكل كبير. ومع ذلك ، فإن هذا التحذير قابل للتطبيق على حد سواء إلى الاختبارات البارامترية وكذلك غير البارامترية.

5. ليس لدينا مشكلة اختيار الاختبارات الإحصائية للمتغيرات الفئوية. الاختبارات غير المعلمية وحدها هي مناسبة للبيانات التعدادية.

6. تعتبر اختبارات F و t اختبارًا قويًا لأن انتهاك الافتراضات الأساسية لا يبطل الاستنتاجات.

من المعتاد تبرير استخدام اختبار نظري طبيعي في حالة لا يمكن ضمان الوضع الطبيعي فيها ، بحجة أنها قوية في ظل ظروف غير طبيعية.

بعض الاختبارات غير البارامترية:

سنناقش بعض الاختبارات الشائعة غير البارامترية.

1. اختبار التوقيع:

اختبار العلامة هو أبسط جميع الإحصاءات الخالية من التوزيع ويحمل درجة عالية جدًا من قابلية التطبيق العامة. وينطبق ذلك في الحالات التي لا يمكن فيها استخدام النسبة الحرجة ، t ، واختبار العينات المترابطة ، لأن افتراضات الحالة الطبيعية والشذوذ الجنسي غير مستوفاة.

يدرك الطلاب حقيقة أن بعض الشروط في إعداد التجربة تقدم عنصر العلاقة بين مجموعتي البيانات.

هذه الشروط بشكل عام هي حالة ما قبل الاختبار ، ما بعد الاختبار ؛ اختبار وإعادة اختبار الوضع ؛ اختبار مجموعة واحدة من المواضيع في اختبارين ؛ تشكيل "مجموعات متطابقة" عن طريق الإقران على بعض المتغيرات الدخيلة التي لا تخضع للتحقيق ، ولكنها قد تؤثر على الملاحظات.

في اختبار الإشارات نقوم باختبار أهمية علامة الاختلاف (زائد أو ناقص). يتم تطبيق هذا الاختبار عندما يكون N أقل من 25.

سوف يوضح لنا المثال التالي اختبار التوقيع:

مثال:

وغالباً ما تخضع الدرجات لشرطين مختلفين ، حيث يتم إعطاء A و B أدناه. تطبيق اختبار تسجيل واختبار الفرضية القائلة بأن A متفوقة على B.

باستثناء الصفر (صفر) لدينا تسعة اختلافات منها سبعة زائد.

يجب أن نوسع الآن الحدين ، (p + q) 9

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + س 9 .

العدد الإجمالي للنُسخ هو 2 9 أو 512. بإضافة المصطلحات الثلاثة الأولى (وهي p 9 + 9p 8 q + 36 p 7 q 2 ) ، لدينا ما مجموعه 46 مجموعة (أي 1 من 9 ، 9 من 8 و 36 من 7) التي تحتوي على 7 علامات زائد أو أكثر.

سيحدث حوالي 46 مرة في 512 تجربة 7 أو أكثر بالإضافة إلى علامات من 9 عندما يكون متوسط ​​عدد علامات + تحت فرضية الخطأ هو 4.5. وبالتالي ، فإن احتمال وجود 7 علامات + أو أكثر هو 46/512 أو .09 ، ومن الواضح أنه ليس مهمًا.

هذا اختبار ذو طرف واحد ، بما أن فرضيتنا تنص على أن A أفضل من B. إذا كانت الفرضية في البداية هي أن A و B تختلفان دون تحديد أيهما أفضل ، فسنكون لدينا اختبار ثنائي الذيل الذي P = 0.18.

تتوفر الجداول التي تعطي عدد العلامات الضرورية للدلالة على مستويات مختلفة ، عندما يتغير N في الحجم. عندما يكون عدد الأزواج كبيرًا يصل إلى 20 ، يمكن استخدام المنحنى الطبيعي كتقريب للتوسع ذي الحدين أو اختبار x 2 المطبق.

2. اختبار متوسط:

يتم استخدام اختبار الوسيط لمقارنة أداء مجموعتين مستقلتين على سبيل المثال مجموعة تجريبية ومجموعة تحكم. أولاً ، يتم طرح المجموعتين معًا ويتم حساب متوسط ​​مشترك.

إذا تم سحب المجموعتين عشوائيتين من نفس المجموعة ، يجب أن يكون 1/2 من الدرجات في كل مجموعة فوق و 1/2 تحت المتوسط ​​المشترك. لاختبار هذه الفرضية ، نحتاج إلى وضع جدول 2 × 2 وحساب x 2 .

تظهر الطريقة في المثال التالي:

مثال:

يريد أخصائي علم النفس الإكلينيكي دراسة تأثير عقار مهدئ على رعشة اليد. يتم إعطاء الدواء أربعة عشر مريضا نفسيا ، وتعطى 18 مريضا آخر جرعة غير ضارة. المجموعة الأولى هي المجموعة التجريبية ، الثانية المجموعة الضابطة.

هل يزيد الدواء من الثبات - كما هو موضح في النتائج المنخفضة في المجموعة التجريبية؟ كما أننا نشعر بالقلق فقط إذا كان الدواء يقلل من الهزة ، وهذا هو اختبار واحد الذيل.

تم تطبيق اختبار متوسط ​​على المجموعات التجريبية والضابطة. تشير علامات زائد إلى علامات أعلى من المتوسط ​​المشترك ، علامات ناقص علامات تحت المتوسط ​​المشترك.

N = 14 N = 18

الوسيط المشترك = 49.5

المتوسط ​​المشترك هو 49.5. في المجموعة التجريبية 4 درجات أعلى و 10 تحت المتوسط ​​المشترك بدلا من 7 أعلاه و 7 أدناه من المتوقع صدفة. في مجموعة التحكم ، هناك 12 نقطة أعلى و 6 أقل من المتوسط ​​المشترك بدلاً من 9 المتوقعة في كل فئة.

يتم إدخال هذه الترددات في الجدول التالي ويتم حساب X 2 بواسطة الصيغة (المذكورة أدناه) مع تصحيح الاستمرارية:

AX 2 c من 3.17 مع 1 درجة من عائد الحرية ap التي تقع في 0.08 حول منتصف الطريق بين 0.05 و 0.10. أردنا أن نعرف ما إذا كان متوسط ​​المجموعة التجريبية أقل بكثير من التحكم في المجموعة (وبالتالي يشير إلى مزيد من الثبات وأقل رعشة).

بالنسبة لهذه الفرضية ، يكون الاختبار أحادي الطرف ، p / 2 ، تقريبًا 0.04 و X 2 c عند مستوى 0.5. لو كانت فرضيتنا هي أن المجموعتين تختلفان دون تحديد الاتجاه ، لكان لدينا اختبار ثنائي الذيل وعلامة X 2 لم تكن مميزة.

الاستنتاج الذي توصلنا إليه ، والذي تم إجراؤه بشكل مبدئي ، هو أن الدواء ينتج بعض الانخفاض في الهزة. ولكن بسبب العينات الصغيرة وعدم وجود نتائج ذات دلالة إحصائية ، فإن علم النفس الإكلينيكي يكاد يكرر التجربة ربما عدة مرات.

X 2 ينطبق بشكل عام في اختبار الوسيط. ومع ذلك ، عندما يكون N 1 و N 2 صغيرين (على سبيل المثال أقل من حوالي 10) ويكون اختبار X 2 غير دقيق ويجب استخدام الطريقة الدقيقة لاحتمالات الحوسبة.

مزايا الاختبارات غير البارامترية:

1. إذا كان حجم العينة صغيرًا جدًا ، فقد لا يكون هناك بديل لاستخدام اختبار إحصائي غير حدودي ما لم تكن طبيعة توزيع السكان معروفة تمامًا.

2. الاختبارات غير البارامترية عادة ما تقدم عددًا أقل من الافتراضات حول البيانات وقد تكون أكثر ملاءمة لحالة معينة. بالإضافة إلى ذلك ، قد تكون الفرضية التي تم اختبارها عن طريق الاختبار غير المعياري أكثر ملاءمةً للتحقيقات البحثية.

3- تتوفر اختبارات إحصائية غير بارامترية لتحليل البيانات المتأصلة في الرتب وكذلك البيانات التي تحظى درجاتها العددية على ما يبدو بقوام الرتب. بمعنى أنه قد لا يتمكن الباحث من التحدث عن مواضيعه إلا أن الشخص يمتلك خاصية أكثر أو أقل من الخاصية ، دون أن يكون قادراً على تحديد مقدار ما هو أكثر أو أقل.

على سبيل المثال ، عند دراسة مثل هذا المتغير مثل القلق ، قد نكون قادرين على القول بأن الموضوع A أكثر قلقا من الموضوع B دون أن يعرف على وجه التحديد كم هو أكثر إثارة للقلق.

إذا كانت البيانات متأصلة في الرتب ، أو حتى إذا كان يمكن تصنيفها فقط على أنها زائد أو ناقص (أكثر أو أقل ، أفضل أو أسوأ) ، يمكن معالجتها بطرق غير بارامترية ، بينما لا يمكن معالجتها بالطرق البارامترية إلا إذا كانت محفوفة بالمخاطر و ، ربما ، يتم إجراء افتراضات غير واقعية حول التوزيعات الأساسية.

4. تتوفر طرق غير بارامترية لمعالجة البيانات التي تعتبر ببساطة تصنيفية أو قاطعة ، أي تقاس بمقياس اسمي. لا توجد تقنية حدية تنطبق على هذه البيانات.

5. هناك اختبارات إحصائية غير بارامترية مناسبة لمعالجة العينات المكونة من الملاحظات من مجموعات سكانية مختلفة. لا تستطيع الاختبارات البارامترية التعامل مع هذه البيانات في كثير من الأحيان دون أن تتطلب منا فرض افتراضات غير واقعية أو تتطلب حسابات معقدة.

6. الاختبارات الإحصائية غير المعلمة عادة ما تكون أسهل في التعلم والتطبيق أكثر من الاختبارات البارامترية. بالإضافة إلى ذلك ، غالباً ما يكون تفسيرها أكثر مباشرة من تفسير الاختبارات البارامترية.

عيوب الاختبارات غير المعاملية:

1. إذا كانت جميع افتراضات الطريقة الإحصائية البارامترية قد تم تلبيتها بالفعل في البيانات ، ويمكن اختبار فرضية البحث باستخدام اختبار حدودي ، فإن الاختبارات الإحصائية غير المعلمية تكون مسرفة.

2. يتم التعبير عن درجة التبذير من خلال كفاءة استخدام الطاقة للاختبار غير المعياري.

3- ومن الاعتراضات الأخرى على الاختبارات الإحصائية غير المعلمة أنها ليست منتظمة ، في حين أن الاختبارات الإحصائية المعلمية قد تم تنظيمها ، والاختبارات المختلفة هي ببساطة اختلافات في موضوع مركزي.

4. اعتراض آخر على الاختبارات الإحصائية غير المعلمة يرتبط بالراحة. تتوزع الجداول اللازمة لتنفيذ الاختبارات غير المعلمية على نطاق واسع وتظهر بأشكال مختلفة.