تحديد موثوقية الاختبار: 4 طرق

هناك أربعة إجراءات للاستخدام المشترك لحساب معامل الاعتمادية (تسمى أحيانًا الارتباط الذاتي) للاختبار. هذه هي: 1. اختبار إعادة الاختبار (التكرار) 2. بديلة أو أشكال موازية 3. تقنية سبليت نصف 4. التكافؤ العقلاني.

1. طريقة إعادة الاختبار:

لتقدير الموثوقية عن طريق طريقة إعادة الاختبار ، يتم إعطاء نفس الاختبار مرتين لنفس مجموعة التلاميذ مع فترة زمنية محددة بين إدارتي الاختبار.

ترتبط درجات الاختبار الناتجة مع معامل الارتباط هذا بقياس الثبات ، أي أنها تشير إلى مدى ثبات نتائج الاختبار على مدى فترة زمنية. لذلك يُعرف باسم مقياس الاستقرار.

يختلف تقدير الموثوقية في هذه الحالة وفقًا لطول الفترة الزمنية المسموح بها بين الإدارتين. إن طريقة ارتباط المنتج لحظة هي طريقة هامة لتقدير موثوقية مجموعتين من الدرجات.

وبالتالي ، فإن وجود علاقة ارتباط عالية بين مجموعتين من الدرجات يشير إلى أن الاختبار يمكن الاعتماد عليه. وسائل ، فإنه يدل على أن الدرجات التي تم الحصول عليها في الإدارة الأولى تتشابه مع النتائج التي تم الحصول عليها في الإدارة الثانية من نفس الاختبار.

في هذه الطريقة ، يلعب الفاصل الزمني دورًا مهمًا. إذا كان صغيراً جداً قل يوماً أو يومين ، سيتأثر اتساق النتائج بالتأثير المرحل ، أي سيتذكر التلاميذ بعض النتائج من الإدارة الأولى إلى الثانية.

إذا كان الفاصل الزمني يقال لمدة عام ، فإن النتائج لن تتأثر فقط بعدم التكافؤ في إجراءات الاختبار والشروط ، ولكن أيضا بالتغييرات الفعلية في التلاميذ خلال تلك الفترة الزمنية.

لا ينبغي أن تكون الفجوة الزمنية لإعادة الاختبار أكثر من ستة أشهر. الفجوة الزمنية لإعادة الاختبار أسبوعين (2 أسابيع) يعطي مؤشر دقيق للاعتمادية.

مزايا:

يتم استخدام طريقة الارتباط الذاتي أو إعادة الاختبار ، لتقدير معامل الإعتمادية بشكل عام. من الجدير استخدامه في مواقف مختلفة بسهولة. يمكن استخدام اختبار طول مناسب بعد فاصل زمني لعدة أيام بين الاختبار المتتالي.

سلبيات:

1. إذا تم تكرار الاختبار على الفور ، فإن العديد من الأشخاص سيتذكرون إجاباتهم الأولى ويقضون وقتهم على مواد جديدة ، وبالتالي يميلون إلى زيادة نتائجهم - في بعض الأحيان عن طريق صفقة جيدة.

2. إلى جانب التأثيرات الفورية للذاكرة ، فإن الممارسة والثقة الناجمة عن الإلمام بالمواد ستؤثر بشكل مؤكد على الدرجات عندما يتم إجراء الاختبار للمرة الثانية.

3. مؤشر الموثوقية الذي تم الحصول عليه أقل دقة.

4. إذا كانت الفترة الفاصلة بين الاختبارات طويلة (أكثر من ستة أشهر) فإن عامل النمو والنضج سيؤثر على النتائج ويميل إلى خفض مؤشر الموثوقية.

5. إذا تم تكرار الاختبار على الفور أو بعد قليل من الفجوة الزمنية ، فقد يكون هناك احتمال لتأثير تأثير النقل / التأثير / الذاكرة / الممارسة.

6. عند تكرار نفس الاختبار ، في نفس المجموعة مرة ثانية ، يجعل الطلاب غير مهتمين وبالتالي لا يحبون المشاركة بكل إخلاص.

7. في بعض الأحيان ، لا يتم الحفاظ على التوحيد الذي يؤثر أيضا على درجات الاختبار.

8. فرص مناقشة بعض الأسئلة بعد الإدارة الأولى ، والتي قد تزيد من الدرجات في الإدارة الثانية التي تؤثر على الموثوقية.

2. طريقة بديلة أو موازية الأشكال:

يتضمن تقدير الموثوقية عن طريق طريقة الشكل المكافئ استخدام شكلين مختلفين ولكنهما متكافئان للاختبار. ويعرف أيضًا موثوقية النموذج المتوازي بموثوقية النموذج البديل أو موثوقية النموذج المكافئ أو موثوقية النموذج المتماثل.

في هذه الطريقة يتم استخدام نموذجين متوازيين أو ما يعادل الاختبار. ونقصد بالأشكال المتوازية أن أشكال القوس مكافئة بقدر ما هي المحتوى والأهداف والشكل ومستوى الصعوبة والقيمة التمييزية للعناصر وطول الاختبار وما إلى ذلك.

الاختبارات الموازية لها متوسطات متساوية ، والفروق ، والعلاقات المشتركة بين العناصر. وهذا يعني أن شكلين متوازيين يجب أن يكونا متجانسين أو متشابهين من جميع النواحي ، ولكن ليس ازدواجية في عناصر الاختبار. دع النموذجين يكونان النموذج A والنموذج B.

يمكن النظر إلى معامل الاعتمادية على أنه معامل الارتباط بين الدرجات في شكلين متكافئين من الاختبار. من الممكن أن تكون الشكلين المكافئين متشابهين في المحتوى والدرجة والعمليات العقلية التي تم اختبارها ومستوى الصعوبة والجوانب الأخرى.

يتم إعطاء نموذج واحد من الاختبار على الطلاب وعند الإنهاء مباشرة يتم توفير نموذج آخر للاختبار إلى نفس المجموعة. ترتبط النتائج ، التي يتم الحصول عليها بالتالي ، والتي تعطي تقدير الموثوقية. وبالتالي ، فإن الموثوقية الموجودة تسمى معامل التكافؤ.

وقد حدد Gulliksen 1950: الاختبارات الموازية مثل اختبارات لها وسائل متساوية ، وتكافؤ متساو ، وعلاقات مشتركة متساوية في العلاقات.

جيلفورد: تشير طريقة النموذج البديلة إلى تكافؤ المحتوى وثبات الأداء.

مزايا:

يحتوي هذا الإجراء على مزايا معينة على طريقة الاختبار وإعادة الاختبار:

1. هنا لا يتم تكرار الاختبار نفسه.

2. يتم تقليل الذاكرة والممارسة وآثار الترحيل وعوامل الاسترجاع ولا تؤثر على النتائج.

3. معامل الاعتمادية الذي تم الحصول عليه بواسطة هذه الطريقة هو قياس لكل من الاستقرار الزمني والاتساق في الاستجابة لعينات العناصر المختلفة أو نماذج الاختبار. وبالتالي ، تجمع هذه الطريقة بين نوعين من الموثوقية.

4. مفيد لموثوقية اختبارات التحصيل.

5. هذه الطريقة هي واحدة من الطرق المناسبة لتحديد موثوقية الاختبارات التعليمية والنفسية.

محددات:

1. من الصعب الحصول على شكلين متوازيين من الاختبار. في حالات معينة (أي في Rorschach) يكاد يكون من المستحيل.

2. عندما لا تكون الاختبارات متساوية تماماً من حيث صعوبة المحتوى ، الطول ، قد تؤدي المقارنة بين مجموعتين من النتائج التي تم الحصول عليها من هذه الاختبارات إلى قرارات خاطئة.

3. لا يمكن السيطرة على عوامل الممارسة والترحيل بشكل كامل.

4. علاوة على ذلك ، فإن إعطاء شكلين في نفس الوقت يخلق ضجرًا. هذا هو السبب في أن الناس يفضلون هذه الأساليب التي تتطلب إدارة واحدة فقط للاختبار.

5. شروط الاختبار أثناء إدارة النموذج B قد لا تكون هي نفسها. إلى جانب ذلك ، قد لا تكون الخصيتان في حالة جسدية أو عقلية أو نفسية مماثلة في أوقات الإدارة.

6. درجات الاختبار من الشكل الثاني للاختبار مرتفعة بشكل عام.

وعلى الرغم من أن الأشكال الموازية الصعبة التي يتم إنشاؤها بعناية وبحذر ستوفر لنا بشكل معقول مقياسًا مرضيًا للاعتمادية. بالنسبة للاختبارات المعيارية الجيدة الصنع ، عادة ما تكون طريقة الشكل المتوازي هي الطريقة الأكثر إرضاءً لتحديد الموثوقية.

3. طريقة تقسيم نصف أو طريقة اختبار مقسمة جزئيا:

تعتبر طريقة نصف الفصل تحسنا مقارنة مع الطريقتين السابقتين ، وهي تتضمن كلا من خصائص الاستقرار والمعادلة. ناقش ما ورد أعلاه طريقتين لتقدير الموثوقية في بعض الأحيان يبدو صعبا.

قد لا يكون من الممكن استخدام نفس الاختبار مرتين والحصول على أشكال اختبار مكافئة. ومن ثم ، للتغلب على هذه الصعوبات ولتقليل أثر الذاكرة بالإضافة إلى تقييم الاختبار ، من المستحسن تقدير الاعتمادية من خلال إدارة واحدة للاختبار.

في هذه الطريقة يتم إعطاء الاختبار مرة واحدة على العينة وهي الطريقة الأنسب للاختبارات المتجانسة. توفر هذه الطريقة الاتساق الداخلي لدرجات الاختبار.

يتم ترتيب جميع عناصر الاختبار بشكل عام في ترتيب متزايد من الصعوبة ويتم إعطاؤها مرة واحدة على العينة. بعد إجراء الاختبار ، يتم تقسيمه إلى جزئين أو نصفين متشابهين أو متساويين أو متساويين.

يتم ترتيب النتائج أو يتم إجراؤها في مجموعتين تم الحصول عليها من الأرقام الفردية للعناصر وحتى أعداد العناصر بشكل منفصل. على سبيل المثال يتم إعطاء اختبار 100 عنصر.

يتم ترتيب الدرجات الفردية استنادًا إلى 50 عنصرًا من الأرقام الفردية مثل 1 و 3 و 5 و 99 والعشرات استنادًا إلى الأرقام الزوجية 2 و 4 و 6 ... 10 بشكل منفصل. في الجزء "A" يتم تعيين عناصر الأرقام الفردية ويتألف الجزء "ب" من عدد زوجي من العناصر.

بعد الحصول على درجتين على الأعداد الفردية أو حتى أعداد عناصر الاختبار ، يتم حساب الكفاءة المشتركة في الارتباط. هو حقا علاقة بين نصفين متساويين من الدرجات التي تم الحصول عليها في جلسة واحدة. لتقدير الموثوقية ، يتم استخدام صيغة Spearman-Brown Prophecy.

يتم إعطاء صيغة Spearman-Brown بواسطة:

حيث r 11 = موثوقية الاختبار بالكامل.

ص 11/22 = معامل الارتباط بين اختبارين نصفين.

مثال 1:

اختبار يحتوي على 100 عنصر. يتم ترتيب كل هذه العناصر في ترتيب الصعوبة حيث ينتقل المرء من الأول إلى المائة. يجيب الطلاب على الاختبار ويتم تسجيل الاختبار.

يتم الحصول على الدرجات من قبل الطلاب في عدد فردي من العناصر ويتم حساب مجموع عدد العناصر بشكل منفصل. معامل الارتباط الموجود بين هاتين المجموعتين من الدرجات هو 0.8.

موثوقية الاختبار كله (أو)

أثناء استخدام هذه الصيغة ، ينبغي أن يوضع في الاعتبار أن التباين بين الشريحتين الفردية والنصفية يجب أن يكون متساوياً ، أي

إذا لم يكن ذلك ممكنًا ، فيمكن استخدام صيغ Flanagan و Rulon. هذه الصيغ أبسط ولا تتضمن حساب معامل الارتباط بين نصفين.

مزايا:

1. نحن هنا لا نكرر الاختبار أو استخدام النموذج المتوازي منه وبالتالي لا يتم اختباره في الاختبار مرتين. على هذا النحو ، فإن تأثير التأثير أو الممارسة غير موجود.

2. في هذه الطريقة ، يتم التقليل من تقلبات قدرة الفرد ، بسبب الظروف البيئية أو الفيزيائية.

3. بسبب الإدارة الفردية للاختبار ، لا تتداخل الوظائف والمشاكل اليومية.

4. يتم التخلص من صعوبة إنشاء أشكال متوازية من الاختبار.

محددات:

1. يمكن تقسيم الاختبار إلى نصفين متساويين في عدد من الطرق وقد يختلف معامل الارتباط في كل حالة.

2. لا يمكن استخدام هذه الطريقة لتقدير موثوقية اختبارات السرعة.

3. كما تدار خوفا مرة واحدة ، قد تؤثر أخطاء فرصة على الدرجات على نصفين بنفس الطريقة ، وبالتالي تميل إلى جعل معامل الاعتمادية عالية جدا.

4. لا يمكن استخدام هذه الطريقة في اختبارات القدرة والاختبارات غير المتجانسة.

وبالرغم من كل هذه القيود ، تعتبر طريقة نصف الفصل هي أفضل الطرق المستخدمة في قياس موثوقية الاختبار ، حيث يتم الحصول على بيانات تحديد الاعتمادية في بعض الأحيان ، وبالتالي تقلل من الوقت والعمالة والصعوبات التي تنطوي عليها الحالة الثانية أو الإدارة المتكررة.

4. طريقة التكافؤ العقلاني:

تعرف هذه الطريقة أيضًا باسم "Kuder-Richardson Reliability" أو "Consistency Inter-Item". إنها طريقة تعتمد على الإدارة المفردة. ويستند إلى اتساق الردود على جميع البنود.

الطريقة الأكثر شيوعا للعثور على الاتساق بين العناصر هي من خلال الصيغة التي طورها Kuder و Richardson (1937). تمكن هذه الطريقة من حساب الترابط بين عناصر الاختبار وارتباط كل عنصر بكل عناصر الاختبار. ووصفه كرونباخ بأنه معامل الاتساق الداخلي.

في هذه الطريقة ، من المفترض أن جميع العناصر لها نفس قيمة الصعوبة أو القيمة المتساوية ، العلاقة بين العناصر متساوية ، جميع العناصر تقيس في الأساس نفس القدرة والاختبار متجانس في طبيعته.

مثل الطريقة نصف المقسمة توفر هذه الطريقة أيضًا مقياسًا للاتساق الداخلي.

الصيغة الأكثر شعبية هي Kuder-Richardson أي KR-21 والتي ترد أدناه:

س = - ص

ع = 1 - ف

مثال يساعدنا على حساب p و q.

المثال 2:

ظهر 60 طالبًا في اختبار ، ومنهم 40 طالبًا قدموا استجابة صحيحة إلى عنصر معين من الاختبار.

ع = 40/60 = 2/3

ويعني هذا أن جزء y من الطلاب قد أعطوا استجابة صحيحة لأحد عناصر الاختبار. حيث قدم 20 طالبًا استجابة غير صحيحة لهذا العنصر.

وهكذا ، q = 20/60 أو 1 - 40/60

بالنسبة لكل عنصر ، سنكتشف قيمة p و q ، ثم يتم جمع pq على جميع العناصر للحصول على ∑pq. ضرب p و q لكل عنصر ومجموع لكافة العناصر. هذا يعطي ∑pq.

مزايا:

1. يقدم هذا المعامل بعض المؤشرات على كيفية اتساق عناصر الاختبارات أو تجانسها داخليًا.

2. التكافؤ العقلاني يتفوق على تقنية نصف الانقسام في بعض الجوانب النظرية ، ولكن الفرق الفعلي في معاملات الموثوقية التي وجدها الطريقتين غالباً ما يكون ضئيلاً.

3. طريقة الفصل النصف يقيس ببساطة التكافؤ ولكن طريقة التكافؤ العقلاني تقيس كل من التكافؤ والتجانس.

4. طريقة اقتصادية كما تدار الاختبار مرة واحدة.

5. لا يتطلب الأمر إعطاء شكلين متكافئين من الاختبارات ولا يتطلب تقسيم الاختبارات إلى نصفين متساويين.

محددات:

1. المعامل الذي يتم الحصول عليه بواسطة هذه الطريقة يكون بشكل عام أقل نوعًا ما من المعاملات التي تم الحصول عليها بواسطة طرق أخرى.

2. إذا كانت عناصر الاختبارات غير متجانسة إلى حد كبير ، فإن هذه الطريقة ستعطي معامل موثوقية أقل.

3. Kuder-Richardson وطريقة الانقسام نصف ليست مناسبة لاختبار السرعة.

4. صيغة KR المختلفة تعطي مؤشر موثوقية مختلفة.