4 المعايير الأساسية لاختبار جيد

تلقي هذه المقالة الضوء على المعايير الأساسية الأربعة لاختبار جيد. المعايير هي: - 1. الموثوقية 2. الصلاحية 3. الهدف 4. سهولة الاستخدام.

المعيار # 1. الموثوقية:

القاموس المعنى الموثوق هو الاتساق أو الاعتماد أو الثقة. يعد إجراء القياس موثوقًا لدرجة أن القياس المتكرر يعطي نتائج متناسقة للفرد.

يعتبر الاختبار موثوقًا إذا كان ينتج عنه نتائج ثابتة في الإدارة المتتالية. إذاً عن طريق موثوقية الاختبار ، فإننا نعني مدى موثوقية الاختبار أو إخلاصه. للتعبير بشكل عام ، إذا كان قياس أداة القياس ثابتًا ، فيمكن الاعتماد عليه.

عندما يكون الاختبار موثوقًا ، فإن الدرجات التي يتم إجراؤها من قِبل أعضاء المجموعة عند إعادة اختبارها بنفس الاختبار أو بأشكال بديلة من نفس الاختبار ستختلف قليلاً أو لا تختلف عن قيمها الأصلية.

مثال 1:

إذا أدلى أحد الشهود بنفس التصريح بشأن قضية ما عندما سأل مراراً وتكراراً من قبل محام في المحكمة ، فإننا نضع الثقة في بيانه ونأخذ بيانه ليكون موثوقاً به.

المثال 2:

إذا ما بقيت الساعة 10 دقائق متأخرة كل يوم مقارنة بتوقيت Hindustan ، يمكننا القول أن الساعة أداة موثوق بها.

المثال 3:

لنفترض أننا نطلب من أميت الإبلاغ عن تاريخ ميلاده. ويذكر أنه سيكون في 13 يوليو 1985. بعد مرور فترة زمنية ، طرحنا نفس السؤال وأبلغنا عن نفس الشيء في 13 يوليو 1985.

قد نطرح السؤال مرارًا وتكرارًا ، وإذا كان الجواب هو نفسه ، نشعر أن تصريح أميت موثوق.

تعريفات:

1. ثورندايك:

هو اتساق الاختبار الذي يقيس كل ما من المفترض أن يقاس. عادةً ما يُعتقد أن الاعتمادية للاختبار هي الدرجة التي يكون فيها الاختبار خاليًا من أخطاء التعويض.

2. Gronlund و Linn:

تشير الموثوقية إلى اتساق القياس - أي مدى اتساق درجات الاختبار أو نتائج التقييم الأخرى من قياس إلى آخر.

3. أناستاسي:

تشير الموثوقية إلى تناسق الدرجات التي حصل عليها نفس الأفراد عند إعادة فحصها بنفس الاختبار في مناسبات مختلفة أو مع مجموعات مختلفة من العناصر المكافئة أو تحت ظروف فحص متغيرة.

4. ديفيس:

يتم تعريف درجة التفاوتات النسبية لقياس مجموعة من نقاط الاختبار على أنها موثوقية.

5. جيلفورد:

الموثوقية هي نسبة التباين الحقيقي في درجات الاختبار التي تم الحصول عليها.

من المناقشة أعلاه ، أصبح من الواضح أن موثوقية الاختبار تعني المدى الذي ينتج عنه الاختبار نفس النتيجة على الإدارة المتعاقبة على نفس المجموعة السكانية. تبقى الشروط الأخرى ثابتة ، إذا تم إعطاء نفس الاختبار على نفس المجموعة في مناسبتين مختلفتين ، كما أن النتائج التي حصل عليها الأفراد في كلتا الحالتين تظل متماثلة إلى حد ما ، ويقال إن الاختبار يمكن الاعتماد عليه.

تحاول موثوقية الاختبار الإجابة على الأسئلة التالية:

(ط) ما مدى التشابه الذي يمكن أن تكون عليه نتائج التلميذ ، إذا تم إعطاء نفس الاختبار في مناسبتين مختلفتين؟

(2) كيف تختلف الدرجات إذا تم اختيار عينة مختلفة من العناصر المكافئة؟

(3) كيف تختلف الدرجات إذا تم تسجيل الاختبار من قبل مسجل آخر؟

(4) كيف تختلف الدرجات إذا تم تسجيل الاختبار من قبل نفس الهداف في أوقات مختلفة؟

خصائص الموثوقية:

تتمتع الموثوقية بالخصائص التالية:

(1) يشير تقدير الموثوقية دائما إلى أي نوع معين من الاتساق.

(2) يشير إلى دقة أو دقة أداة القياس.

(3) تشير الموثوقية إلى نتائج الاختبار وليس الاختبار نفسه.

(4) إنه معامل الاتساق الداخلي.

(5) تكون موثوقية مجموعة القياس منطقية كنسبة من التباين الذي هو تباين حقيقي.

(6) هو قياس الخطأ المتغير أو خطأ الصدفة أو خطأ القياس.

(7) الموثوقية هي مسألة درجة. لا وجود لها في جميع أو غير أساس.

(ثامنا) الموثوقية لا تضمن صحة أو صدق أو هدف الاختبار.

(9) الموثوقية شرط ضروري ولكنه غير كافٍ للتحقق من صحتها. يمكن للاعتمادية المنخفضة أن تقيد درجة الصلاحية التي يتم الحصول عليها ، ولكن الموثوقية العالية لا توفر أي ضمان للحصول على درجة مرضية من الصحة.

(10) الموثوقية ذات طبيعة إحصائية بالدرجة الأولى بمعنى أن الدرجات التي يتم الحصول عليها في مناسبتين متتاليتين ترتبط ببعضها البعض. يعرف معامل الارتباط هذا بالارتباط الذاتي وتسمى قيمته "معامل الموثوقية".

الموثوقية وأخطاء القياس:

يمكن تصنيف تعريفات الموثوقية تحت ثلاثة عناوين:

(ط) التجريبية ،

(ثانيا) المنطقي ، و

(3) نظري.

(ط) التطبيق التجريبي:

تشير التعريفات التجريبية للموثوقية إلى مدى الترابط بين مجموعتين من الدرجات في نفس الاختبار الذي يتم إجراؤه على الشخص نفسه في مناسبات مختلفة.

(2) نظري:

يشير المعنى النظري إلى اتساق أو دقة درجات الاختبار. وهذا يعني الاعتماد على درجة الاختبار.

(3) منطقية:

يشير المعنى المنطقي للموثوقية إلى أخطاء القياس.

يمكن أن يساعدنا التوضيح التالي في فهم مفهوم الموثوقية وأخطاء القياس:

على سبيل المثال يؤمن السيد روهيت 52 في اختبار عقلي. ماذا تشير 52؟ هل يتحدث عن قدرته الحقيقية؟ هل هو رصيده الحقيقي؟ ربما كان روهيت قد حصل على 52 من مجرد فرصة. قد يحدث ذلك أن روهيت ، عن طريق الصدفة ، كان يعرف 52 قطعة من الاختبار ، وكانت العناصر مختلفة بعض الشيء ، لم يكن ليضمن هذه النتيجة.

وترتبط كل هذه الأسئلة بحقيقة أن القياس ينطوي على بعض أنواع الأخطاء ، وأخطاء شخصية وثابتة ومتغيرة وتفسيرية. يسمى هذا الخطأ باسم أخطاء القياس. لذا عند تحديد موثوقية الاختبار ، يجب أن نأخذ في الاعتبار مقدار الأخطاء الموجودة في القياس.

عندما يكون معامل الموثوقية مثاليًا (أي 1.00) يصبح القياس دقيقًا وخالٍ من جميع أنواع الأخطاء. لكن القياس في كل مجال ينطوي على نوع من الأخطاء. لذلك ، لا تكون الموثوقية مثالية أبداً.

يمكن اعتبار النتيجة في الاختبار كمؤشر للنتائج الحقيقية بالإضافة إلى أخطاء القياس.

مجموع النقاط أو الدرجة الفعلية التي حصلت عليها = النتيجة الحقيقية + درجة الخطأ

إذا كانت النتيجة تحتوي على مكون كبير من "الدرجة الحقيقية" ومكون صغير من الخطأ ، فهي عالية ؛ وعلى العكس ، إذا كانت درجة الاختبار تحتوي على مكون صغير من "الدرجة الحقيقية" ومكون "خطأ" كبير ، فإن موثوقيتها منخفضة.

يمكن التعبير عن علاقات الدرجة الفعلية التي تم الحصول عليها ، والنتيجة الحقيقية والخطأ حسابيا على النحو التالي:

X = X + e

فيه X = درجة تم الحصول عليها للفرد في الاختبار.

X = النتيجة الحقيقية للفرد نفسه

e = أخطاء المتغير (الصدفة).

أخطاء القياس:

الدرجة الحقيقية هي متوسط ​​الدرجات التي تم الحصول عليها على عدد لا حصر له من الأشكال المتوازية للاختبار. كل درجة يتم الحصول عليها ستكون أكثر أو أقل من الدرجة الحقيقية. تسمى الانحرافات الدرجات التي تم الحصول عليها من الدرجات الحقيقية "أخطاء القياس".

في بعض الأحيان قد تكون أخطاء القياس أقل وأحيانًا أكثر. الأشياء الأخرى تكون متساوية ، أصغر أخطاء القياس ، كلما زادت موثوقية القياس.

الخطأ القياسي للقياس:

وسيتم توزيع أخطاء القياس (أي اختلاف الدرجات التي تم الحصول عليها من النتيجة الحقيقية) بشكل طبيعي ويُطلق على الانحراف المعياري لهذه الاختلافات (أو أخطاء القياس) "أخطاء القياس القياسية".

يمكننا معرفة الخطأ القياسي للقياس (SE للقياس) عند إعطاء معامل الاعتمادية والانحراف المعياري للتوزيع.

تكون معادلة حساب الخطأ القياسي للقياس كما يلي:

فيه σ sc = SE من درجة تم الحصول عليها

σ 1 = الانحراف المعياري لدرجات الاختبار

ص 11 = معامل الاعتمادية للاختبار نفسه.

المثال 4:

في مجموعة من 300 طالب جامعي ، فإن معامل الموثوقية لاختبار القدرة في الرياضيات هو .75 ، والاختبار M هو 80 و SD لتوزيع النقاط هو 16. يحقق John درجة 86. ما هو SE من هذه النتيجة ؟

حل:

من الصيغة المذكورة أعلاه نجد ذلك

وتبلغ الاحتمالات تقريبا 1: 2 أن النتيجة التي حصل عليها أي فرد في مجموعة 300 لا تفوت قيمته الحقيقية بأكثر من ± 8 نقاط (أي ± 1 SE sc ). فاصل الثقة 95 في النتيجة الحقيقية لجون هو 86 ± 1.96 × 8 أو 70 إلى 102.

بالتعميم للمجموعة الكاملة المكونة من 300 طالب ، قد نتوقع أن يكون ثلث نتائجها عبارة عن خطأ بمقدار 8 نقاط أو أكثر ، و 2/3 يكون الخطأ أقل من هذا المبلغ.

المعيار # 2. الصلاحية:

المعجم المعتمد للمصادقة هو "قائم جيدًا" ، "فعال" ، "صوت". يشير إلى "الصدق". وبالتالي ، فإن أي شيء يكون صادقًا وقائمًا ويخدم الغرض الصحيح هو صالح.

كل اختبار له أهداف معينة خاصة به. يتم إنشاؤه لغرض محدد وهو صالح لهذا الغرض. إذا كان الاختبار يقيس ما ينوي قياسه ، فيقال أنه صالح. توفر صلاحية التحقق المباشر على مدى أداء الاختبار وظائفها. صحة هو الشرط الأول من اختبار تصبح عالمية.

قد تكون الموثوقية ضرورية ولكنها ليست شرطًا كافيًا للصلاحية. لا يمكن أن يكون الاختبار صالحًا ما لم يكن موثوقًا به. قد تكون موثوقة ولكن لا يمكن قولها صالحة. تتعلق أهمية الاختبار بتدابير الاختبار وعملية التدابير.

باختصار ، يمكننا القول أن الاختبار يهدف إلى خدمة وظيفة التنبؤ ، وبالتالي فإن قيمته أو صلاحيته تعتمد على درجة نجاحها في تقدير الأداء في بعض أنواع مواقف الحياة الحقيقية.

المثال 5:

لنفترض أن الشاهد يعطي تصريحًا واحدًا أمام القاضي في المحكمة. إذا كان في الامتحانات المتقاطعة المتقاطعة أو الاستجواب المتقاطع ، فإنه يكرر نفس العبارة مرارا وتكرارا ثم يتم استدعاؤه كشاهد موثوق.

لا شك أن تصريحه قد يكون صحيحًا أو خاطئًا. عندما يكون بيانه صحيحًا ، يقال إنه شاهد صالح. ولكن إذا كان بيانه خاطئًا بشكل دائم ، على الرغم من أنه موثوق به ، ولكنه غير صالح.

مثال 6:

إذا بقيت الساعة 10 دقائق إلى الأمام من "الوقت القياسي" ، فستكون قطعة زمنية موثوقًا بها. لأنه يعطي نتيجة ثابتة كل يوم بسرعة 10 دقائق. هدفنا هو معرفة الوقت بشكل صحيح ولم نتمكن من معرفته. لذلك لا يتم تقديم الغرض. وبالتالي لن يكون صالحًا وفقًا "للوقت القياسي".

وبالتالي ، فقد وجد أن الاختبار قد يكون موثوقًا به ، ولكنه قد لا يكون صالحًا. ومع ذلك ، دائمًا ما تكون المقاييس أو الاختبارات الصالحة موثوقة. قد لا يكون الاختبار الذي يكون صالحًا لغرض معين صالحًا لغرض آخر.

قد يكون الاختبار الذي تم إعداده لقياس المهارات الحسابية للطلاب في الرياضيات صالحًا لهذا الغرض فقط ، ولكن ليس لقياس التفكير الرياضي. لذا ، تشير الصلاحية إلى الغرض الأساسي من الاختبار.

تعريفات:

آن أناستاسي:

يكتب "صلاحية الاختبار تتعلق بما يقيسه الاختبار ومدى نجاحه".

روميل:

"صلاحية أداة التقييم هي درجة قياسها لقياس المقصود منها."

FS Freeman:

"يُظهر مؤشر الصلاحية الدرجات التي يقيس بها الاختبار ما يقصد قياسه عند مقارنته بالمعيار المقبول".

LJ كرونباخ:

"الصلاحية هي المدى الذي يقيس فيه الاختبار ما يقصد قياسه".

EF Lindquist:

صحة هي الدقة التي يقيس بها ما هو المقصود لقياس أو درجة أنه يقترب العصمة في قياس ما يقصد لقياسها.

من المناقشة السابقة ، نشير إلى أن الصلاحية تشير إلى "الغرض الأساسي للاختبار" ، وإذا تم تحقيق الغرض ، فيجب اعتبار الاختبار صالحًا. لذا فإن الاختبار ليكون صالحًا يجب أن يقوم بالمهمة التي أراد القيام بها.

وبالتالي ، فإن مفهوم صلاحية الاختبار هو في المقام الأول مصدر قلق لـ "الأمانة الأساسية" للاختبار. الصدق بمعنى القيام بما يعد به المرء. على وجه الدقة ، تشير الصلاحية إلى مدى كفاءة الأداة لقياس ما تعتزم قياسه.

طبيعة الصلاحية:

1. تشير الصلاحية إلى مصداقية أو هدف نتائج الاختبارات ولكن ليس إلى الأداة نفسها.

2. الصلاحية هي مسألة درجة. لا توجد على أساس كل شيء أو لا شيء. لا يمكن أن يقال صك المصممة لقياس قدرة معينة لتكون إما سليمة تماما أو غير صالحة على الإطلاق. هو عموما أكثر أو أقل صالحة.

3. إنه مقياس "خطأ ثابت" بينما الموثوقية هي مقياس "الخطأ المتغير".

4. صحة يضمن موثوقية الاختبار. إذا كان الاختبار صالحًا ، فيجب أن يكون موثوقًا به.

5. الصلاحية ليست من أنواع مختلفة. إنه مفهوم وحدوي. ويستند إلى أنواع مختلفة من الأدلة.

6. لا يوجد شيء مثل الصلاحية العامة. الاختبار صالح لبعض الأغراض أو الوضع ، ولكنه غير صالح لأغراض أخرى. بمعنى آخر ، تكون الأداة صالحة لغرض معين أو في موقف معين ؛ انها ليست صالحة عموما.

على سبيل المثال ، قد تكون نتائج اختبار المفردات صالحة بشكل كبير لاختبار المفردات ولكنها قد لا تكون صالحة بدرجة كبيرة لاختبار قدرة الطالب على تكوينها.

المعيار # 3.الموضوعية:

الموضوعية هي أهم خاصية لاختبار جيد. وهو شرط أساسي لكل من الصلاحية والموثوقية. الموضوعية للاختبار تعني الدرجة التي يمنحها الأشخاص المختلفون ، نفس النتيجة.

السيرة الذاتية الجيدة (1973):

يعرّف CV Good (1973) الموضوعية في الاختبار بأنه "مدى خلو الجهاز من الخطأ الشخصي (التحيز الشخصي) الذي هو الموضوعية من جانب الهداف."

Gronlund and Linn (1995):

"تشير موضوعية الاختبار إلى الدرجة التي يحصل بها الهدافون ذوو الكفاءة على قدم المساواة على النتائج نفسها".

وبالتالي ، يمكن القول أن الاختبار يعتبر موضوعيًا عندما يؤدي إلى القضاء على رأي الهداف الشخصي وحكم التحيز.

تشير موضوعية الاختبار إلى جانبين هما:

(1) موضوعية البنود ، و

(2) موضوع التسجيل.

(1) موضوعية البنود:

موضوعية العناصر تعني أن العنصر يجب أن يستدعي إجابة واحدة محددة. لا يمكن أن تحتوي العناصر الموضوعية على جوابين أو أكثر. عندما يتم تحديد السؤال بشكل مختلف ، سيحدث فرق في التهديف.

فمثلا:

"شرح مفهوم الشخصية."

وهنا تختلف الدرجات التي قدمها الهدافون إلى حد كبير لأن السؤال لا يشير بوضوح إلى طبيعة الإجابة الصحيحة المتوقعة.

هنا قد يكتب الطفل أي شيء متعلق بالسؤال. إذا تم تسجيل الإجابة من قبل فاحصين مختلفين ، فإن العلامات ستختلف بالتأكيد.

الأسئلة الغامضة ، وعدم وجود التوجيه الصحيح ، والأسئلة المزدوجة برميل ، أسئلة مع السلبيات مزدوجة ، أسئلة نوع مقال واسع وما إلى ذلك ليس لديهم الموضوعية. لذلك ، يجب ممارسة الكثير من العناية أثناء صياغة الأسئلة.

(2) موضوع التسجيل:

تكون الأداة موضوعية إذا أعطت نفس النتيجة حتى عندما يسجل الهدافون المختلفون النتيجة. وبالتالي ، فإن الموضوعية في التسجيل يمكن اعتبارها اتساقًا في تسجيل النتائج بواسطة مختلف الهدافين.

في كثير من الأحيان ، في المواقف الفعلية ، نجد أن نزوة أو هداف الهداف تؤثر على الوسم. إن الأسئلة ، التي يتم طرحها حول مواضيع معينة قد يكون للهدف لها ميل قد تجلب علامات أكثر من الأسئلة الأخرى.

هذا النوع من المزاج غير العقلاني نحو نظام الدرجات هو نوع من معاملته الذاتية للمقرر الدراسي الذي يؤثر بدوره على عملية التقييم. لذلك ، يجب ضمان الموضوعية في التقييم من أجل التقييم الدقيق.

وفي الوقت نفسه ، لا يجب إدانة الذاتية واستبعادها بالكامل ، لأن هذه هي الطريقة التي يتم بها إجراء معظم التقييمات في الواقع. والتقييم الذاتي القائم على الملاحظة الدقيقة والتفكير غير المتحيز وغير المتحيز والتحليل المنطقي للحالات والظواهر قد يعطي أيضا تقييما دقيقا. يمكن لهذا النوع من الذاتية المنضبطة أن يلعب دورًا مهمًا حتى في المدرسة.

المعيار # 4. سهولة الاستخدام:

قابلية الاستخدام - درجة يمكن استخدامها بنجاح لأداة التقييم من قبل مستخدمي الاختبار.

لقد قرأنا الآن المعايير الثلاثة الرئيسية لاختبار جيد: الصلاحية والموثوقية والموضوعية. ومن الخصائص المهمة الأخرى للأداة إمكانية استخدامه أو قابليته للتطبيق. عند اختيار أدوات التقييم ، يجب على المرء أن يبحث عن اعتبارات عملية معينة مثل الشمولية وسهولة الإدارة والتسجيل ، وسهولة التفسير ، وتوافر أشكال قابلة للمقارنة ، وتكلفة الاختبار.

كل هذه الاعتبارات تحث المعلم على استخدام أدوات التقييم ويشار إلى هذه الاعتبارات العملية على أنها "قابلية الاستخدام" لأداة التقييم. وبعبارة أخرى ، تعني قابلية الاستخدام الدرجة التي يمكن بها استخدام أداة التقييم بنجاح من قبل المدرسين ومديري المدارس.

(1) الشمولية:

يجب أن تكون عناصر الاختبار خالية من الغموض. يجب أن يكون اتجاه اختبار العناصر والاتجاهات الأخرى للاختبار واضحًا ومفهومًا. يجب توضيح توجيهات الإدارة وتوجيهات التسجيل بوضوح حتى يتسنى للمرء فهمها ومتابعتها بسهولة. علاوة على ذلك ، يجب أن يكون إجراء اختبار الإدارة وتسجيل النقاط والتسجيل في حدود فهم المستخدم للاختبار.

(2) سهولة الإدارة:

يشير إلى السهولة التي يمكن بها إجراء اختبار. كل اختبار له شروطه الخاصة للإدارة. أثناء اختيار الاختبار ، يجب اختيار واحد ، من مجموعة من الاختبارات ، والتي يمكن إدارتها دون الكثير من التحضير والصعوبات.

ا. تشمل سهولة الإدارة تعليمات واضحة وموجزة للإدارة. لذلك ، من أجل إجراء اختبار بسهولة ، يجب أن تكون التوجيهات إلى المسؤول والإتجاه إلى الأذواق سهلة وواضحة وكاملة.

ب. الوقت هو أيضا عامل مهم جدا. للحصول على الحد الأقصى للإدارة في المدارس ، من المعتاد إجراء اختبار خلال فترة غرفة صفية عادية واحدة.

(iii) سهولة التسجيل:

يجب أن يكون الاختبار من أجل الاستخدام الأفضل سهلًا في التسجيل. يجب أن يكون مفتاح التسجيل جاهزًا ويمكن تقييمه بسهولة. في بعض الأحيان ، يتم تخصيص الأماكن على الجانب الأيسر من الأسئلة لتقديم الإجابات.

في بعض الحالات يتم إعطاء الردود على أوراق منفصلة. يمكن تسجيل الاختبار المثالي من قبل أي شخص أو حتى من خلال جهاز تم تزويده بمفتاح تسجيل. يجب تخصيص علامات متساوية لكل عنصر في الاختبار لجعل عملية التسجيل أكثر سهولة.

وفقا لجدوى ، قد يتم توفير أجهزة التسجيل اليدوي أو أجهزة تسجيل النتائج.

(4) سهولة التفسير:

إذا كان من السهل فهم وتفسير درجات الاختبار التي تم الحصول عليها ، فإن الاختبار يُقال إنه جيد. ولهذا الغرض ، يجب أن يوفر دليل الاختبار معايير كاملة لتفسير النتائج ، مثل معايير العمر ، ومعايير التقدير ، والقواعد المئوية ، ومعايير الدرجة القياسية. القواعد تسهل تفسير درجات الاختبار.

(5) الحصول على الاختبار:

يجب أن يكون الاختبار getup لطيفة. هذا يجب أن يكون مظهر جيد وجذاب. لا يجب أن تكون الأحرف صغيرة جدًا أو كبيرة جدًا. يجب دراسة نوعية الورق المستخدم ، الطباعة ، الطباعة ، حجم الخطابات ، المباعدة ، الصور والرسوم البيانية ، مساحة التجليد ، مساحة استجابة التلاميذ.

(6) تكلفة الاختبار:

لا ينبغي أن يكون الاختبار مكلفًا جدًا. يجب تخفيض التكلفة إلى الحد الممكن ، بحيث يمكن استخدامها على نطاق واسع.