الاختبارات النفسية في الصناعات: الخصائص والأنواع والقواعد

مجرد تجميع مجموعة من الأسئلة لا ينتج عنه اختبار نفسي. أفضل اختبار يمكن تعريفه على أنه قياس عينة موحدة للسلوك البشري. على هذا النحو ، يجب أن تستوفي متطلبات أساسية معينة. أولاً ، يجب أن تكون عينة السلوك كبيرة بما يكفي وتمثيلية بدرجة كافية من فئة السلوك التي نقيسها للسماح لنا بالتعميم والتنبؤ بنتائج الاختبار.

ثانياً ، من خلال طلب الاختبار أن يكون موحدًا ، فإننا نعني أن سلسلة الأسئلة أو المهام يجب أن تدار بشكل موحد عندما يتم إعطاء الموضوعات للاختبار. وأخيرًا ، يجب أن تشتمل جميع الاختبارات النفسية على الخصائص الأساسية للصلاحية والموثوقية والمعايير.

إن رمي سلسلة من الأسئلة بصرف النظر عما إذا كانت تتعلق بالمواضيع النفسية لا يرفعها إلى مستوى الاختبار النفسي. على سبيل المثال ، تعرض العديد من أعمدة الصحف والكتب الشائعة في لعبة الصنف 88 مجموعة من الأسئلة ؛ يسجل الشخص الإجابات ويقيم نفسه كـ "ممتاز" أو "جيد" أو "سيئ" أو "فظيع". هذه ليست اختبارات نفسية. هم مجرد دفعات من الأسئلة.

بطبيعة الحال ، غالباً ما يكون لدى الفرد فضول غامر لاكتشاف شيء ما سراً ، وهكذا تحظى خطة الاختبار الذاتي بشعبية كبيرة. موضوع هذه الاختبارات عادة ما يكون له جاذبية واسعة. على سبيل المثال ، قد يطلب منك أحد الأعمدة تحديد ما إذا كنت زوجًا متميزًا عن طريق الإجابة على بعض الأسئلة. قد يكون لدى الشخص حكمة غامضة ، لكن الطريقة الوحيدة التي يمكنه من خلالها تطوير اختبار لقياس مثل هذه الصفات هو أن يكون لديه سلسلة من الأسئلة التي تم الإجابة عليها بطريقة ما من قبل الأزواج الناجحين (أيا كانوا) وبطريقة مختلفة بشكل كبير عن طريق عدم نجاحهم. أزواجهن.

قواعد الاختبار:

موضوع معايير الاختبار هو واحد من أهمية كبيرة ويحتاج إلى توضيح إضافي. يجب تطوير القواعد كمصدر مرجعي في جميع الاختبارات المستخدمة في الاختيار. القاعدة هي معيار مرجعي إنها تمكن الشخص من فهم معنى درجة الاختبار. بالاعتماد على الاختبار ، قد يتم الإبلاغ عن درجة الخام بطرق مختلفة: الوقت الإجمالي لإكمال الاختبار ، عدد العناصر الصحيحة ، أو عدد العناصر المحاولة هي عدد قليل من النتائج الأولية التي تم الحصول عليها في الاختبارات.

في الواقع ، فإن النتيجة الأولية في حد ذاتها على اختبار نفسي عادة ما تكون شخصية لا معنى لها. على سبيل المثال ، في اختبار واحد قد تكون النتيجة 240 ثانية رديئة ، بينما في اختبار آخر قد تكون النتيجة 75 ثانية استثنائية. تكون المشكلة معقدة أكثر عندما يجب مقارنة 180 درجة مع نتيجة 95 عنصرًا صحيحًا. من دون استخدام القاعدة ، ستكون مثل هذه المقارنات مستحيلة ؛ في أفضل الأحوال ، فإنها تشبه محاولة لمقارنة التفاح والخوخ.

نظامان من المعايير الأكثر استخداما على نطاق واسع هما النقاط المئوية والعلامات القياسية. تعطي كلتا المقياسين بشكل غير مباشر معلومات عن أداء الاختبار للأفراد مقارنةً بالسكان المعروفين. كما أنها توضح الموقف النسبي لشخص واحد في المجموعة للمجموعة ككل.

في اختبار لقياس القدرة الخمجية ، قد تكون درجة الخام للفرد 105 كلمات في الدقيقة مع خطأ واحد في النسخ. ما لم يكن لدينا معلومات حول نطاق السرعة على أساس العديد من الأشخاص ، لم نتمكن من معرفة ما إذا كان معدل السرعة هذا جيدًا أم سيئًا. ومع ذلك ، إذا كان هذا الاختبار قد تم منحه لـ 155 من المقتطفين العاملين بأجر ، ووضعت علامة هذا الفرد في المئين التسعين ، فسنكون في وضع يمكننا من تقدير قدرتها على الاختزال كـ "استثنائية" لأنها تتجاوز 9 من أصل 10 فتيات في سرعة الاختزال.

إذا كان هذا النوع الفردي نفسه بسرعة 45 كلمة في الدقيقة ، وإذا كانت هذه النتيجة "تعادل النسبة المئوية 20 ، يمكننا أن نستنتج أن 8 من بين 10 من الخياطين العاملين هم طابعين أسرع. في الواقع ، يمكن مقارنة سرعة الاختزال وسرعة الكتابة. على أساس المعايير المتوفرة ، يمكننا إجراء مقارنة مباشرة لأداء هذه الفتاة في هذين الاختبارين ، واستنتاجنا أنها جيدة للغاية في اتخاذ الإملاء ولكن ضعيف في الكتابة هو مبرر. ما إذا كانت مستأجرة يعتمد على احتياجات الوظيفة. من الأرجح أنها ستحتاج إلى تحسين سرعة الطباعة قبل أن تتمكن من توظيف الوظيفة.

بالنسبة لبعض الوظائف الكتابية ، تتسم السرعة بأهمية كبيرة ، ولكن الدقة في بعض الأحيان أكثر أهمية. على سبيل المثال ، قد يتم السعي إلى السرعة بدلاً من الدقة للتعامل مع التعاميم. من ناحية أخرى ، ستكون الدقة القصوى ضرورية لتقديم الأوراق الهامة. في بعض الأحيان تكون المعايير المنفصلة المتعلقة بالسرعة والدقة ضرورية ، وكذلك القواعد القائمة على مزيج من المقياسين.

عند وضع القواعد ، يجب أن تكون المعلومات المحددة متاحة ليس فقط حول حجم المجموعة التي تم قياسها ، ولكن أيضًا حول حقائق مثل مستوى العمر ، وما إذا كانت المجموعة تعمل بأجر ، سواء كان مجتمعًا ، وما إذا كان يتكون من العينات العادية غير المنتخبة.

على سبيل المثال ، يمكن اعتبار الشخص الذي يختبر في النسبة المئوية السبعين من السكان العاديين في اختبار الذكاء أنه يتمتع بذكاء أعلى من المتوسط. ومع ذلك ، فإن نجاحه المحتمل في درجة جامعية أو كلية الدراسات العليا سيكون موضع شك. وبعبارة أخرى ، فإن المعيار لا يكون ذا معنى إلا عندما تكون خصائص السكان التي يستند إليها معروفة.

أنواع الاختبارات:

يمكن تصنيف الاختبارات النفسية إلى مجموعات مختلفة حسب الغرض المحدد لنظام التصنيف. قبل المضي قدمًا ، قد يكون من المفيد النظر في بعض أنظمة التصنيف هذه.

نوع السلوك المقاس:

من المحتمل أن نظام التصنيف الأكثر استخدامًا يعتمد على نوع السلوك الذي يختبره القياس لقياسه. وهكذا نجد اختبارات تم تعيينها كاختبارات في الذكاء ، اختبارات الشخصية ، اختبارات الفائدة ، اختبارات الرؤية ، اختبارات الموسيقى ، اختبارات الفن ، الاختبارات الميكانيكية ، الاختبارات اللفظية ، إلخ ، حيث تكون كل مجموعة محددة السلوك بشكل محدد.

اختبارات التحصيل والقدرات:

كثيرا ما يميز المؤلفون بين اختبارات الكفاءة واختبارات الإنجاز. يُفترض أن القياس الأول لقياس إمكانات الشخص في منطقة معينة ، في حين أن الأخير هو مقياس لمهارة الشخص أو قدرته الحالية في لحظة الاختبار. وبما أن الاختبار نفسه يمكن اعتباره في كثير من الأحيان اختبارًا للإنجاز واختبارًا للكفاءة حسب الاستخدام ، فإن نظام التصنيف هذا غالبًا ما يكون غير واضح.

وهكذا ، مع العديد من الاختبارات يمكن للمرء أن:

(1) قياس كمية المهارة الحالية ، و

(2) استخدم النتيجة الحالية للتنبؤ بالأداء المستقبلي.

اختبارات الورق والقلم واختبارات الأداء:

العديد من الاختبارات من مجموعة متنوعة من الورق والقلم الرصاص:

يتلقى المحقق ببساطة ورقة اختبار أو كتيبًا مطبوعًا يحتوي على أسئلة الاختبار ، ويسجل إجاباته بطريقة مكتوبة على ورقة الإجابة التي يتم تقديمها عادة. بيد أن العديد من الاختبارات الأخرى لا تتطلب استجابة مكتوبة - بل إنها تنطوي على نوع من أنشطة التلاعب مثل التعامل مع الأوتاد أو الكتل ، أو تجميع الأشياء الميكانيكية. ويشار إلى هذه الاختبارات الأخيرة باسم اختبارات الأداء.

اختبارات السرعة والسلطة:

يتم إنشاء بعض الاختبارات بحيث يكون كل عنصر أمرًا سهلاً للغاية - وتتمثل المهمة في إكمال أكبر عدد ممكن من العناصر في وقت قصير. عندما يعتمد أداء الاختبار في المقام الأول على السرعة التي يعمل بها ، يشار إلى الاختبار على أنه اختبار السرعة. والطرف الآخر سيكون اختباراً حيث تكون الأشياء صعبة ويمنح الشخص الوقت اللازم لإكمال البنود. في مثل هذه الاختبارات ، تعتمد درجة الشخص حصريًا على قدرته على الإجابة عن الأسئلة بشكل صحيح ، بغض النظر عن المدة (في حدود العقل ، بالطبع). يسمى هذا النوع من الاختبارات اختبارًا للطاقة.

الاختبارات الفردية والجماعية:

هناك عدد من الاختبارات التي تم تصميمها ليتم إدارتها بشكل فردي. أي أنه لا يمكن إعطاؤهم في وقت واحد إلى شخصين أو أكثر من قبل فاحص واحد. مثال على ذلك هو مقياس ستانفورد-بينيه الاستخباراتي. في كثير من الأحيان يتم استخدام الاختبارات الفردية للتقييم السريري. الاختبارات الجماعية هي تلك التي يمكن أن يتخذها العديد من الأشخاص في نفس الوقت. بالنسبة للاختبارات الصناعية ، تُفضل اختبارات المجموعة عمومًا لأنها أكثر إقتصارًا على الإدارة.

الاختبارات اللغوية وغير اللغوية:

في بعض الأحيان من المهم التمييز بين تلك الاختبارات التي تتطلب معرفة بلغة معينة (مثل الإنجليزية) لفهم إما تعليمات الاختبار أو مواد الاختبار نفسها. وتسمى جميع هذه الاختبارات اختبارات اللغة لأن الأداء عليها يعتمد جزئياً على القدرة اللغوية للوصي ، بغض النظر عن نوع القدرة التي تم تصميم الاختبار لقياسها.

في بعض الحالات يكون من المرغوب فيه أو من الضروري تجنب التحيز اللغوي للاختبار. على سبيل المثال ، اختبار القدرة الميكانيكية للأشخاص الأميين باستخدام الاختبار الذي يتضمن تعليمات مكتوبة سيكون غير مناسب على الإطلاق. لحل هذه المشكلة ، تم إنشاء اختبارات في بعض المناطق وهي اختبارات خالية من اللغة. أنها لا تتطلب مهارة اللغة من جانب المحاضر. ويشار إلى هذه الاختبارات غير اللغوية.

اختبارات مقابل أجهزة اختيار أخرى:

في هذا المقال يكرس اهتمامنا حصرا لفحص الاختبارات النفسية. ومع ذلك ، فإن الاختبارات ليست بأي حال من الأحوال الأداة التنبؤية الوحيدة المستخدمة من قبل الطبيب النفسي في وضع الاختيار. مساعدات اختيار معيار أخرى هي خطابات التوصية ، الفراغات التطبيق ، والمقابلات. سوف تستخدم برامج الاختيار الشاملة هذه بالإضافة إلى الاختبارات كجزء من عملية الاختيار الإجمالية.

دراسة في الجدل:

ربما لا يوجد اختبار واحد يوضح بشكل أفضل المشاكل المثيرة للجدل التي ينطوي عليها الاختبار الصناعي من تحليل نشاط المتجهات. يجب أن يكون استعراض موجز للجدل الذي يحيط بجهاز التقييم هذا لتوضيح بعض هذه الصعوبات. قام لوك وهولين (1962) بمراجعة شاملة لاستخدام هذا الاختبار كأداة اختيار صناعية. استعرضوا ما مجموعه 18 دراسة ، 17 منها ذات صلة بقيمة AVA في الصناعة. ﻏﺎﻟﺒﻴﺔ هﺬﻩ اﻟﺪراﺳﺎت آﺎﻧﺖ ﻣﻦ ﻧﻮع اﻟﺼﻼﺣﻴﺔ اﻟﻤﺘﺰاﻣﻨﺔ اﻟﺘﻲ ﺗﻢ ﻓﻴﻬﺎ إﻋﻄﺎء ﻣﻜﺘﺐ AVA ﻟﻠﻤﻮﻇﻔﻴﻦ اﻟﺤﺎﻟﻴﻴﻦ.

أفاد لوك وهولين أن هناك أدلة على أنه يمكن التمييز بين:

1. المديرين وعمال الإنتاج

2. التنفيذيين ومجموعة العمال المختلطة

3. سبع مجموعات مهنية مختلفة تتراوح بين مشغلي الآلات إلى رؤساء الشركات

4. الموظفين الجيد والفقير في العديد من المهن المختلفة

ومع ذلك ، في جميع الدراسات الحالية - الموظف ، تم الحصول على صلاحيات من خلال تطوير مفتاح على أساس تلك العينة ثم تطبيق المفتاح مرة أخرى على العينة التي تم تطوير المفتاح عليها - وهو إجراء يعرف باسم "أضعاف" التحقق من الصحة. نادرا ما كانت أي محاولة لإجراء العملية اللازمة من التحقق من صحة على مجموعة مختلفة من الموظفين الحاليين. يعتقد كل من لوك وهولين أن مؤلفي دراسات AVA تجاوزوا الحدود المقبولة في مناقشة قيمة النتائج التي توصلوا إليها ، وغالبًا ما تركوا للقارئ انطباعًا بأن صلاحياتها تدل على القدرة التنبؤية للاختبار.

دراسة واحدة فقط ، في رأي لوك وهولين ، استخدمت إجراء صحة تنبؤية حقيقي حيث تم إعطاء مفتاح تسجيل مسبق تم تطويره قبل العمل ثم فحصه لاحقًا للتحقق من صحته. في هذه الحالة لم يتم الحصول على صلاحية.

يبدو أنه يجب تأجيل اتخاذ قرار بشأن القيمة التنبؤية للـ AVA على الأقل حتى يتوافر المزيد من الأدلة الجوهرية. ومع ذلك ، فإن القضية هنا ليست فقط القيمة الفعلية للاختبار ، ولكن أيضاً الاختلاف بين المطالبات المقدمة لقيمتها والنتائج التجريبية الفعلية. إن لوك وهولين ليسا وحدهما في الحصول على مهمة AVA على أساس تحريف نتائج البحث. احتج Dunnette و Kirchner (1962) بشدة على الإبلاغ "الملون" لبيانات AVA من قبل Meranda و Clarke (1959).

بينيت ، في مراجعته للـ AVA لكتاب يوروس الخامس للحساب الذهني الخامس (1959) هو أيضا غير متكافئ ، حيث يقول: "إن الطقوس الجامدة للإجراءات الإحصائية المتطورة المزعومة ليست بديلا عن الصحة المثبتة". قد يستمتع القارئ المهتم بذلك. Dunnette و Kirchner المقالة (1962) والرد المقابل من قبل Meranda وكلارك في نفس مجلة علم النفس التطبيقي.

نظرة عامة على اختبار الشخصية في الصناعة:

استعرض Ghiselli و Barthol (1953) 113 الدراسات التي تتناول صحة قوائم جرد الشخصية في اختيار الموظفين. يتم تلخيص نتائجها في الجدول 4.3. ويخلصون إلى أنه في ظل ظروف معينة ، ترتبط الدرجات الموجودة في قوائم جرد الشخصية بشكل أفضل بالبراعة في مجموعة متنوعة من الوظائف أكثر مما كان متوقعًا. يدرك المؤلفان القيمة المحتملة لاختبار الشخصية في الصناعة والحاجة إلى زيادة كبيرة وتحسين في البحث والتطوير.