5 دراسات نظرية على الاختبارات الصناعية

سيتم الإبلاغ عن عدد قليل من العديد من الدراسات التي أجريت حتى بشكل كامل لتوضيح الانضباط النظامي المطلوب في استخدام الاختبارات للأغراض الصناعية. لا تعتبر أي من هذه الدراسات بمثابة توضيح لوضع الاختبار المثالي. أجريت كل واحدة ضمن القيود المفروضة من قبل الوضع الصناعي المحدد ، ولكن كل محاولة ، إلى أقصى حد ممكن ، لتتوافق مع المعايير الصارمة للبحث.

1. دراسة بلوم:

أجرت بلوم (1940) دراسة حول استخدام اختبارات المهارة لاختيار عمال مصنع ساعات. دعت الخطوة الأولى في البحث إلى تحليل الوظائف للأنواع المختلفة من العمل المنجز في المصنع. وقد أبرز ذلك متطلبات الوظيفة المهمة التالية: حركات الأصابع الجميلة ، والتلاعب بالملاقط ، والقدرة على مواصلة أداء المهام الحساسة والمُعقدة أحيانًا على مدار فترات طويلة دون أي زيادة في التوتر أو سوء التوافق.

وقد أشارت مراجعة مواد الاختبار المتاحة إلى أنه في ضوء متطلبات المصنع لفترة اختبار مختصرة ، من المحتمل أن يكون اختبار مهارة الإصبع ومهارة الملقط من جونسون أوكونور أفضل ما يكون. قبل الشروع في برنامج الاختبار ، تم معايرة مختلف معايير النجاح المتاحة وتم الحصول على ثلاثة مقاييس: طول مدة العمل ، نسبة المرتبات ، وتصنيفات الملاحظين.

تم تقسيم طول مدة التوظيف إلى أربع فئات. الأول كان مجموعة "أقل من أسبوع". غادر غالبية الموظفين في هذه الفئة أو تم فصلهم في غضون أسبوع واحد بسبب ضعف القدرة على العمل. من وجهة نظر هذا المعيار ، كانت هذه المجموعة أفقر.

الفئة الثانية كانت مجموعة "أسبوع إلى أربعة أشهر". اعتقدت الإدارة أنه يمكن تعلم الوظيفة بشكل مناسب في غضون أربعة أشهر. أولئك الذين لم يتمكنوا من تعلمه في هذا الوقت إما تم استبعادهم أو استقالتهم. من وجهة نظر الإدارة ، كان هذا الموظف غير فعال. وفقا للموظف ، لم يستطع كسب ما يكفي. في أي حال ، تم قطع علاقة العمل.

الفئة الثالثة كانت مجموعة "من أربعة أشهر إلى سنة واحدة". اعتبرت هذه الإدارة من قبل الإدارة بأنها ناجحة إلى حد ما. الفئة الرابعة والأخيرة كانت المجموعة "سنة واحدة أو أكثر". اعتبر هؤلاء الموظفون أنجحهم ؛ كانت تكاليف التدريب بالنسبة لهم أدنى ، وكانت المجموعة لديها أعلى إنتاج.

المعيار الثاني هو نسبة الراتب. وحيث أن جميع الموظفين كانوا على أساس أسعار الجملة ، فإن الأرباح كانت انعكاسًا مباشرًا للإنتاج. كان الرقم المستخدم هو متوسط الأرباح الأسبوعية على مدار ثلاثة أشهر. واعتبرت هذه المرة طويلة بما يكفي لمعدل القمم الثانوية أو الركود في الأعمال والصعوبات الطفيفة في الإنتاج. تم التعبير عن المعيار الفعلي في شكل مؤشر ، مع أرباح X الدولار في الأسبوع تساوي قاعدة من 100.

المعيار الثالث هو تصنيف الموظفين من قبل الملاحظين. طُلب من كل عامل فورمان إعطاء تقييم شامل على أساس رأيه في فائدة الموظف وكفاءته. وفقًا لهذا التقييم ، تم تصنيف كل موظف على أنه ممتاز ، جيد ، متوسط ، ضعيف ، أو غير مرض.

تم وضع خمسة مقاييس لأداء الاختبار. اثنان على أساس السرعة (الوقت الإجمالي المطلوب للقيام بكل اختبار). وكان هناك تدبير آخر هو تقييم الأداء النوعي لكل اختبار. بما أن هذا يضيف معنى لأي درجة موضوعية مثل إجمالي الوقت أو العناصر المكتملة ، فسيتم وصفه بالتفصيل على أمل تشجيع استخدام تقنية القياس هذه.

التصنيف النوعي هو تقدير الفاحص الكلي لأداء الاختبار. ويشمل ذلك كيفية متابعة الموضوع للاتجاهات والتوتر أثناء الاختبار والطريقة المستخدمة لإكمال الأداء. تم استخدام مقياس تصنيف "جيد" و "متوسط" و "رديء" للصفات التالية: دقة الاختيار ، وفهم الدبابيس ، ووضع الدبابيس ، ووضع الدبابيس ، ورعاش اليد ، وظروف اللوح ، والوتيرة ، والموقف والحركات من الذراع ، ووضع الجسم.

إن حقيقة وجود توزيع ملموس في تقديرات الأداء النوعي موضحة بالنتائج في هذه الدراسة بالذات كما هو موضح في الجدول 4.4.

يؤدي هذا المقياس لأداء الاختبار إلى تقييم شامل من قبل الفاحص لطريقة الموضوع أثناء الاختبار. معظم اختبارات الأداء والعديد من اختبارات قلم الرصاص والورق تصل بسهولة إلى هذا التصنيف. هذه التقييمات مفيدة في النظر في شخص للتعاقد. وكان التدبير الخامس مقارنة بين الوقت الذي يستغرقه القيام بالنصف الثاني من اختبار مهارة الاصبع والوقت الذي استغرقه في النصف الأول. كان من المفترض أن الفرق بين مجموع الأوقات في كل نصف قد يقيس القدرة على تحسين معدل السرعة وبالتالي قد يكون مفيدًا كمؤشر لمعدل التحسن في الوظيفة.

في هذه الدراسة تم استخدام 258 موضوعات. من هذا العدد ، تم اختبار 137 موضوعًا ، تمت إحالة 84 بدون اختبار ، وشكلت مجموعة مراقبة ، وتم استخدام 37 منها في الدراسة التجريبية التي سبقت الدراسة الرئيسية. وكانت هذه المجموعة الأخيرة تعتبر أيضًا مجموعة متابعة. تم إجراء جميع الاختبارات في ظل ظروف بيئية مؤاتية ، أي في غرفة الاختبار ؛ وكان جميع الأشخاص يعرفون أنهم كانوا يقومون باختبار لاستخدامه من قبل مصنع ساعات محدد لأغراض التوظيف.

تم تحليل البيانات بشكل مكثف بثلاث طرق. أولاً ، تمت دراسة خصائص المعايير المختلفة بالإضافة إلى علاقاتها المتبادلة. ثانيا ، تم دراسة خصائص المؤشرات المختلفة وعلاقاتها المتبادلة. ثالثًا ، تم تحليل العلاقة بين معايير النجاح ونتائج الاختبار ؛ كانت هذه هي الخطوة الحاسمة.

تشير العلاقات المتبادلة بين المعايير إلى أن كل منهما كان يقيس جانبًا مختلفًا نسبيًا من النجاح في الوظيفة. على سبيل المثال ، كان الارتباط بين تصنيفات المقيم ونسبة الأجور +0.13. كان الارتباط بين طول مدة العمل وتقييمات الملاحظين + 0.25. كان الارتباط بين نسبة الراتب ومدة التوظيف أعلى ، + 0.44.

تم وضع أربعة من المقاييس الخمسة لأداء الاختبار - وهي الدرجات الزمنية والأداء النوعي على كلا الاختبارين - على أنها موثوقة ؛ ولكن لم يتم تحديد مقياس واحد ، تحسين ، كموثوق به. أظهرت المقارنة بين كل ترابط بين كل من التدابير الخمسة أن جميعها كانت منخفضة. كانت ثمانية أقل من + 0.20 ، وكان واحد أعلى قليلاً فقط.

كان الارتباط المتبادل المرتفع الوحيد بين تصنيف الجودة والوقت الإجمالي لاختبار مهارة الملقاط. كان هذا +0.71. ومع ذلك ، لا يمكن اعتبار تصنيفات الجودة بشكل عام مرتبطًا ارتباطًا وثيقًا بالسرعة ، لأن العلاقة بين تصنيف الجودة في اختبار مهارة الإصبع والوقت الإجمالي في هذا الاختبار كان + 0.13 فقط. إن الارتباطات المنخفضة بين مقاييس الاختبار وانخفاض الترابط بين معايير الوظيفة هي في الواقع أكثر تفضيلاً من الارتباطات المتبادلة العالية. عندما تكون هذه الارتباطات عالية ، تكون قيمتها التنبؤية محدودة لأن الجميع سوف يتنبأون بنفس الشيء. وعلى نفس المنوال ، إذا كانت كل معايير العمل مترابطة بشكل كبير ، فسيكون كل منها يقيس الشيء نفسه بدلاً من جوانب النجاح المختلفة.

كانت النتيجة الإجمالية للوقت في اختبار مهارة الإصبع و الملقط عمومًا أعلى قيمة تنبؤية لمعايير نجاح الوظيفة. كانت تقييمات الجودة على أداء الاختبار قيّمة للتنبؤ في بعض الحالات ، ولكن كان التحسن في النصف الثاني من اختبار براعة الإصبع غير متوقع لأي من المعايير.

بعض النتائج المحددة هي كما يلي (Blum، 1940):

1. لم تكن تقديرات الجودة أثناء اختبار براعة الاصبع مؤشرا على طول فترة التوظيف. ولكن تم العثور على أولئك الذين لديهم تصنيف "متوسط أو أقل" على اختبار مهارة الملقاط في الفئات الأقصر للتوظيف. واحد وستون بالمائة من المجموعة التي حصلت على مثل هذه التصنيفات لم يعد يعمل بعد أربعة أشهر ، ولم يبق أو تم فصل سوى 27 بالمائة من أولئك الذين حصلوا على تصنيفات "فوق المتوسط" خلال هذه الفترة. كان الفرق ذو دلالة إحصائية. عندما تم الجمع بين تصنيفات الجودة لكل من الاختبارات وتوزيعها وفقًا لطول مدة التوظيف ، لم توجد فروق ذات دلالة إحصائية بين تلك التي تم تصنيفها عالية وتلك التي تم تصنيفها في أداء الاختبار.

2. تم الإبلاغ عن ارتباطات منخفضة بين تصنيفات الجودة في اختبار براعة إما ونسب الراتب. كانت الارتباطات + 0.17 ± 0.11 من أجل اختبار براعة الإصبع ونسب الراتب ، +0.15 ± 0.11 من أجل اختبار مهارة الملقاط ونسب الراتب ، و + 0.05 ± 0.12 لمعدلات الجودة المجمعة ونسب الراتب.

3. ترتبط تقييمات الجودة في اختبار الأصابع بتصنيفات الملاحظين للأداء الوظيفي مع معامل طوارئ قدره + 0.50. كان C لمعدل جودة منتاش ومعدلات الملاحظين + 0.24. تم الحصول على معامل للطوارئ قدره + 0.30 عندما ارتبطت تقديرات الملاحظين مع تصنيفات الجودة المجمعة في كل من الاختبارات. (الحد الأقصى C = + 0.86.)

4 - لم يكن التحسن في النصف الثاني من اختبار مهارة الإصبع ينبئ بطول مدة العمل.

5. التحسن يرتبط مع نسبة الرواتب - 0.06 ± 0.13. هذه هي المقارنة الوحيدة بين كل التحريات التي أظهرت علاقة سلبية غير موثوقة بين مؤشرات الاختبار ومعايير الكفاءة.

6. من العمال الذين حصلوا على تصنيف "A" من قبل الملاحظين ، أظهر 100٪ تحسنا في النصف الثاني من اختبار براعة الإصبع. من بين العمال الذين حصلوا على تصنيف "D" ، تحسن 50 في المائة فقط. تحسّن 84٪ من أولئك الذين حصلوا على تصنيفات "ب" ، وتحسنت نسبة 61٪ ممن حصلوا على تصنيفات "C". لا يعتبر الفرق في النسبة المئوية بين أولئك الذين حصلوا على تصنيفات "A" و "D" موثوقًا من الناحية الإحصائية ، ربما بسبب العدد المحدود من الموضوعات.

7. كانت درجات الوقت في اختبارات براعة الإصبع و الملقط أسرع في المتوسط مع زيادة طول فترة العمل. كان الفرق في متوسط الوقت في اختبار براعة الإصبع بين مجموعات "أقل من 7 أيام" و "أكثر من 1 سنة" ذات دلالة إحصائية. في نفس المقارنة على اختبار مهارة الملقط ، كان الفرق D / was 2.5. ﻟم ﯾزﯾد اﻟﺿم ﺑﯾن ﻋﻼﻣﺎت اﻟدرﺟﺔ اﻟﺑﺻرﯾﺔ ﻟﻔﺗرة اﻹﺻﺑﻊ واﻟﻣﻼﻋب اﻟﻣﺻداﻗﯾﺔ اﻹﺣﺻﺎﺋﯾﺔ ﻟﻟﻔرق ، ﮐﺎن اﻟﻔرق D / between ﺑﯾن ﻣﺟﻣوﻋﺎت "أﻗل ﻣن 7 ﯾوﻣًﺎ" و "أﮐﺛر ﻣن ﺳﻧﺔ واﺣدة" 2.3.

8 - كان الارتباط بين معدل زمن مهارة الإصبع ونسبة الراتب 0.26 ± 0.10 ؛ بين درجة المهارة منتوج النتيجة ونسبة الراتب كان +0.32 ± 0.10 ؛ وبين أوقات الاختبار المجمعة ونسبة الراتب كان + 0.39 ± 0.09.

9. كانت فئة "أعلى من المتوسط" وفقًا لتصنيفات الملاحظين أسرع بخمس ثوانٍ في اختبار براعة الإصبع و 9 ثوانٍ أسرع في اختبار مهارة الملقط من المجموعة "المتوسطة وأدناه". كان الفرق في درجات الاختبار المجمعة بين المجموعتين 12 ثانية لصالح أولئك الذين يتلقون تقديرات أعلى من المتوسط. هذه الاختلافات لم تكن موثوقة من الناحية الإحصائية.

10. القيمة العملية للدرجات الحرجة (درجة زمنية من 5 دقائق ، 30 ثانية أو أفضل على اختبار مهارة الملقط و 7 دقائق ، 30 ثانية على اختبار براعة الإصبع) التي تم اقتراحها في الدراسة التجريبية (Candee and Blum، 1937 ) يشار إليه بوضوح في هذا التحقيق. هذه الدرجات تميز الموظفين في مصنع الساعات بدرجة كبيرة من الدقة وفقًا لمعايير الكفاءة.

11. أظهرت المقارنة وفقاً لطول مدة التوظيف أن 7٪ من المجموعة التي "اجتازت كلا الاختبارين" تركت في غضون أسبوع واحد ، في حين أن 23٪ من مجموعة "عدم الاختبار" و 24٪ من مجموعة العمال الذين "فشلوا إما أو كلا الاختبارين "كانا عاطلين عن العمل بعد أسبوع واحد. كانت الفروق في النسب المئوية بين الأولى والثانية الأخيرة ذات دلالة إحصائية مع النسب الحرجة من 3.2 و 3.4. تم العثور على أكبر احتمال للعمل لفترات طويلة في المجموعة التي "اجتاز كلا الاختبارات". من هذه المجموعة ، بقي 72 في المئة أربعة أشهر أو أكثر. كانت هذه النسبة تختلف اختلافاً كبيراً عن مجموعة "عدم الاختبار" (اختلاف D / of 3.1) ، ومن المجموعة التي "فشلت في أي من الاختبارين أو كلاهما" (فرق D / of من 4+).

12. أشارت المقارنة وفقا لنسب الراتب إلى أن المجموعة التي "اجتازت كلا الاختبارين" استحوذت على أكبر قدر من المال. كانت أرباح هذه المجموعة مختلفة إحصائياً عن أرباح المجموعة التي "فشلت في أحد أو كلا الاختبارين". كانت مجموعة "عدم الاختبار" متفوقة في نسبة الراتب إلى المجموعة التي "فشلت في أي من الاختبارين أو كلاهما". مرت على كلا الاختبارين "لم يكن أعلى بكثير من مجموعة" عدم الاختبار ".

13. أظهرت المقارنة وفقا لتصنيفات المهاجمين فقط الاتجاه. تم تصنيف المجموعة التي "اجتازت" الاختبارات "من قبل المراقبين" بأنها "أفضل من المتوسط" في 34 في المائة من الحالات. تم تصنيف المجموعة التي "فشلت في أي من الاختبارين أو كلاهما" على أنها "أعلى من المتوسط" في 25 في المائة من الحالات. لم يكن هذا الاختلاف موثوقًا من الناحية الإحصائية. لا يمكن التمييز بين مجموعة "عدم الاختبار" ومجموعة "اجتاز كلا الاختبارين" وفقًا لتصنيفات الملاحظين.

14- إن متابعة الموضوعات في الدراسة التجريبية تدعم نتائج هذا البحث بأن الدرجات الزمنية في الاختبارات هي مؤشرات على الكفاءة. قبل عامين من "المتابعة" ، تم اختيار 20 عاملاً من قبل ملاحظين أعلى رتبة و 17 عاملاً في مصنع الساعات. كانت هذه المجموعات تختلف في الأصل بشكل ملحوظ في درجات اختبارها في كل من اختبار الأصبع واختبار الملقط.

تم في وقت لاحق الحصول على اختلافات كبيرة بين هذه المجموعات الأولية من حيث:

(أ) النسبة المئوية للتصريف و

(ب) نسبة المرتبات.

قبل تقديم استعراض لدراسات أخرى ، من المستحسن إجراء تقييم ودراسة الآثار المترتبة على مثل هذا البحث. الدراسة المذكورة أعلاه لم تكن "مثالية". بسبب ظروف المصنع ، كان من المستحيل استخدام ضوابط علمية مرغوبة. على سبيل المثال ، يمكن ترتيب المجموعات ذات الحجم المتساوي في الفئات المختلفة في المختبر بسهولة أكبر من المصنع.

يجب أن تتطابق متطلبات البحث مع الظروف السائدة في كثير من الأحيان ، ولكن فقط فيما يتعلق بالتخطيط والمنهجية. لا يحتوي البيان على استنتاجات البحوث ، ويجب الإبلاغ عنها بشكل مستقل عن ظروف المصنع ويجب أن تتوافق بشكل صارم مع البيانات التي تم الحصول عليها.

إن علم النفس الصناعي له ما يبرره في إجراء الدراسات المختبرية فقط كدليل على البحث الذي يصبح فيه الوضع الصناعي بالضرورة "مختبرًا". لا يمكن تعميم الاستنتاجات المخبرية وتطبيقها على المشهد الصناعي دون التحقق منها بكل الطرق الممكنة.

سواء كانت المشكلة تتعلق باختبارات للاختيار أو لأي غرض آخر ، فيجب على علم النفس الصناعي في كثير من الأحيان تعديل الإجراءات وإظهار المرونة في الطريقة التي قد تكون غير تقليدية من وجهة النظر العلمية. على سبيل المثال ، إذا لم يتخل عن ضوابط صارمة في بعض الحالات ، فقد يضطر إلى التخلي عن المشكلة برمتها. بالنسبة إلى علم النفس الصناعي ، فإن أهون الشررين هو إجراء بحث في الصناعة في أفضل الظروف التي يمكن للصناعة توفيرها.

هناك توضيح آخر لهذه النقطة يتعلق باستصواب وجود أعداد كبيرة من الموضوعات لإجراء تجربة. ومع ذلك ، فغالبا ما لا تكون منظمة صناعية في وضع يسمح لها بالتوظيف على نطاق واسع. في هذه الحالة ، من الأفضل التضحية بعدد المواضيع بدلاً من الدراسة بأكملها.

لا يعني هذا المبدأ أنه يجب التسامح مع شكل من أشكال البحث المسمى بـ "الأبحاث الموجهة". يجب أن تتفق تقارير البحث مع الاستنتاجات المستندة إلى الحقائق التي تم الحصول عليها. عالم النفس الصناعي الذي لا يبلغ عن نتائج سلبية لأن هذا من شأنه أن يخلق عدم الاحترام وقد يؤدي إلى إقالته هو خطأ مثل مدير الأعمال الذي يريد البحث لدعم أفكار مبيعاته وبالتالي "يوجه" البحث ونتائجه.

النقاط التي نوقشت للتو مهمة ويجب أن تستخدم كوسيلة لتقييم ليس فقط اختبار البحث ولكن أيضا أنواع أخرى من البحوث في هذا المجال. تحقيقا لهذه الغاية ، سيتم وصف بعض الدراسات الإضافية على اختيار الاختبار.

2. دراسة Ghiselli:

في الدراسة التي أجراها على الاختبارات لاختيار المفتشين ، استخدم Ghiselli (1942) بطارية من عدة اختبارات على مجموعة من 26 موظفة تعمل كمشتغلات في مجال الصيدلة. كانت هناك خمس واجبات رئيسية في هذا العمل: تعبئة الحاويات ، وإدراج سدادات ، وفحص المحتويات عن طريق العين ، ووضع العلامات على الحاويات ، والتعبئة.

المهمة ، رغم كونها روتينية ، مهمة للغاية ، لأن وجود مادة غريبة أو وضع علامات غير صحيحة قد يؤدي إلى مرض خطير أو حتى الموت لأي شخص قد تم بيعه المنتج الخطأ. معيار كفاءة العمل هو مزيج من التصنيفات من قبل forelady والمشرف.

أشار تحليل الوظيفة إلى أن القدرات الهامة التي ينبغي قياسها في البطارية الأولية للاختبارات كانت:

1. براعة الأصابع واليدين والأرس

2. التنسيق بين العين واليد

3. تقدير حجم وشكل الأشياء

4. القدرة على مراقبة الاختلاف في التفاصيل

تحقيقا لهذه الغاية كانت تدار بطارية من ستة اختبارات للموظفين. وقد تبين أن متوسط أداء مفتشي التعبئة كان متفوقًا إلى حد كبير على عينات من السكان البالغين في اختبارات وضع وتغيير مينيسوتا واختبار لوحة النماذج الورقية. على الرغم من أن هذه المعلومات مفيدة ، إلا أن الاختيار يكون مبررًا فقط عند وجود علاقة بين أداء الاختبار والأداء الوظيفي.

هذه العلاقة تسمى معامل الصلاحية. تم العثور على اختبار لوحة ورقة من ولاية مينيسوتا لتكون أكثر ارتباطا مع معيار من أي اختبار آخر في البطارية. هذا الاختبار مرتبط بمدى +0.57. ارتبط اختبار Pegboard بالمعيار إلى -0.50 ، واختبار الدوران إلى -0.40. كان للاختبارات الأخرى ارتباطات أقل مع المعيار.

هذه الدراسة ، مثل تلك التي ذكرت سابقا ، لديها أوجه قصور. معيار الكفاءة هو تصنيف من قبل رؤسائهم. ولكن بما أنه كان على ما يبدو هو المعيار الوحيد المتاح ، فلا بد من استخدامه أو لم يكن من الممكن تقييم أي اختبار. في كثير من الأحيان في الصناعة مثل هذه التصنيفات تشكل المعيار الوحيد المتاح.

عدد المواضيع ، 26 ، هو صغير ؛ ولكن عندما نتذكر أن هذا يشكل عددًا كبيرًا من الأشخاص الذين يؤدون المهمة نفسها ، فيمكن اعتبارها عينة مرضية. لا تقدم الدراسة أي دليل على نجاح توصياتها التي تم اعتمادها للاستخدام في المستقبل ؛ هذه المعلومات ، بالإضافة إلى الدرجات الحرجة الموصى بها ، غالباً ما تكون مفيدة في تقييم استخدام الاختبارات.

3. دراسة القش:

استطاع إدوين ن. هاي (1943) ، باستخدام بطارية اختبارات ، أن يتنبأ بنسبة 91 بالمائة من مشغلي آلات حفظ الدفاتر الأفضل و 72 بالمائة من المشغلين الأقل إرضاءً. قبل إنشاء هذه النتائج ، اتبعت جميع الإجراءات التي ينطوي عليها اختبار البحث والتطوير. وشملت هذه تحليلات الوظيفة وضع معايير العمل المناسبة ، والاختيار الأولي للبطارية اختبار ، والتحقيقات الإحصائية. فقط بعد سنوات عديدة كان من الممكن التوصية ببطارية اختبار معينة باعتبارها ناجحة لأغراض التنبؤ.

وكشفت تحليلات الوظيفة أن المتطلبات المعلقة لمسك الدفاتر الآلية هي قدرة ثنائية. أظهر تحليل مفصل للوقت والحركة أن هناك 5 عمليات مميزة يمكن تقسيمها إلى 18 حركة. كان متوسط وقت العمليات الخمس - تحديد بطاقة دفتر الأستاذ ، وإدراج بطاقة دفتر الأستاذ ، وتحصيل الرصيد السابق ، ومبلغ ما بعد المراجعة ، والبطاقة العائدة - 6.8 ثانية.

في معظم هذه العمليات تم استخدام العينين واليدين. كانت السرعة والدقة مطلوبة للأداء الناجح لهذه الوظيفة. كان الفرق بين قدرة الأفضل والقدرة على أفقر المشغلين أكبر من 2 إلى 1 ؛ أي أن أفضل المشغلين قاموا بأكثر من ضعف العمل الذي قام به أفقر المشغلين.

واشتملت الاختبارات المستخدمة على اختبار "اختبار الذكاء" ، واختبار مينيسوتا الكتابي ، واختبار معدل التلاعب في زيغلر ، واختبارات أخرى للقدرة الكتابية مثل التقديم واكتشاف الأسماء. في المجموع ، كانت تدار 22 الاختبارات. على الرغم من أن ستة منها كانت من ناحية اليد والذراع وبراعة الأصابع ، لم يظهر أي من هؤلاء الستة أي علاقة كبيرة مع معيار "سرعة النشر".

ومع ذلك ، فإن اختبار Otis هو اختبار Minerota Clerical Test-Numbers ، وارتبطت سلسلة Alpha Number بـ +0.50 أو أعلى بهذا المعيار. أشارت تقنية الارتباط المتعدد إلى أن اختبار Otis و Minnesota Clerical كان لهما علاقة + 0-65 مع المعيار. كانت أعلى علاقة ترابط متعددة بين بطارية الاختبار والمعيار +0.71 وتضمنت Otis ، وأرقام Minnesota ، و Alpha Number series ، و Fryer Name Finding.

تعتبر دراسة هاي ذات قيمة من العديد من وجهات النظر. تشير الأدلة المقدمة في المتابعة إلى أن الاختبارات عملت في هذه الحالة. ويبين الجدول 4-5 التحسن المطرد في متوسط إنتاج أصحاب الحسابات منذ أن تم اختيار الاختيار بناء على الاختبار.

4. دراسة سرتين:

أدار AQ Sartain (1945) بطارية من سبعة اختبارات لمجموعة من 47 موظفا في قسم التفتيش في مصنع للطائرات. تم تحديد المعيار من خلال تصنيفات المدربين في دورة لتجديد المعلومات تعطى للمفتشين. المدربين كانوا على دراية أيضا بأداء هؤلاء الموظفين مكافحة تقييماتهم مما لا شك فيه يعكس هذه المعرفة.

تضمنت بطارية الاختبار MacQuarrie ، و Otis ، و Cardall Test of Practical Judgement ، و Minnesota Paper Form Board ، واختبار التدريب على التصنيف الصناعي ، واختبار Bennett للفهم الميكانيكي ، واختبار O'Rourke من الكفاءة الميكانيكية. العلاقة المتعددة لهذه البطارية بالكامل مع المعيار كانت + 0.787.

ومع ذلك ، فإن ثلاثة من الاختبارات - MacQuarrie ، و Cardall ، و Minnesota Paper Form Board - أسفرت عن نتائج جيدة بشكل متساوٍ ، حيث أن الارتباط المتعدد هو +0.780. بما أن الفرق بين هذين الارتباطين لا يكاد يذكر ، فمن المستحسن استخدام هذه الاختبارات الثلاثة ، بدلاً من السبعة.

5. دراسة شومان:

قام جون ت. شومان (1945) بإدارة مجموعة من الاختبارات لمجموعة من الموظفين ومقدمي الطلبات لشغل وظائف مختلفة في قسم Lycoming التابع لشركة الطيران. شملت الاختبارات على أوتيس ، ومجلس نماذج الأوراق في مينيسوتا ، واختبار بينيت للفهم الميكانيكي ، واختبار أورورك من الكفاءة الميكانيكية ، واختبار مينيسوتا المهني للعمال الكتابيين.

كان الموظفون الذين خضعوا للاختبار يشملون المفتشين ، واختبار المحركات ، ومشغلي الآلات ، والموظفين ، والوظيفين ، من بين آخرين. أفاد شومان أن متوسط التحسن في اختيار العمال الممتازين كان 18 في المئة مع اختبار بينيت ، و 15 في المئة مع أوتيس ، و 13 في المئة مع مينيسوتا ورقة نموذج الاستمارة. الدرجات الحرجة التي جعلت هذا التحسن ممكن يعني القضاء على واحد من كل أربعة أشخاص تم اختبارهم.

وجد أن اختبار بينيت عند مقارنته بالمعيار (التصنيفات) مرتبط إلى حد كبير بوظيفة محدد الوظيفة ، حيث أن الارتباط هو +0.73. ارتبط مجلس نموذج ورقة مينيسوتا +0.59 مع هذا العمل نفسه. كان اختبار Otis أعلى علاقة مع وظيفة اختبار المحرك ، +0.57. وجد شومان أن الاختبارات في بطاريته ترتبط بشكل أفضل بالوظائف التي تتطلب مهارات مثل العمل على الأجزاء الدقيقة للآلات أو اختبار محركات الطائرات ، بدلاً من المهارات اليدوية البحتة.

وأعرب عن اعتقاده بأن الاختبارات يمكن أن تكون أكثر فائدة في تعيين الموظفين لمستويات فئات الوظائف مقارنة بالوظائف المحددة. والنتيجة الطارئة ، ولكن تلك التي تستحق الذكر ، هي حقيقة أن اختباراً واحداً يجب إسقاطه بسبب عدم الرضا من جانب الأشخاص. كان هذا اختبار أورورك للقدرة الميكانيكية ، والذي كان طويلًا جدًا وثبت أنه عديم الفائدة تقريبًا مع النساء المتقدمات ، وكثير منهن لم يحاولن حتى أخذه. هذا يؤكد على أن بطارية الاختبار يجب أن تستقبل بشكل إيجابي من قبل المتقدمين إذا كانت هناك أي قيمة مرتبطة بالنتائج.

ملخص من الأمثلة:

العديد من الدراسات الأخرى كانت فعالة مثل القلة المذكورة أعلاه. ومع ذلك ، فإن الأمثلة الأخرى لن تؤدي إلا إلى تأجيل هذه النقطة. يتطلب استخدام الاختبارات النفسية في الصناعة البحث والتطوير في ضوء المشكلة الخاصة والنبات المحدد. حقيقة أن هذا العمل قد تم القيام به من قبل لا يجعلها غير ضرورية. بل يعني أن فرص النجاح تتحسن في كل مرة. النقطة الأساسية هي أن نتائج الاختبار يجب أن تكون مرتبطة بنجاح الوظيفة ؛ لا يمكن أبدا أن تؤخذ على أنها أمر مسلم به.