دراسة ملاحظات على اختبار كاي - ساحة

توفر هذه المقالة مذكرة دراسية حول اختبار مربع كاي.

يُعد اختبار X ² (الحرف اليوناني ² X Pronounced as Ki-square) طريقة لتقييم ما إذا كانت الترددات التي تم ملاحظتها تجريبيًا تختلف بشكل كبير عن تلك المتوقعة في إطار مجموعة معينة من الافتراضات النظرية. على سبيل المثال ، لنفترض أن التفضيل السياسي ومكان الإقامة أو المولد قد تم تبادلهما ، وأن البيانات ملخصة في جدول 2 × 3 للطوارئ التالي.

ويظهر في الجدول أن نسب سكان الحضر هي 38/48 = 0.79 ، و 20/46 = 0.34 ، و 12/18 = 0.67 (تقريبًا إلى رقمين عشريين) للأحزاب السياسية الثلاثة في البلد. سنرغب حينها في معرفة ما إذا كانت هذه الاختلافات ذات دلالة إحصائية أم لا.

ولتحقيق هذه الغاية ، يمكننا اقتراح فرضية باطلة تفترض عدم وجود اختلافات بين الأحزاب السياسية الثلاثة فيما يتعلق بالمولد. وهذا يعني أنه من المتوقع أن تكون نسبة سكان المناطق الحضرية والريفية واحدة بالنسبة لكل من الأحزاب السياسية الثلاثة.

على أساس افتراض أن الفرضية الصفرية صحيحة ، يمكننا حساب مجموعة من الترددات المتوقعة في ضوء هذه المجاميع الهامشية. وبعبارة أخرى ، يمكننا حساب عدد الأشخاص الذين يفضّلون حزب المؤتمر الذي نتوقعه على أساس الافتراض المذكور أعلاه بأن يكونوا من الحضر ومقارنة هذا الرقم مع الرقم الذي تمت ملاحظته بالفعل.

إذا كانت الفرضية الصفرية صحيحة ، فقد نحسب نسبة شائعة على النحو التالي:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0.625

بهذه النسبة المقدرة ، نتوقع 48 × (0.625) = 30 شخصًا ينتسبون إلى الكونجرس ، 46 _× (0.625) = 28.75 شخصًا ينتسبون إلى حزب جاناتا و 18 × (0.625) = 11.25 شخصًا ينتسبون إلى لوك دال من أصل 70 سكان المدن. عند طرح هذه الأرقام من الأرقام المرصودة الخاصة من أحجام العينات الثلاثة ، نجد أن 48 - 30 = 18 تابعة للكونغرس ، 46 - 28.75 = 17.25 تابعة إلى جاناتا و 18 - 11.25 = 6.25 شخصًا ينتسبون إلى لوك دال من 42 شخصًا من المناطق الريفية.

وتظهر هذه النتائج في الجدول التالي ، حيث الترددات المتوقعة. يظهر بين قوسين.

لاختبار قابلية الفرضية العديمة نقوم بمقارنة الترددات المتوقعة والملاحظة. تعتمد المقارنة على إحصائية X ² التالية.

X ² = Σ (O- E) ² / E

حيث يقف O للترددات المرصودة و E للترددات المتوقعة.

درجات الحرية :

عدد درجات الحرية يعني عدد القيود المستقلة المفروضة علينا في جدول للطوارئ.

يوضح المثال التالي المفهوم:

دعونا نفترض أن السمتين A و B مستقلين في هذه الحالة ،

التردد المتوقع أو تكون الخلية AB 40 × 30/60 = 20. بمجرد تحديد ذلك ، يتم تثبيت ترددات الخلايا الثلاث المتبقية تلقائيًا. وبالتالي ، بالنسبة للخلية ، يجب أن يكون التردد المتوقع 40 - 20 = 20 ، وبالمثل ، بالنسبة للخلية AB يجب أن تكون 30 - 20 = 10 وبالنسبة لـ αB يجب أن يكون 10.

هذا يعني أنه بالنسبة للجدول 2 × 2 لدينا خيار واحد فقط من جانبنا ، في حين أننا لا نملك الحرية في الخلايا الثلاث المتبقية. وبالتالي ، يمكن حساب درجات الحرية (df) بواسطة الصيغة:

df - (c - 1) (r - 1)

حيث df لتقف على درجات الحرية ، c لعدد الأعمدة و r لعدد الصفوف.

وهكذا ، في جدول 2 × 3 (جدول 18.54)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

مستوى الدلالة :

كما ذكرنا سابقًا ، يتم استخدام اختبار مربع كاي لفحص ما إذا كان الفرق بين الترددات المرصودة والمتوقعة ناتجًا عن تقلبات أخذ العينات ، وعلى هذا النحو غير ذي أهمية أو عكسي ، ما إذا كان الاختلاف يرجع إلى سبب آخر وعلى هذا القدر من الأهمية.

قبل رسم الاستدلال على أن الفرق مهم ، قام الباحثون بإعداد فرضية ، غالباً ما يشار إليها بالفرضية الصفرية (التي ترمز إلى H _o ) على النقيض من فرضية البحث (H ₁ ) التي تم إعدادها كبديل لـ H _o .

عادة ، على الرغم من عدم وجود دائمًا ، تنص فرضية العدم على عدم وجود فرق بين عدة مجموعات أو عدم وجود علاقة بين المتغيرات ، في حين أن فرضية البحث قد تتنبأ إما بعلاقة إيجابية أو سلبية.

وبعبارة أخرى ، تفترض الفرضية الخاطئة أن هناك عدم وجود أخطاء غير العينات والاختلاف يرجع إلى المصادفة وحدها. ثم يتم تحديد احتمال حدوث مثل هذا الاختلاف.

يشير الاحتمال إلى مدى الاعتماد الذي يمكننا وضعه على الاستدلال المرسوم. تتوفر قيم جدول مربع كاي في مستويات الاحتمالات المختلفة. تسمى هذه المستويات مستويات الأهمية. يمكننا أن نجد من الجدول قيم مربع كاي عند مستويات معينة من الأهمية.

عادة (في مشكلة العلوم الاجتماعية) ، يتم عرض قيمة مربع كاي في 0.05 أو .01 مستويات الأهمية من درجات الحرية المعطاة من الجدول ويتم مقارنتها بالقيمة المرصودة لمي مربع. إذا كانت القيمة الموضحة أو y ¹ أكبر من قيمة الجدول في 0.05 ، فهذا يعني أن الفرق كبير.

درجة الحرية :

لاستخدام اختبار مربع كاي ، فإن الخطوة التالية هي حساب درجات الحرية: لنفترض أن لدينا جدول طوارئ 2 × 2 مثل الجدول الموجود في الشكل 1.

نعلم أن مجاميع الصفوف والأعمدة r _t ¹ و r _t ² - و c _t ¹ و c _t ² . يمكن تعريف عدد درجات الحرية على أنها عدد قيم الخلايا التي يمكننا تحديدها بحرية.

في الشكل 1 ، بمجرد تحديد قيمة واحدة من الصف 1 (تدل على الشيك في الشكل) ، يتم تحديد القيمة الثانية في ذلك الصف وقيم الصف الثاني (المشار إليها في X) بالفعل ؛ نحن لسنا أحرار في تحديد هذه لأننا نعرف مجاميع الصف ومجاميع الأعمدة. هذا يدل على أنه في جدول 2 × 2 للطوارئ ، نحن نحرر قيمة واحدة فقط.

الإجراء :

حساب مربع تشي:

مربع كاي كاختبار لجودة الملاءمة:

استخدمنا في القسم السابق مربع كاي كاختبار للاستقلال. هذا هو ما إذا كان قبول أو رفض فرضية العدم. يمكن أيضًا استخدام اختبارات x ~ لتحديد ما إذا كان هناك اختلاف كبير بين توزيع التردد الملحوظ وتوزيع الترددات النظرية.

وبهذه الطريقة ، يمكننا تحديد مدى ملاءمة الاحتواء للترددات المرصودة والمتوقعة. أي أن الملاءمة يمكن اعتبارها جيدة إذا لم يكن هناك اختلاف كبير بين البيانات المرصودة والمتوقعة عندما يكون منحنى الترددات المرصودة مفروضًا على منحنى الترددات المتوقعة.

ومع ذلك ، يجب أن نتذكر أنه حتى إذا ظلت النسب في الخلايا دون تغيير ، فإن قيمة مربع كاي تختلف مباشرة مع العدد الإجمالي للحالات (N). إذا ضاعفنا عدد الحالات ، فسوف تتضاعف قيمة chi-square ؛ إذا تضاعفنا عدد الحالات ، فإننا أيضًا ثلاثة أضعاف مربع chi وهكذا.

يمكن توضيح الآثار المترتبة على هذه الحقيقة من خلال مثال موضح أدناه:

في المثال الحالي ، قيمة chi-square هي 3.15. على هذا الأساس ، نستنتج بطبيعة الحال أن العلاقة ليست مهمة.

الآن ، لنفترض أن البيانات قد تم جمعها في 500 حالة مع النتائج التالية:

تبلغ قيمة مربع كاي كمحسوبة من الأرقام ، الآن 6.30 ، وهو ضعف القيمة التي تم التوصل إليها في المثال السابق. القيمة 6.30 ذات دلالة إحصائية. لو أننا عبرنا عن النتائج من حيث النسب المئوية لما كان هناك اختلاف في التفسير.

توضح الأمثلة أعلاه نقطة مهمة جدًا ، أي أن مربع chi يتناسب طرديًا مع N. وبالتالي ، نحتاج إلى إجراء لا يتأثر بمجرد تغيير في عدد الحالات. يوفر مقياس phi (ǿ) هذا المرفق ، أي الخاصية التي نرغب بها في قياسنا. هذا القياس هو ببساطة نسبة بين قيمة مربع كاي والإجمالي العددي للحالات المدروسة.

يتم تعريف مقياس phi (ø) على النحو التالي:

Ø = √x ² / n

وهذا هو ، الجذر التربيعي للمي مربع مقسومًا على عدد الحالات.

وبالتالي ، من خلال تطبيق هذه الصيغة على المثالين المذكورين أعلاه اللذين نحصل عليهما ، في الحالة الأولى:

وهكذا ، فإن القياس ، على عكس مربع كاي ، يعطي نفس النتيجة عندما تكون النسب في الخلايا المماثلة متماثلة.

وقد اقترح G. Udny Yule بعد آخر معامل الارتباط عادة ما تسمى "Q" (المعروف أكثر باسم Yule's Q) الذي يقيس الجمعية في؟ س 2 الجدول. يتم الحصول على معامل الارتباط (Q) من خلال حساب النسبة بين الفرق ومجموع المنتجات المتقاطعة للخلايا القطرية ، إذا تم تعيين خلايا الجدول 2 × 2 كما هو موضح في الجدول التالي:

ac-cc / ad + be

حيث تشير a و b و c و d إلى ترددات الخلية.

يختلف معامل الارتباط Q بين ناقص واحد زائد واحد (+1) حيث يكون أقل من أو أكبر من الإعلان. تبلغ Q حدودها الخاصة بـ +1 كلما كان أي من الخلايا صفراً ، أي اكتمال الارتباط (العلاقة مثالية). Q هو صفر عندما تكون المتغيرات مستقلة (أي عندما لا يكون هناك ارتباط) ، أي عندما يكون الإعلان. = كن و. س = 0.

يتم توضيح تطبيق الصيغة المذكورة أعلاه في المثال التالي:

دعونا نحسب معامل اتحاد Yule بين الحالة الزوجية والأداء في الفحص على أساس البيانات المقدمة في الجدول التالي:

استبدال القيم أعلاه في صيغة Yule:

وبالتالي ، هناك ارتباط سلبي طفيف بين الحالة الزواجية والأداء في الفحص.

قد ننظر إلى المشكلة من وجهة نظر أخرى أيضًا.

نسبة الطلاب المتزوجين الذين فشلوا هي = 60 × 100/150 = 40.

نسبة الطلاب غير المتزوجين الذين فشلوا هي ، = 100 × 100/350 = 28.57 (تقريبا)

وبالتالي ، فإن 40 في المائة من الطلاب المتزوجين وما يقرب من 29 في المائة من الطلاب غير المتزوجين قد فشلوا في الامتحان. ومن ثم قد يعزى ضعف أداء الطلاب إلى الحالة الزوجية.

يمكن تأسيس الاستدلالات السببية بشكل آمن في حالات تجريبية. لقد نظرنا في هذه المسألة عند التعامل مع التصاميم التجريبية. في العلوم الاجتماعية ، من الصعب جدا إجراء تجربة ، لذلك فإن معظم الدراسات غير تجريبية. ومع ذلك ، تم وضع إجراءات تحليلية لاستخلاص استنتاجات حول العلاقات السببية في الدراسات غير التجريبية.

بقدر ما تتضمن معظم الأبحاث الاجتماعية دراسة للعينات المأخوذة من "السكان" وتسعى إلى استخلاص تعميمات لهذا "السكان" ، فمن الضروري ، لمصلحة العلم ، معرفة مدى التعميم الذي يتم رسمه على هذا النحو. مبررة.

لنفترض ، في دراسة أجريت على عينات من الطلاب والطالبات ، أن نتائجنا تظهر اختلافات كبيرة بين العيّنتين من حيث عدد الساعات التي تخصصها للدراسة.

قد نتساءل عما إذا كانت الاختلافات التي لوحظت تعكس الاختلافات الحقيقية بين الطلاب والطالبات أو ما إذا كان "تجمّع" الطلاب متشابهين في الواقع من حيث الساعات التي يكرسونها للدراسة ولكن العينات المستقاة من هذه "المجموعات السكانية" للدراسة ربما اختلفت إلى هذا الحد عن طريق "الصدفة".

لقد تم تصميم عدد من الإجراءات الإحصائية لتمكيننا من الإجابة على مثل هذا السؤال من حيث بيانات الاحتمال.

عندما نقارن العينات أو ندرس الفرق بين المجموعات التجريبية والضابطة ، فإننا نرغب عادة في اختبار بعض الفرضيات حول طبيعة الفرق الحقيقي بين "المجموعات السكانية" التي من المفترض أن تمثلها العينات قيد الدراسة.

في العلوم الاجتماعية ، نشعر بالقلق عادة من فرضية الخام نسبيا (على سبيل المثال ، تكرّس الطالبات مزيدًا من الوقت لدراستهن أكثر من الطلاب الذكور).

نحن لسنا عادة في وضع يسمح لنا بالنظر في فرضية أكثر دقة أو تحديدًا (على سبيل المثال ، التي تحدد بدقة الفرق بين "السكان"). لنفترض أن بياناتنا تظهر أن عينة الطالبات يخصصن في المتوسط أربع ساعات للدراسة في حين أن عينة من الطلاب الذكور ، فقط ساعتين.

من الواضح أن نتائج عيناتنا تتوافق مع الفرضية ، أي أن الطالبات يكرسن وقتهن لدراستهن أكثر من نظرائهن من الذكور. لكن يجب علينا أن نضع في اعتبارنا دائمًا إمكانية أن النتائج التي تستند إلى عيناتنا قد لا تكون بالضبط نفس النتائج التي كنا قد توصلنا إليها لو أننا درسنا "مجموعتين" في كل منهما.

الآن ، نريد أن نقدر ما إذا كنا لا نزال نلاحظ المزيد من الوقت المستغرق في الدراسات بين الطالبات ، لو أننا درسنا "مجموع السكان". مثل هذا التقدير ممكن إذا قمنا باختبار "فرضية العدم".

تنص "فرضية العدم" على أن "المجموعات السكانية" لا تختلف من حيث خصائصها قيد الدراسة. في هذه الحالة ، تشير "فرضية العدم" إلى أنه في "تعداد" الطلاب الأوسع ككل ، لا تختلف المجموعات الفرعية للطلاب والطالبات عن الوقت الذي يكرسونه لدراستهم.

لقد تم استنباط تقنيات إحصائية مختلفة تسمى اختبارات الأهمية ، تساعدنا على تقدير احتمالية اختلاف العيّنتين لدينا إلى الحد الذي يمكن أن تكون عليه ، بالصدفة ، حتى إذا لم يكن هناك فرق فعلي بين "مجموعتي" الذكر والطالبات فيما يتعلق بالوقت المخصص للدراسات.

من بين الطرق المختلفة لاختبار أهمية ، يعتمد القرار بشأن الطريقة المناسبة لدراسة معينة على طبيعة القياسات المستخدمة وتوزيع الخصائص (على سبيل المثال ، ساعات الدراسة ، عدد الأطفال ، توقعات المرتبات ، الخ. ).

تفترض معظم هذه الاختبارات ذات الأهمية أن القياسات تشكل مقياس فاصل وأن توزيع الخاصية يقارب منحنى عادي. في البحوث الاجتماعية ، نادراً ما تتطابق هذه الافتراضات مع الواقع. بيد أن التطورات الإحصائية الأخيرة قد خرجت بنوع من الحل لهذا ، في شكل اختبارات غير بارامترية لا ترتكز على هذه الافتراضات.

يجب أن نحاول أن نفهم في هذه المرحلة السبب وراء ضرورة اختبار "الفرضية الصفرية" عندما يكون اهتمامنا الفعلي هو اختبار فرضية (فرضية بديلة ، كما يطلق عليها) تنص على وجود فرق بين "السكان". ممثلة في العينات.

والسبب سهل التقدير. نظرًا لأننا لا نعرف الصورة الحقيقية في "السكان" ، فإن أفضل ما يمكننا القيام به هو إجراء استنتاجات حول هذا الأمر على أساس اكتشاف العيّنات لدينا.

إذا كنا نقارن بين عينتين ، هناك بالطبع احتمالان:

(1) إما أن السكان الذين تمثلهم العينة متشابهون أو

(2) هم مختلفون.

تختلف عيناتنا من "مجموعتين" فيما يتعلق ببعض السمات ؛ ساعات مكرسة للدراسات في مثالنا. من الواضح أن هذا يمكن أن يحدث إذا اختلف "السكان" اللذين تمثلهما العينات في الواقع فيما يتعلق بالسمة المذكورة.

هذا ، ومع ذلك ، لا يشكل دليلا قاطعا على أن هذه "المجموعات" تختلف ، لأن هناك دائما احتمال أن العينات لا تتوافق تماما مع "السكان" الذين يزعمون أنهم يمثلونها.

لذلك يجب أن نسمح بإمكانية أن يكون عنصر الصدفة المشترك في اختيار العينة قد أعطانا عينات تختلف عن بعضها البعض على الرغم من أن "السكان" اللذين يتم رسمهما من خلالهما لا يختلفان في الواقع.

وبالتالي ، فإن السؤال الذي قد نود طرحه هو:

"هل يمكن أن نحصل على عينات مختلفة عن بعضها البعض إلى الحد الذي تفعله ، حتى لو لم تختلف" المجموعات "التي يتم رسمها؟" هذا بالضبط هو السؤال الذي تجيب عليه "فرضية العدم".

وتساعدنا "فرضية العدم" على تقدير ما هي احتمالات أن تكون العيّنتين المختلفتين إلى هذا الحد قد استخلصتا من "تجمعين" متشابهين في الواقع: 5 من كل 100؟ 1 في 100؟ أو أيا كان.

إذا كان الاختبار الإحصائي للدلالة يشير إلى أنه من غير المحتمل أن تكون عينتان مختلفتان إلى هذا الحد قد تم استخلاصهما من "تجمعات" متشابهة في الواقع ، فقد نستنتج أن "المجموعتين" قد تختلفان عن بعضهما البعض.

من النقاط التي يجب أخذها في الاعتبار هنا هي أن جميع الاختبارات الإحصائية ذات الأهمية ، وبالتالي كل التعميمات من العينات إلى السكان ترتكز على افتراض عدم اختيار العينات بطريقة يمكن أن يكون التحيز قد دخل في عملية رسم العينات.

وبعبارة أخرى ، فإن الافتراض هو أن العينة التي اخترناها قد تم رسمها بطريقة تجعل كل الحالات أو العناصر في "السكان" لديها فرصة متساوية أو يمكن تحديدها لإدراجها في العينة.

إذا كان هذا الافتراض غير مبرر ، تصبح اختبارات الأهمية غير ذات معنى وغير قابلة للتطبيق. وبعبارة أخرى ، تنطبق اختبارات الأهمية فقط عند استخدام مبدأ الاحتمالية في اختيار العينة.

لنرجع إلى التوضيح ، لنفترض أن النتائج التي توصلنا إليها لا تظهر أي اختلاف بين العيّنتين: أي أن الطلاب والطالبات في عينة الدراسة يكرسون وقتًا متساوًا لدراستهم.

هل يمكننا بعد ذلك القول بأن "مجموعتي" الطلاب والطالبات متشابهة من حيث هذه السمة؟ بالطبع ، لا يمكننا أن نقول ذلك بأي تأكيد لأن هناك احتمال أن تكون العينات متشابهة عندما يختلف السكان في الواقع.

ولكن بالعودة إلى الحالة التي تختلف فيها العيّنتين ، يمكننا أن نؤكد أن المجموعتين اللتين تمثلهما قد تختلفان إذا أمكننا رفض "فرضية العدم". أي ، إذا استطعنا إظهار أن الفرق بين العيّنتين من غير المحتمل أن يظهر إذا لم تختلف "المجموعات السكانية" المذكورة أعلاه.

ولكن مرة أخرى ، هناك بعض المصادفة أننا قد نكون مخطئين في رفض "فرضية العدم" حيث أنه من طبيعة الاحتمال أنه في بعض الأحيان قد تحدث أحداث غير محتملة للغاية.

هناك جانب آخر لذلك أيضا. وكما قد نكون مخطئين في رفض "فرضية العدم" ، فمن المحتمل أيضًا أننا قد نكون مخطئين في قبول "فرضية العدم". وهذا يعني أنه حتى إذا كان اختبارنا الإحصائي للدلالة يشير إلى أن اختلافات العينة يمكن أن تنشأ بسهولة بالصدفة على الرغم من أن "المجموعات السكانية" متشابهة ، إلا أنه قد يكون صحيحًا أن "السكان" يختلفون في الواقع.

بعبارة أخرى ، نواجه دومًا مخاطرة جعل أحد هذين النوعين من الأخطاء:

(1) قد نرفض "فرضية العدم" عندما يكون ذلك صحيحًا في الواقع ،

(2) قد نقبل "فرضية العدم" عندما تكون في الحقيقة خاطئة.

النوع الأول من الخطأ ، قد نطلق على خطأ النوع الأول. يتألف هذا من استنتاج أن "السكان" يختلفان عندما يكونان متشابهين في الواقع.

النوع الثاني من الخطأ قد يسمى خطأ النوع الثاني. هذا يتمثل في استنتاج أن "السكان" متشابهان في حين أنهما يختلفان في الواقع.

يتم تحديد خطر حدوث الخطأ من النوع الأول بمستوى الأهمية الذي نحن على استعداد لقبوله في الاختبار الإحصائي ، على سبيل المثال 0.05 ، 0.01 ، 0.001 ، إلخ (أي 5 في 100 ، 1 في 100 و 1 في 1000 وهكذا ، إذا قررنا ، على سبيل المثال ، أن السكان يختلفون حقاً كلما أظهر اختبار الأهمية أن الفرق بين العيّنتين من المتوقع أن يحدث بالصدفة ليس أكثر من 5 مرات في 100.

وهذا يعني أنه إذا كان "السكان" الممثلين بالعينة متشابهين في الواقع (من حيث سمة معينة) ، فإننا نقبل 5 فرص في 100 أننا سنكون مخطئين في رفض "فرضية العدم". قد نقوم ، بالطبع ، بتقليل مخاطر ارتكاب الخطأ من النوع الأول من خلال جعل معيارنا لرفض فرضية العدم ، أكثر صرامة وضيقاً.

يجوز لنا ، على سبيل المثال ، أن نقرر مستوى الأهمية عند 0.01 ، أي أننا سنرفض "الفرضية الصفرية" فقط إذا أظهر الاختبار أن الاختلاف في "العينات" قد لا يظهر بالصدفة مرة واحدة إلا بمئة.

في الجوهر ، ما نقوله هو أننا سنرفض "فرضية العدم" إذا أظهر الاختبار أن من بين مائة عينة من حجم معين يتم اختياره من "السكان" المعنيين باستخدام مبدأ الاحتمال ، لن تظهر إلا عينة واحدة فقط من حيث الصفات إلى الحد الذي ينظر إليه في عينتين قيد الدراسة.

يمكن جعل معيار رفض "فرضية العدم" أكثر صرامة من خلال زيادة مستوى الأهمية. لكن الصعوبة هنا هي أن أخطاء النوع الأول والنوع الثاني تحدثان مع بعضهما البعض لدرجة أنه كلما حرصنا على حماية أنفسنا من ارتكاب خطأ من النوع الأول ، كلما أصبحنا أكثر عرضة للإصابة بخطأ من النوع الثاني.

بعد تحديد مدى خطورة الخطأ من النوع الأول الذي نحن على استعداد لتشغيله ، فإن الطريقة الوحيدة لتقليل احتمال حدوث خطأ من النوع الثاني هي أخذ عينات أكبر واستخدام الاختبارات الإحصائية التي تحقق أقصى استخدام للمعلومات ذات الصلة المتاحة.

يمكن توضيح الحالة فيما يتعلق بالخطأ من النوع الثاني بطريقة دقيقة للغاية عن طريق "منحنى مميز مفتوح". يعتمد سلوك هذا المنحنى على حجم العينة. وكلما كانت العينة أكبر ، كان من المحتمل بدرجة أقل أننا سنقبل فرضًا يفترض وجود حالة بعيدة جدًا عن حالة الواقع.

بقدر ما تكون العلاقة بين أخطاء النوع الأول والنوع الثاني معكوسة ، فمن الضروري تحقيق توازن معقول بين نوعي المخاطر.

في العلوم الاجتماعية ، أصبح تقريبًا ممارسة أو اتفاقية راسخة لرفض "فرضية العدم" عندما يشير الاختبار إلى أن الاختلاف بين العينات لن يحدث بالصدفة أكثر من 5 مرات من 100. ولكن المفاهيم مفيدة عندما تكون هناك لا يوجد دليل معقول آخر.

يجب أن يتخذ القرار حول كيفية تحقيق التوازن بين نوعي الخطأ من قبل الباحث. في بعض الحالات ، من المهم أكثر أن تكون على يقين من رفض فرضية عندما تكون خاطئة من الفشل في قبولها عندما يكون صحيحًا. في حالات أخرى قد يكون العكس صحيحًا.

على سبيل المثال ، في بعض البلدان ، يُعتبر أكثر أهمية رفض فرضية الشعور بالذنب عندما يكون باطلاً من الفشل في قبول هذه الفرضية عندما يكون صحيحًا ، أي أن الشخص يعتبر غير مذنب طالما أنه يوجد شك معقول. عن ذنبه. في بعض البلدان الأخرى ، يعتبر الشخص المتهم بارتكاب جريمة مذنبًا حتى يثبت عدم إدانته.

في كثير من الأبحاث ، بطبيعة الحال ، لا يوجد أساس واضح لتحديد ما إذا كان الخطأ من النوع الأول أو النوع الثاني سيكون أكثر تكلفة وبالتالي يستفيد المحقق من المستوى التقليدي في تحديد الدلالة الإحصائية. ولكن قد تكون هناك بعض الدراسات التي من الواضح أن أحد أنواع الخطأ فيها يكون أكثر تكلفة وأكثر ضررًا من الآخر.

لنفترض ، في إحدى المنظمات ، أنه قد تم اقتراح أن تكون طريقة جديدة لتقسيم العمل أكثر فاعلية وتفترض أيضًا أن هذه الطريقة تتطلب الكثير من النفقات.

إذا تم إنشاء تجربة من مجموعتين من الأفراد - أحدهما يعمل كمجموعة تجريبية والآخر ، كمجموعة مراقبة - تم إعداده لاختبار ما إذا كانت الطريقة الجديدة مفيدة بالفعل للأهداف التنظيمية وإذا كان من المتوقع أن تستلزم الطريقة الجديدة الكثير من النفقات ، فإن المنظمة لا ترغب في اعتمادها ما لم يكن هناك قدر كبير من التأكيد على تفوقها.

وبعبارة أخرى ، سيكون من المفيد إجراء خطأ من النوع الأول ، أي أن نستنتج أن الطريقة الجديدة أفضل عندما لا تكون كذلك في الواقع.

إذا استلزم الأسلوب الجديد المصروفات التي كانت تقارب نفس الطريقة القديمة ، فإن خطأ النوع الثاني سيكون غير مرغوب فيه وأكثر ضررا لأنه قد يؤدي إلى فشل الإدارة في تبني الطريقة الجديدة عندما تكون في الواقع متفوقة و على هذا النحو فوائد طويلة المدى في مخزن للمنظمة.

أي تعميمات من العينة إلى "السكان" هي ببساطة بيان الاحتمال الإحصائي. دعونا نقول ، لقد قررنا العمل مع مستوى 0.05 من الأهمية. وهذا يعني أننا سنرفض "الفرضية الصفرية" فقط إذا كان من المتوقع أن يحدث اختلاف العينة من الحجم الذي لاحظناه عن طريق الصدفة لا أكثر من 5 مرات في 100.

بالطبع ، سوف نقبل "الفرضية الصفرية" إذا كان من المتوقع حدوث هذا الاختلاف عن طريق الصدفة أكثر من 5 مرات من 100. والسؤال الآن هو: هل تمثل النتائج التي توصلنا إليها واحدة من تلك الـ5 مرات التي قد يحدث فيها هذا الاختلاف. ظهرت بالصدفة؟

لا يمكن الإجابة عن هذا السؤال بشكل نهائي على أساس النتائج المعزولة. ومع ذلك ، قد يكون من الممكن لنا أن نقول شيئًا عن هذا عندما نفحص الأنماط الموجودة في النتائج التي توصلنا إليها.

لنفترض أننا مهتمون باختبار تأثيرات فيلم حول المواقف تجاه برنامج حكومي معين ، مثل تنظيم الأسرة. لدينا ، دعنا نقول ، عناية كاملة للحفاظ على الظروف المرغوبة للتجريب في الحد الأقصى.

لنفترض الآن أننا نستخدم مقياسًا واحدًا للمواقف تجاه البرنامج ، فقط عنصرًا واحدًا ، أي الموقف تجاه المباعدة بين الأطفال ، ويجد أن أولئك الذين رأوا الفيلم أكثر ميلاً إلى هذه المسألة أكثر من أولئك الذين لم يروا الفيلم.

الآن لنفترض أن الاختبار الإحصائي يبين أن الفرق لم يكن بالصدفة بسبب تقلبات العينة العشوائية أكثر من مرة واحدة في عشرين. منطقيا ، هذا يعني أيضا أنه قد يبدو بالصدفة مرة واحدة في عشرين (أو 5 مرات في 100). كما أشرنا ، ليس لدينا طريقة محددة لمعرفة ما إذا كانت عينتنا واحدة من بين كل خمسة في المائة. والآن ، ما أفضل ما يمكننا القيام به؟

دعنا نقول ، لقد طرحنا 40 سؤالًا مختلفًا على المستجيبين ، وهي مؤشرات معقولة للموقف تجاه البرنامج الحكومي لرعاية الأسرة. إذا كنا نستخدم مستوى ثقة بنسبة 5٪ وإذا طلبنا 100 سؤال ، فقد نتوقع العثور على فروق ذات دلالة إحصائية تعزى إلى الصدفة في 5 منها.

وبالتالي ، قد نتوقع العثور على فروق ذات دلالة إحصائية على 2 منهم ، من بين 40 سؤالًا حول البنود المختلفة. لكن ، لنفترض أننا وجدنا في الواقع 25 سؤال من أصل 40 سؤالًا حول أولئك الذين رأوا أن الفيلم يتمتع بمواقف أكثر تفضيلاً مقارنة بمن لم يروا الفيلم.

قد نكون ، في هذه الحالة ، أكثر أمانًا في استنتاج أن هناك اختلافًا حقيقيًا في المواقف (على الرغم من أن الاختبار الإحصائي يشير إلى أن الاختلاف ربما نشأ بالصدفة على كل سؤال 5 مرات في 100).

لنفترض الآن أنه من بين الأسئلة الأربعين ، أظهرت الإجابات على سؤال واحد فقط ، أي حول المباعدة بين الأطفال ، فرقاً يعتد به إحصائياً بين المجموعتين اللتين تتعرضان للفيلم وأولئك الذين ليسوا كذلك. قد يحدث هذا الاختلاف أيضًا عن طريق الصدفة.

من ناحية أخرى ، قد يكون محتوى الفيلم في الواقع يؤثر على الآراء حول هذه النقطة ولكن ليس على أي شيء آخر (مثل تلك المتعلقة بعمليات العقم). ولكن ما لم تكن فرضيتنا قد تنبأت سلفًا سلفًا بأن الفيلم سيكون أكثر احتمالًا للتأثير على المواقف تجاه المباعدة بين الأطفال من المواقف تجاه أي من الأسئلة الـ 39 الأخرى ، فإننا لسنا مبررين في تقديم هذا التفسير.

ويعرف مثل هذا التفسير ، أي التفسير الذي استند إلى شرح النتائج بعد عرضها ، بتفسير "ما بعد الوقائع" ، لأن هذا يتضمن تفسيرات مقدمة لتبرير النتائج مهما كانت. يعتمد ذلك على براعة الباحث ، على التفسير الذي يستطيع اختراعه لتبرير هذه النتائج. وبالتالي ، يمكنه تبرير النتائج المعاكسة.

لقد أوضح ميرتون بجلاء أن التفسيرات التي تلي مفعول الفعل تهدف إلى "تفسير" الملاحظات. طريقة تفسير ما بعد الواقع مرنة تمامًا. إذا وجد الباحث أن العاطلين عن العمل يميلون إلى قراءة عدد أقل من الكتب عما كانوا يفعلون سابقاً ، فإن هذا قد "يفسر" من خلال فرضية أن القلق الناتج عن البطالة يؤثر على التركيز وبالتالي تصبح القراءة صعبة.

ومع ذلك ، إذا لوحظ أن العاطلين عن العمل يقرأون كتباً أكثر مما كان في السابق (عندما يكونون في العمل) ، يمكن التذرع بتفسير جديد بعد الوقائع ؛ التفسير هو أن العاطلين عن العمل لديهم المزيد من الترفيه ، وبالتالي ، يقرأون المزيد من الكتب.

إن الاختبار الحاسم حول "العلاقة التي تم الحصول عليها (بين المتغيرات) ليس هو المبررات والتعليل اللاحق لها. بل هي القدرة على التنبؤ بها أو التنبؤ بعلاقات أخرى على أساسها. وبالتالي ، فإن اكتشافنا الذي لم يكن متوقعًا من قبل ، والذي يمثل اختلافًا في المواقف تجاه المباعدة بين الأطفال ، حتى وإن كان مهمًا من الناحية الإحصائية ، لا يمكن اعتباره ثابتًا في الدراسة التي أجريناها.

بما أن البيانات الإحصائية هي عبارة عن بيانات الاحتمال ، لا يمكننا أبدًا الاعتماد كليًا على الدليل الإحصائي وحده لتحديد ما إذا كنا سنقبل فرضية على أنها صحيحة أم لا.

تتطلب الثقة في تفسير نتيجة البحث ليس فقط الثقة الإحصائية في موثوقية الاكتشاف (أي أن الاختلافات لا يحتمل حدوثها عن طريق الصدفة) ولكن بالإضافة إلى بعض الأدلة حول صحة الافتراضات المسبقة للبحث.

هذا الدليل هو بالضرورة غير مباشر. إنها تأتي من تطابق نتائج البحوث المعينة مع المعارف الأخرى التي صمدت أمام اختبار الزمن ، وبالتالي هناك تأكيد كبير.

وحتى في أكثر التحقيقات دقة ، فإن إرساء الثقة في تفسير نتائج المرء أو في اعتباره العلاقات السببية يتطلب تكرار البحث وربط النتائج بنتائج الدراسات الأخرى.

من الضروري ملاحظة أنه حتى عندما تشير الاختبارات الإحصائية ونتائج عدد من الدراسات إلى وجود فرق ثابت بين مجموعتين أو علاقة ثابتة بين متغيرين ، فإن هذا لا يشكل دليلاً على سبب العلاقة.

إذا أردنا استخلاص الاستدلالات السببية (على سبيل المثال ، تنتج X ص) ، يجب علينا تلبية الافتراضات وفوق تلك المطلوبة لإقامة وجود علاقة. وتجدر الإشارة أيضًا إلى أن النتيجة ليست مهمة اجتماعيًا أو نفسيًا فقط لأنها ذات دلالة إحصائية. قد تكون العديد من الاختلافات ذات الدلالة الإحصائية تافهة في اللغة الاجتماعية العملية.

على سبيل المثال ، قد يكون متوسط فرق أقل من نقطة حاصل ذكاء واحد بين سكان المناطق الحضرية والريفية إحصائيًا كبيرًا ، ولكن ليس كذلك في الحياة اليومية العملية. على العكس ، هناك حالات يكون فيها الاختلاف الصغير ولكن الموثوق له أهمية عملية كبيرة.

في مسح واسع النطاق ، على سبيل المثال ، قد يمثل الفرق بين نصف أو واحد في المائة مئات الآلاف من الأشخاص ، وقد يكون الوعي بالفرق مهمًا لقرارات السياسة الهامة. لذلك ، يجب على الباحث ، بالإضافة إلى اهتمامه بالدلالة الإحصائية لنتائجه ، أن يهتم أيضاً بمعانيهما الاجتماعية والنفسية.

استنتاج العلاقات السببية:

بسبب الصعوبات الواضحة ، نادرا ما يمكن وضع مثل هذه التصاميم التجريبية الصلبة في التحقيقات العلمية الاجتماعية. معظم الاستفسارات في العلوم الاجتماعية غير تجريبية في الشخصية.

في مثل هذه الدراسات ، توجد بعض العقبات التجريبية في طريقة تحديد ما إذا كانت العلاقة بين المتغيرات سببية أم لا. وقد ذكر مرارا وتكرارا أن واحدة من أصعب المهام في تحليل بيانات السلوك الاجتماعي هو إنشاء علاقات السبب والنتيجة.

هناك موقف إشكالي يدين بأصله وعملية التحول ، ليس فقط إلى عامل واحد ولكن إلى مجموعة معقدة من العوامل والتسلسلات.

تشكل عملية فصل هذه العناصر تحديًا كبيرًا للخيال الاجتماعي وتضع اختبارًا لباحثة الباحثين. من الخطورة اتباع تفسير "المسار الواحد" الذي يؤدي إلى السبب. من الضروري البحث عن مجموعة كاملة من العوامل السببية التي تلعب عادة دورًا مهمًا في تحقيق المواقف الاجتماعية المعقدة.

وكما يلاحظ كارل بيرسون على نحو مناسب ، "لا توجد ظاهرة أو مرحلة في التسلسل لها سبب واحد فقط. كل المراحل السابقة هي أسباب متلاحقة ؛ عندما نقرر لأسباب علمية ، فإننا في الحقيقة نصف المراحل المتعاقبة من روتين التجربة. "

لقد أدرك كل من Yule و Kendall حقيقة أن الإحصائيات "يجب أن تقبل للتحليل ، والبيانات الخاضعة لتأثير مجموعة من الأسباب ، ويجب أن تحاول أن تكتشف من البيانات نفسها التي تسبب الأسباب المهمة ، وكم من التأثير المرصود يرجع إلى عملية كل ".

لقد تتبع بول لازارسفيلد المراحل التي ينطوي عليها الأسلوب الذي يطلق عليه "التمييز". ينادي استخدامه في تحديد العلاقات السببية بين المتغيرات. يضع لازارسفيلد هذا الإجراء:

(أ) التحقق من وقوع مزعوم على النحو التالي:

من أجل التحقق من هذا الحدوث ، من الضروري التأكد مما إذا كان الشخص قد شهد بالفعل المواقف المزعومة. إذا كان الأمر كذلك ، كيف يظهر الوجود نفسه وتحت أي ظروف ، في حياته المباشرة؟

ما هي الأسباب المتقدمة للاعتقاد بأن هناك ترابط معين بين متغيرين ، على سبيل المثال ، فقدان العمل وفقدان السلطة؟ كيف الصحيح هو المنطق الشخص في هذه الحالة بالذات؟

(ب) محاولة اكتشاف ما إذا كانت الحالة المزعومة تتفق مع الحقائق الموضوعية للحياة الماضية لهذا الشخص.

(ج) اختبار كل التفسيرات المحتملة للشرط المرصود.

(د) استبعاد تلك التفسيرات التي لا تتفق مع نمط الأحداث.

من المفهوم تماما أن معظم الصعوبات أو العقبات التي تحول دون إقامة علاقات سببية تصيب الدراسات غير التجريبية بحدة. في الدراسات غير التجريبية حيث يكون الاهتمام في إقامة علاقات سببية بين متغيرين ، يجب أن يجد الباحث بدائل للضمانات التي يتم بناؤها بشكل واضح في الدراسات التجريبية.

تدخل العديد من هذه الضمانات في وقت جمع البيانات التخطيط ، في شكل توفير لجمع المعلومات حول عدد من المتغيرات التي قد تكون الظروف البديلة لإنتاج التأثير المفترض.

من خلال إدخال هذه المتغيرات الإضافية في التحليل ، يقارب الباحث بعض الضوابط المتأصلة في التجارب. ومع ذلك ، فإن رسم استنتاجات السببية يبقى دائمًا خطيرًا إلى حد ما في الدراسات غير التجريبية.

سنناقش الآن بعض المشاكل والاستراتيجيات للتغلب عليها ، المتعلقة برسم استنتاجات حول السببية في الدراسات غير التجريبية. إذا أشارت دراسة غير تجريبية إلى علاقة أو ارتباط بين متغيرين ، قل X و Y ، وإذا كانت الفائدة البحثية في العلاقات السببية بدلاً من حقيقة الارتباط البسيط بين المتغيرات ، فقد اتخذ التحليل الخطوة الأولى فقط.

يجب على الباحث النظر أكثر (إلى جانب الارتباط بين X و Y) سواءً كان Y (التأثير) قد حدث قبل X (السبب المفترض) ، وفي هذه الحالة لا يمكن أن يكون Y تأثير X.

بالإضافة إلى هذا الاعتبار ، يجب على الباحث أن يتأمل في المسألة ما إذا كانت عوامل أخرى غير X (السبب المفترض) قد تكون أنتجت Y (التأثير المفترض). وعادة ما يتم الاهتمام بهذا عن طريق إدخال متغيرات إضافية في التحليل وفحص كيفية تأثر العلاقة بين X و Y بهذه المتغيرات الأخرى.

إذا استمرت العلاقة بين X و Y حتى عندما يتم إدخال متغيرات أخرى فعالة ومن المحتمل أن تكون بديلة ، فإن الفرضية القائلة بأن X هي سبب Y تظل قابلة للإستمرار.

على سبيل المثال ، إذا لم تتغير العلاقة بين تناول فاكهة موسمية معينة (X) والبرد (Y) حتى عندما يتم إدخال متغيرات أخرى مثل العمر ودرجة الحرارة وحالة الهضم وما إلى ذلك ، في التحليل ، قد نقبل الفرضية القائلة بأن X يؤدي إلى Y كعنصر مستقر.

ولكن من الممكن في عدد قليل من الحالات أن يؤدي إدخال متغيرات إضافية أخرى إلى تغيير العلاقة بين X و Y. وقد يقلل ذلك لإزالة العلاقة تمامًا بين X و Y أو قد يعزز العلاقة في مجموعة واحدة ويقللها. في آخر.

إذا تم تعزيز العلاقة بين X (تناول الفاكهة الموسمية) و Y (البارد) في مجموعة فرعية تتميز Z (حالة سوء الهضم) وخفضها في المجموعة الفرعية التي لا تتميز بـ Z (الحالة الطبيعية للهضم) ، قد يستنتج أن Z هي الشرط الطارئ للعلاقة بين X و Y.

وهذا يعني ، بعبارة أخرى ، أننا استطعنا تحديد الشرط (Z) الذي تحمله العلاقة بين X و Y. الآن إذا كان إدخال Z في التحليل يقلل أو يقضي تمامًا على العلاقة بين X و Y ، فسوف نكون آمنين في الختام إما أن X ليست منتجة لـ Y ، أي أن العلاقة بين X و Y هي "زائفة" أو لقد تتبعنا العملية التي يؤدي بها X إلى Y (أي ، من خلال Z).

دعونا ننتقل إلى النظر في الحالة التي يمكننا فيها أن نستنتج بصورة مشروعة أن العلاقة بين X و Y زائفة.

يقال إن العلاقة الواضحة بين متغيرين X و Y مزعجة إذا لم ينشأ التباين المصاحب لها من اتصال بينهما ولكن من حقيقة أن كل واحد منهم (X و Y) مرتبط ببعض المتغير الثالث (Z) أو توليفة من المتغيرات التي لا تعمل كحلقة في العملية التي يؤدي بها X إلى Y.

قد يتم تخطيط الحالة التي تميز العلاقة التافهة باعتبارها ضمن:

الهدف هنا هو تحديد سبب Y ، المتغير التابع (دعنا نقول ، التوقع النقدي من قبل خريجي الجامعات). العلاقة (الخط المكسور) بين X المتغير المستقل (دعنا نقول ، الدرجات التي حصل عليها الطلاب) والتوقعات النقدية للخريجين (Y) تمت ملاحظتها في سياق تحليل البيانات.

يتم إدخال متغير آخر (Z) لمعرفة كيف تتصرف العلاقة بين X و Y مع إدخال هذا العامل الثالث. Z هو العامل الثالث (دعنا نقول ، مستوى دخل أولياء أمور الطلاب). نجد أن إدخال هذا العامل يقلل من العلاقة بين X و Y.

أي أنه يتبين أن العلاقة بين الدرجة الأعلى في الفحص والتوقعات النقدية الأعلى لا تصمد ، ولكنها تقلص إلى حد كبير عندما نقدم المتغير الثالث ، أي مستوى دخل الوالدين.

إن مثل هذه المقدمة لـ Z تُظهر حقيقة أنه ليس من الممكن أن يكون X ولكن Z عاملًا محددًا لـ Y. لذا ، فإن العلاقة بين X و Y (كما هو موضح في الرسم البياني بخط منقط) هي كلمة زائفة ، في حين أن العلاقة بين Z و Y هي واحدة حقيقية. دعونا نوضح ذلك بمساعدة بيانات افتراضية.

لنفترض ، في سياق تحليل البيانات في إحدى الدراسات ، أنه كان هناك ارتباط كبير بين الدرجات أو الأقسام (الأول والثاني والثالث) التي حصل عليها الطلاب في الامتحان والراتب الذي يتوقعونه في وظيفة قد يتم تعيينهم.

على سبيل المثال ، كان يُنظَر إلى أن التقسيمات الأولى بين الطلاب كانوا يتوقعون ارتفاعًا في الأجر مقارنةً بالقسمين الثانيين ، بينما كان التقسيم الثاني أكثر توقعًا مقارنة بالشُعب الثالثة.

يوضح الجدول التالي الحالة الافتراضية للأمور:

يُنظر بوضوح من الجدول إلى أن هناك أساسًا لافتراض أن درجات الطلاب تحدد توقعاتهم حول الرواتب. لنفترض الآن أن الباحث ضرب بطريقة ما فكرة أن مستوى دخل الوالدين (X) يمكن أن يكون أحد المتغيرات المهمة التي تحدد أو تؤثر على توقعات الطلاب حول الرواتب (Y). وهكذا ، يتم إدخال Z في التحليل.

لنفترض أن الجدول التالي يمثل العلاقة بين المتغيرات:

ملحوظة:

HML في الصف الأفقي ، وتقسيم كل فئة من درجات الطلاب ، تقف على التوالي لمستوى الدخل العالي للوالدين ، ومستوى دخل الوالدين المعتدل وانخفاض مستوى دخل الوالدين. يوضح الجدول أعلاه بوضوح أن العلاقة بين X و Y أصبحت أقل أهمية مقارنة بالعلاقة بين Z و Y.

للحصول على صورة أوضح ، دعنا نرى الجدول التالي (نسخة من جدول B بإهمال فئات X) تظهر العلاقة بين Z و ، أي مستوى دخل الوالدين والتوقعات النقدية للطلاب:

يمكننا أن نرى بوضوح من الجدول أنه بغض النظر عن درجاتهم ، فإن توقعات الطلاب النقدية تتأثر بشدة بشدة بمستويات دخل الوالدين (Z).

نرى أن عددًا كبيرًا من الطلاب (أي 91.5٪) لديهم توقعات نقدية عالية هم من مجموعة الدخل المرتفع ، 92٪ لديهم توقعات نقدية معتدلة من مجموعة الدخل المعتدل للوالدين وأخيراً ، 97٪ لديهم توقعات نقدية منخفضة من مجموعة دخل منخفضة.

وبمقارنة هذه الصورة بالصورة التي يمثلها الجدول A ، قد نقول إن العلاقة بين X و Y غير منطقية ، أي أن درجة الطلاب لم تحدد بشكل أساسي مستوى التوقعات النقدية للطلاب.

من الملاحظ في الجدول (أ) أن الطلاب الذين يحصلون على درجة أعلى يظهرون ميلًا كبيرًا نحو توقعات نقدية أعلى ، في حين أن طلاب الصف الأول لديهم تركيز ملحوظ جدًا في شريحة التوقعات النقدية الأقل.

ولكن عندما ندخل المتغير الثالث للدخل الأبوي ، تصبح الصورة الناشئة واضحة بما فيه الكفاية لتبرير الاستنتاج بأن العامل الحقيقي لمستويات التباين المسؤولة للتوقعات النقدية هو مستوى دخل الوالدين.

في الجدول (ج) ، نرى تركيزًا قويًا وقويًا لحالات الطلاب المقابلة للثلاث تحت التجمعات المذكورة ، بمعنى ارتفاع التوقعات النقدية وارتفاع دخل الوالدين ، والتوقعات النقدية المعتدلة ، والدخل المعتدل للوالدين ، وتوقعات نقدية أقل ، انخفاض دخل الوالدين ، أي 5٪ ، 92.1٪ و 1٪ على التوالي.

تتبع العملية المتضمنة وعلاقتها بين المتغيرات: كما ذكرنا سابقًا ، إذا كان العامل الثالث Z يقلل أو يزيل العلاقة بين المتغير المستقل X والمتغير التابع Y ، فقد نستنتج إما أن العلاقة بين X و Y غير صحيحة ، أو أننا تمكنا من تتبع العملية التي يؤدي بها X إلى Y.

سننظر الآن في الظروف التي تبرر الاستنتاج بأن عملية العلاقة بين X و Y تم تتبعها من خلال العامل الثالث Z.

لنفترض ، في إحدى الدراسات ، أن الباحثين وجدوا أن المجتمعات الأصغر حجماً لديهم درجة أعلى من الحميمية المتوسطة ، وكانت درجة الحميمية هي مقياس لحميّة الارتباط بين أفراد المجتمع الذي وصل إليه باستخدام مقياس حميمي.

لنفترض ، وجدوا أيضا أن المجتمعات المتوسطة الحجم لديها درجة أقل من الحميمية مقارنة بالمجتمعات الصغيرة الحجم والمجتمعات ذات الحجم الكبير لديها أقل درجة من درجات الحميمية المتوسطة. تشير هذه النتيجة إلى أن حجم المجتمع يحدد العلاقة الحميمة للارتباط بين أفراد المجتمع.

وبعبارة أخرى ، فإن الملاحظات تستدعي الاستنتاج القائل بأن الأعضاء الذين يعيشون في مجتمع صغير الحجم لديهم علاقة أكبر في الارتباط ، في حين أن المجتمعات ذات الحجم الكبير تتميز بعلاقة ارتباط أقل بين الأعضاء.

يوضح الجدول التالي البيانات الافتراضية:

في العمود الثاني من الجدول ، تم عرض عينات مقابلة لكل مجتمع.

في العمود الثاني من الجدول ، تم عرض عينات مقابلة لكل مجتمع. في العمود 3 ، تم عرض متوسط درجات الحميمية المقابلة لأنواع المجتمعات المحسوبة على أساس الردود المقدمة لبعض البنود على مقياس يتعلق بالارتباطات اليومية بين الأعضاء.

يتضح من الجدول أن متوسط درجات الحميمية يتغير عكسياً مع حجم المجتمع ، أي أصغر حجمًا ، كلما ازدادت درجة الحميمية والعكس ، كلما كان الحجم أكبر ، كلما قلت درجة الحميمية.

لنفترض الآن أن الباحثين قد توصلوا إلى فكرة أن الأنواع الثلاثة من المجتمعات ستختلف من حيث الفرص التي تتيحها للتفاعل بين الأعضاء ، بقدر ما تروج الترتيبات المعيشية ، والنمط السكني ، والمرافق العامة الشائعة ، وما إلى ذلك ، مثل هذا الارتباط.

وبالتالي ، فإن المحققين سيقدمون العامل الثالث في تحليل إمكانات التفاعل ، أي إلى أي مدى من المرجح أن توفر الظروف التي يعيش فيها الأشخاص فرصًا للتفاعل فيما بينهم.

من أجل التحقق من فرضية أنه من خلال الاختلافات في الزخارف السكنية ، وترتيبات المعيشة ، والمرافق المشتركة عادة ، أن الأنواع الثلاثة للمجتمعات أنتجت اختلافات في التفاعل بين أفراد المجتمع ، فإن المحققين سينظرون في حجم المجتمع و إمكانية التفاعل معًا فيما يتعلق بمتوسط درجة الحميمية.

وبالتالي ، فإن إمكانات المخالفة هي المتغير الثالث الذي أدخل في التحليل. وتصنف إمكانات التفاعل ، دعنا نقول ، إلى إمكانات تفاعل متوسط التفاعل (b) منخفضة ، و (c) إمكانية تفاعل عالية.

يمثل الجدول التالي البيانات الافتراضية:

عند قراءة الصفوف في الجدول ، نرى أن التفاعل بين التفاعلات يرتبط ارتباطًا وثيقًا بدرجة الحميمية لأفراد المجتمع ، بغض النظر عن حجم المجتمع.

أي ، إذا نظرنا إلى صف للمجتمعات الصغيرة الحجم ، أو للمجتمعات متوسطة الحجم ، أو للمجتمعات كبيرة الحجم ، فهناك في كل حالة زيادة في متوسط درجة الحميمية مع زيادة في إمكانات التفاعل. علاوة على ذلك ، عند قراءة المدخلات عبر الصفوف ، يصبح من الواضح أن حجم المجتمع وإمكانية التفاعل يحملان ارتباطًا كبيرًا.

على سبيل المثال ، ما يقرب من ثلثي المجيبين في مجتمع صغير الحجم يعيشون في ظروف تتسم بقدر عالٍ من التفاعل ؛ كما نجد أن نسبة أقل بكثير من سكان المجتمع متوسط الحجم يعيشون في ظروف عالية التفاعل المحتملة ونسبة صغيرة جدًا من سكان المجتمع المحلي ذات الحجم الكبير في ظل ظروف عالية التفاعل المحتملة.

الآن ، نقرأ الدرجات الحميمية أسفل الأعمدة فقط لتجد أن العلاقة بين نوع المجتمع وحميمية الارتباط تقلصت بشكل كبير. في الواقع ، بالنسبة للأشخاص الذين يعيشون في ظل ظروف محتملة التفاعل عالية ، لا توجد علاقة محددة بين حجم المجتمع والنتيجة الألفة.

من هذه المجموعة من العلاقات ، قد يخلص المحققون إلى أن العلاقة العكسية بين حجم المجتمع والعلاقة الحميمة جيدة ، لكن إحدى الطرق الرئيسية التي يشجع فيها نوع معين من المجتمع العلاقة الحميمة بين أعضائه هو تقديم الفرص التي تزيد من معدل التفاعل فيما بينها.

بعبارة أخرى ، تتسم المجتمعات الصغيرة الحجم بمتوسط درجة أعلى من الحميمية لأن حجمها الصغير يوفر بيئة للعديد من الفرص لدرجة عالية من التفاعل بين الأعضاء. من ناحية أخرى ، تتميز المجتمعات كبيرة الحجم بدرجة حميمية أقل نسبيًا.

لكن درجة الحميمية الأدنى تُعزى ليس إلى حجم المجتمع في حد ذاته ولكن إلى حقيقة أن المجتمع الكبير الحجم لا يستطيع أن يوفر فرصًا للتفاعل الأعلى بين الأعضاء كما تفعل المجتمعات الصغيرة الحجم.

ومن ثم ، فإن الباحثين بدلاً من الاستنتاج بأن العلاقة بين حجم المجتمع ومعدل درجة الحميمية بين الأعضاء غير منطقي ، قد يستنتجون أنهم قد تمكنوا من تتبع العملية التي يؤثر فيها X {أي ، نوع المجتمع) Y (درجة الودية).

وتضمن التقرير السابق الاستنتاج القائل بأن العلاقة بين المتغيرين X و Y كانت زائفة ، وأن الاستنتاج الأخير هو أن العملية من X إلى Y يمكن تتبعها من خلال Z (X إلى Z إلى Y). في كلتا الحالتين ، أدى إدخال المتغير الثالث Z إلى تقليل العلاقة بينهما (س و ص) أو القضاء عليها.

ومع ذلك ، يمكن ملاحظة فارق واحد. في المثال الأول ، كان المتغير Z (أي مستوى دخل الوالدين) واضحًا مسبقًا قبل المتغيرين الآخرين (درجة الطلاب في الامتحان والتوقعات النقدية للطلاب).

في المثال الثاني ، لم يحدث المتغير الثالث Z (إمكانية التفاعل التي توفرها المجتمعات) قبل المتغير السببي المفترض (حجم المجتمع). كان متزامنا معها ويمكن التفكير في البدء بها بعد ذلك.

وبالتالي ، فإن التسلسل الزمني للمتغيرات هو اعتبار مهم في تقرير ما إذا كانت العلاقة السببية الظاهرة غير صحيحة. وهذا يعني أنه إذا كان المتغير الثالث Z ، الذي يزيل أو يزيل العلاقة بين المتغيرات ذات الصلة X و Y ، فإننا نخلص عادة إلى أن العلاقة السببية الظاهرة بين المتغيرين X و Y غير منطقية.

ولكن إذا كان المتغير الثالث Z معروفًا أو يُفترض أنه حدث في نفس الأوقات مثل X أو بعد X ، فيمكن أن نستنتج أن العملية التي يؤدي بها X إلى Y قد تم تتبعها.وبالتالي ، يجب أن يكون هناك مقياس معين الثقة في العلاقة السببية المستنبطة من الدراسات غير التجريبية في الشخصية ، فمن الضروري إخضاعها للاختبار الحرج للتخلص من المتغيرات الأخرى ذات الصلة.

لهذا السبب ، من المهم أن تجمع في سياق الدراسة ، بيانات عن هذه المتغيرات التي قد تكون مؤثرة بخلاف تلك التي تهتم بها فرضية الدراسة مركزيا.

وقد ذكر في وقت سابق أن إدخال متغير ثالث في التحليل قد يكون له تأثير في تكثيف العلاقة داخل مجموعة فرعية واحدة وتخفيضه في مجموعة فرعية أخرى. إذا كان الأمر كذلك ، فنحن نقول إننا حددنا شرطًا (Z) تحته العلاقة بين X و Y.

دعونا الآن توضيح عملية المواصفات. لنفترض ، في دراسة مجتمعية ، أننا نحدد العلاقة بين الدخل والمستوى التعليمي.

هذا موضح في الجدول أدناه:

نرى في الجدول أن العلاقة بين التعليم والدخل هي علاقة واضحة إلى حد ما. أعلى التعليم ، وعموما ، أعلى نسبة من الحالات التي يدر دخلاً سنوياً بـ5000 روبية / وأكثر. ومع ذلك ، قد نقرر أن العلاقة تتطلب مواصفات إضافية.

أي أننا قد نرغب في معرفة المزيد عن الظروف التي تحصل عليها هذه العلاقة. لنفترض أن الفكر يلفت انتباهنا إلى حقيقة أن المستجيبين الذين يعيشون في مجتمع حضري - صناعي قد يؤثرون إيجابًا على مزايا التعليم في العمالة المجزية وبالتالي على انعكاسها في الدخل.

على هذا الافتراض ، نقدم العامل الثالث Z ، أي أولئك المستجيبين الذين يعيشون في المجتمع الصناعي الحضري والذين يعيشون في المجتمع الريفي غير الصناعي ، في التحليل ويرون كيف يؤثر على العلاقة الأولية بين X و Y ( أي التعليم والدخل).

لنفترض أننا نحصل على صورة كما هو موضح في الجدول التالي:

يمكننا أن نرى بوضوح أن الجدول B يعكس علاقة مختلفة للغاية بين الدخل والتعليم للأشخاص الذين يعيشون في المجتمع الريفي وغير الصناعي بالمقارنة مع أولئك الذين يعيشون في المجتمع الحضري الصناعي. ونرى أنه بالنسبة لأولئك الذين يعيشون في المدن الصناعية ، فإن العلاقة بين التعليم والدخل أعلى إلى حد ما من العلاقة الأصلية.

ولكن بالنسبة للذين يعيشون في المجتمعات الريفية غير الصناعية ، فإن العلاقة في الجدول أعلاه أقل بكثير من العلاقة الأولية.

وبالتالي ، فإن إدخال العامل الثالث وانقطاع العلاقة الأصلية على أساس العامل الثالث (Z) قد ساعد على تحديد حالة تكون فيها العلاقة بين X و Y أكثر وضوحًا كما هو الحال أيضًا العلاقة أقل وضوحا.

على نحو مماثل ، لنفترض في سياق دراسة أن الأشخاص الذين ينتمون إلى فئة الدخل الأعلى لديهم عدد أقل بشكل عام من الأطفال مقارنةً بالأفراد ذوي الدخل المنخفض. لنفترض أننا نشعر (على أساس التوجه النظري) بأن عامل المدن قد يكون مهمًا في التأثير على العلاقة.

إذا افترضنا هذا العامل ، فإننا نجد أن العلاقة الأصلية بين مستوى الدخل وعدد الأطفال تصبح أكثر وضوحًا في المدينة ، وأن ذلك يصبح أقل وضوحًا بين سكان الريف ، من تحديدنا لحالة Z (أي مسكن المدينة). ) التي بموجبها تصبح العلاقة معززة بشكل حاسم أو واضحة.

تفسير نتائج الدراسة:

حتى الآن ، نحن قلقون بشكل رئيسي من الإجراءات التي تشمل ، ما نسميه عادة ، تحليل البيانات. غير أن مهمة الباحث غير مكتملة إذا توقف عن طريق عرض النتائج التي توصل إليها في شكل تعميمات تجريبية يمكن الوصول إليها من خلال تحليل البيانات.

الباحث الذي ، على سبيل المثال ، يختتم تمرينه البحثي فقط من خلال القول بأن "الأشخاص غير المتزوجين لديهم نسبة أكبر من الانتحار مقارنة بالزواج" لا يكاد يحقق التزامه الشامل بالعلوم ، على الرغم من التعميم التجريبي الذي وضعه لديه بعض القيمة في حد ذاته.

كما يجب أن يسعى الباحث في الاهتمام الأكبر للعلم لإظهار أن ملاحظته تشير إلى بعض العلاقات والعمليات التي تم إخفاؤها في البداية للعين. وبعبارة أخرى ، يجب على الباحث أن يثبت أن ملاحظته لها معنى ، أوسع وأعمق بكثير ، من تلك التي يبدو أن لها على السطح.

وللرجوع إلى مثالنا للانتحار ، يجب أن يتمكن الباحث من إظهار أن ملاحظته التي تقول إن "الأشخاص غير المتزوجين يتميزون بالانتحار" يعكس ، في الواقع ، العلاقة الأعمق بين التماسك الاجتماعي ومعدل الانتحار (نظرية دوركهايم).

وبمجرد أن يتمكن الباحث من كشف العلاقات والعمليات التي تكمن وراء اكتشافاته الملموسة ، يمكنه أن يقيم علاقات مجردة بين النتائج التي توصل إليها ومختلف الآخرين.

في جوهرها ، يتجاوز عمل الباحث نطاق جمع البيانات وتحليلها. تمتد مهمته لتفسير نتائج دراسته. من خلال التفسير ، يمكن للباحث أن يفهم الأهمية الحقيقية لاستنتاجاته ، أي أنه يستطيع أن يقدر لماذا تكون هذه النتائج هي ما هي عليه.

وكما ذكرنا سابقًا ، فإن التفسير هو البحث عن معان أوسع وأكثر تجريدًا لنتائج البحث. ينطوي هذا البحث على عرض نتائج البحث في ضوء المعرفة الراسخة الأخرى ، أو النظرية أو المبدأ. هذا البحث له جانبان رئيسيان.

يشمل الجانب الأول الجهد المبذول لإنشاء استمرارية في البحث من خلال ربط نتائج دراسة معينة بآخر دراسة أخرى. من خلال التفسير ، يمكن للباحث أن يتفكك أو يدرك المبدأ المجرد تحت الملاحظات التجريبية الملموسة.

هذا القاسم المشترك المجرد الذي تم تمييزه ، يمكن للباحث أن يشرع بسهولة في ربط النتائج التي توصل إليها مع تلك الدراسات الأخرى التي أجريت في أطر متنوعة ، متنوعة في مسائل التفصيل ولكنها تعكس نفس المبدأ التجريدي على مستوى النتائج.

وغني عن القول إن الباحث يمكنه على أساس الاعتراف بالمبدأ النظري المجرد الذي يستند إليه اكتشافه ، ويجعل التنبؤات المختلفة حول عالم الأحداث الملموس غير ذي صلة على ما يبدو على ما يبدو في مجال النتائج التي توصل إليها. وبالتالي ، قد يتم إطلاق استفسارات جديدة لاختبار التنبؤات ومفهومة ، مثل هذه الدراسات سيكون لها علاقة مع الدراسة الأولية للباحث.

وبمعنى مختلف إلى حد ما ، فإن الترجمة تكون بالضرورة متضمنة في الانتقال من البحث الاستكشافي إلى البحث التجريبي. غالبًا ما يؤدي تفسير نتائج فئة البحث السابقة إلى فرضيات لهذا الأخير.

وبما أن الدراسة الاستطلاعية لا تحتوي على فرضية للبدء بها ، فإن النتائج أو الاستنتاجات التي توصلت إليها هذه الدراسة يجب أن تُفسَّر بتفسير "ما بعد الوقائع" وهي غالباً لعبة خطرة محفوفة بتداعيات خطيرة. مثل هذا التفسير ينطوي على البحث عن عراب في طبيعة بعض النظرية أو المبدأ الذي سيعتمد (أي يشرح) نتائج الدراسة.

غالباً ما يتبين أن هذه المهمة هي تمرين من جانب الباحث لتبرير اكتشافاته من خلال تحديد بعض النظريات المناسبة لتناسب النتائج التي توصل إليها. ونتيجة لذلك ، قد تجد الاستنتاجات المتناقضة "عدوهم" في نظريات متنوعة.

هذا الجانب من تفسير ما بعد الواقع ، والذي يتضمن محاولات لترشيد نتائج البحث ، يجب أن يوضع في الاعتبار بشكل واضح عند الشروع في ذلك. في بعض المناسبات ، لا يوجد بديل آخر لها.

ثانيا ، يؤدي التفسير إلى إنشاء مفاهيم توضيحية. وكما أشرنا ، فإن تفسير النتائج يتضمن جهودًا لشرح سبب صحة الملاحظات أو النتائج. في إنجاز هذه المهمة ، تفترض النظرية أهمية مركزية.

هو محسس ودليل للعوامل والعمليات الأساسية (القواعد التفسيرية) أسفل النتائج. تحت ملاحظات الباحث في سياق الدراسة ، تكمن مجموعة من العوامل والعمليات التي قد تفسر ملاحظاته للعالم التجريبي. التفسير النظري يكشف هذه العوامل.

تتمثل مهمة الباحث في شرح العلاقات التي لاحظها في سياق دراسته ، من خلال فضح العمليات الأساسية التي توفر له فهمًا أعمق لهذه العلاقات والإشارة إلى دور بعض العوامل الأساسية التي تعمل في مجال المشكلة في دراسته.

وبالتالي ، يخدم التفسير غرضًا مزدوجًا. أولاً ، أنه يعطي فهمًا للعوامل العامة التي يبدو أنها تفسر ما تمت ملاحظته في سياق الدراسة ، وثانياً ، يوفر مفهومًا نظريًا يمكن أن يكون بدوره بمثابة دليل لمزيد من البحث.

وبهذه الطريقة ، يأتي العلم بالتراكم التراكمى بصورة أكثر نجاحا ، فى العمليات الأساسية التى تشكل جزء من العالم التجريبى الذى يهتم به الباحث.

يتشابك التفسير بشكل لا فكاك منه مع التحليل أنه يجب أن يُنظر إليه بشكل أكثر ملائمة على أنه جانب خاص للتحليل بدلاً من كونه عملية منفصلة أو متميزة. في الختام ، نحن نميل إلى اقتباس البروفيسور سي. رايت ميلز الذي ذكر جوهر ما يشارك في التحليل (الذي يتضمن تفسير) للبيانات.

يقول ميلز: "لذلك سوف تكتشف وتصف وتضع أنواعًا لترتيب ما اكتشفته وتركيز وتنظيم التجربة من خلال التمييز بين العناصر بالاسم. سيؤدي هذا البحث عن النظام إلى البحث عن الأنماط والاتجاهات والعثور على العلاقات التي قد تكون نموذجية وسببية. سوف تبحث باختصار ، عن معنى ما جئت أو ما يمكن تفسيره على أنه رمز مرئي لشيء يبدو أنه متورط في كل ما تحاول فهمه ؛ ستقوم بتعريفها إلى الأساسيات. ثم بعناية وبصورة منهجية سوف ترتبط ببعضها البعض من أجل تشكيل نوع من نموذج العمل ... ".

"لكن دائماً بين كل التفاصيل ، سوف تبحث عن المؤشرات التي قد تشير إلى الانجراف الرئيسي ، إلى الأشكال والميول الأساسية لمجموعة من المجتمع في فترة زمنية خاصة بها." بعد إنهاء بحث ، البيان يمكن طرح مجموعة من الأسئلة والمشاكل الجديدة.

بعض الأسئلة الجديدة تشكل الأساس لمهام البحث الجديدة وصياغة نظريات جديدة والتي إما تعديل أو استبدال القديمة. هذا في الواقع ، ماذا يعني البحث. إنه يساعد على فتح طرق جديدة وأكثر اتساعًا للمغامرة الفكرية ويحاكي البحث عن المزيد من المعرفة بالإضافة إلى المزيد من الحكمة في استخدامها.