تحليل البيانات: 4 خطوات

تلقي هذه المقالة الضوء على الخطوات الأربع الرئيسية التي ينطوي عليها تحليل البيانات. الخطوات هي: 1. إنشاء فئات أو تصنيف البيانات 2. الترميز 3. الجدولة 4. التحليل الإحصائي للبيانات.

الخطوة رقم 1. إنشاء فئات أو تصنيف البيانات :

تتضمن أبحاث العلوم الاجتماعية بشكل عام مجموعة متنوعة من الاستجابات لمختلف أنواع الأسئلة المطروحة أو المحفزات المقدمة لعينة أو "مجتمع" المستجيبين. قد تكون هذه الردود لفظية أو غير لفظية.

من الواضح أنه إذا تم تنظيم عدد كبير من أنواع الردود المختلفة بحيث يمكن استخدامها في الإجابة على أسئلة البحث ، أو في رسم التعميمات ، يجب تجميعها في عدد محدود من الفئات أو الفئات. لنأخذ مثالاً بسيطًا ، لنفترض أن الأسئلة تطرح على المستفتيين ، "هل تؤيد امتحان النوع الموضوعي لطلاب الجامعات؟"

قد يتم تجميع إجابات المستجيبين تحت أربع فئات عامة ، كما هو موضح أدناه:

(أ) الردود "نعم".

(ب) الردود "لا".

(ج) "لا أعرف" ، "لا أستطيع أن أقول" وما إلى ذلك ، الردود.

(د) "لم ترد".

لنفترض أن سؤال آخر موجه للمستفتيين هو "إلى أي فئة اجتماعية ستقول إنك تنتمي؟"

قد يتم تجميع ردود المستجيبين في الفئات التالية:

(أ) الطبقة العليا.

(ب) الطبقة الوسطى.

(ج) الطبقة السفلى.

(د) "لا يمكن القول".

(ه) الردود الأخرى (مثل "أنا لا أؤمن بالطبقات الاجتماعية") "لا يهم أين أكون أنتمي" وما إلى ذلك.

من الشروط الأساسية لاتخاذ قرار حول الفئات التي سيتم وضعها لتجميع البيانات هو أنه يجب على الباحث اختيار بعض المبادئ المناسبة للتصنيف. يوفر سؤال البحث أو فرضيته ، إن وجدت ، أساسًا منطقيًا جيدًا لاختيار مبدأ تصنيفي.

لنفترض ، أن الفرضية في إحدى الدراسات هي:

"سيكون لدى الطلاب الذين لديهم خبرة في الدراسة في المدارس المختلطة موقفا أكثر مواتاة نحو نظام التعليم المختلط".

هنا ، من الواضح أن أحد مبادئ تصنيف الردود هو ما إذا كان المدعى عليه لديه خبرة سابقة في نظام التعليم المختلط. هناك أساس آخر لتصنيف الردود هو درجة القبول أو عدم الاحساس بالصبر تجاه نظام التعليم المختلط. كما يمكن الاحتجاج بأسس التصنيف الأخرى ، اعتمادًا على ماهية الجمعيات الأخرى التي يجب فحصها.

الأساس الأول للتصنيف سيعطي فئتين من الإجابات:

(أ) قالت إن لديهم خبرة سابقة في التعليم المختلط ؛

(ب) قالوا ، لم يكن لديهم أي خبرة سابقة في التعليم المختلط.

تحتوي هاتان الفئتان ضمنهما على مجموعة كاملة من الاستجابات (بافتراض ، بطبيعة الحال ، أنه لا يوجد مستجيب رفض الإجابة أو لم يستجب أو أعطى بعض الاستجابة الأخرى. لا توجد إجابات على الافتراض أعلاه تفوق بوصلة هاتين الفئتين. هاتان الفئتان معاً تشكلان ما يعرف بـ "مجموعة الفئات".

يجب أن تستوفي "مجموعة الفئات" المتطلبات الثلاثة التالية:

(1) ينبغي أن تستمد مجموعة الفئات من مبدأ تصنيفي واحد. هذا المطلب مفهوم تمامًا لأنه إذا تم استخدام أكثر من مبدأ التصنيف ، فيمكن المطالبة باستجابة واحدة من خلال أكثر من فئة واحدة.

وبالتالي ، لن تكون الفئات مستقلة عن بعضها البعض. على سبيل المثال ، إذا كان لدينا ثلاث فئات تشكل فئة الفئات ، على سبيل المثال ، ذكر ، أنثى ، طفل ، مشتقة بشكل واضح ، من مبادلتين تصنيفيتين ، هما الجنس والعمر على التوالي ، عندئذ يمكن تغطية أي حالة (المستجيب) بأكثر من فئة واحدة في فئة مجموعة.

على سبيل المثال ، قد يكون الطفل أيضًا ذكرًا ، وقد تكون أنثى أيضًا طفلًا وما إلى ذلك. ومع ذلك ، يمكن أن يكون المبدأ التصنيفي مركبًا ، أي يتكون من معيارين أو أكثر ، أي الطفل الذكر ، والطفل ، الخ.

(2) والمتطلب الثاني هو أن تكون مجموعة الفئات شاملة ، أي أنه من الممكن وضع كل رد في إحدى الفئات داخل المجموعة. يجب عدم استبعاد "استجابة" لعدم وجود فئة مناسبة في المجموعة التي ستشملها.

أيا كانت الردود ، يجب أن تكون مغطاة من قبل بعض الفئات داخل المجموعة. على سبيل المثال ، إذا تم تصنيف شعوب العالم على أساس مخزونها العنصري ، فإن الفئة المحددة المكونة من ثلاث فئات ، وهي: (أ) Caucasoid ، (ب) Negroid و (c) Mongoloid ، لن أن تكون فئة شاملة تتوافق مع المتطلبات المذكورة أعلاه ، لأنها لا تحتوي على فئة واحدة يستطيع فيها العديد من الأشخاص الهنود (وبعضهم الآخر) العثور على مكان.

(3) الشرط الأخير هو نتيجة طبيعية للواحدة الأولى ، وهي أن الفئات داخل المجموعة ينبغي أن تكون حصرية ؛ أي ، يجب ألا تتداخل الفئات. وبالتالي ، لن تتم المطالبة بأي رد من خلال أكثر من فئة واحدة ضمن المجموعة.

لا يعتبر إنشاء فئات لخصائص البيانات في العلوم الاجتماعية مهمة سهلة دائمًا. قد يكون المبدأ التصنيفي في كثير من الأحيان مركبًا واحدًا (في مقابل بسيط ، وحدوي). إن مهمة استنباط جميع الفئات الحصرية للطرفين والتي تستنفد مجتمعة مجموع الردود ، على أساس مبدأ تصنيف مركب ، هي في الحقيقة فكرة صارمة ومتطلبة.

وهي مساعدة كبيرة في مثل هذه الحالات لتقليل السمات التي تشكل مبدأ التصنيف المركب إلى رموز أو رموز ، والاستعانة بوسائل تقنية التوسعة المنطقية ، وهي المجموعة الكاملة للفئات المحتملة التي تشمل فئة الفئات.

دعونا نأخذ مثال بسيط للغاية. لنفترض أن الباحث يأخذ في الاعتبار ثلاث سمات ، مثل الجنس (ذكر الأنثى) ، والعمر (أقل من 21 عامًا أو أكثر من 21 عامًا) والحالة الزوجية (متزوجة أو فردية) كمكونات لمبدأه الفردي (لكن المركب) للتصنيف ويقلل من هذه الرموز إلى ما يلي:

ذكر = S ، أنثى = S̅

أقل من 21 سنة من العمر = أ ، فوق 21 سنة من العمر = أ

متزوج = M ، أعزب = M̅

وتكون مجموعة الفئات الناتجة هي المجموعة الشاملة التي تتكون من جميع التوليفات الممكنة لهذه السمات الثلاثة التي تشمل مبدأ التصنيف المركب. ستكون المجموعات المحتملة ، أي الفئات ، 2 3 = 2 × 2 × 2 = 8 في العدد.

هذه هي تحت:

(1) SAM

(2) S̅ AM

(3) S A̅ M

(4) SA M̅

(5) S̅ A̅ M

(6) S̅ A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

فك التشفير ، بمعنى استبدال الدلالات الحقيقية للرموز ، نحصل على ثمان فئات حصرية متبادلة تقرأ كما يلي:

(1) ذكور أقل من 21 ومتزوجة.

(2) الإناث أقل من 21 سنة وتزوج.

(3) ذكور فوق 21 سنة ومتزوج.

(4) ذكور أقل من 21 سنة وغير متزوجة.

(5) إناث فوق 21 سنة ومتزوجة.

(6) الإناث أقل من 21 سنة وغير المتزوجات.

(7) ذكور فوق 21 سنة وغير متزوجة.

(8) الإناث فوق 21 سنة وغير المتزوجات.

وعلى نفس المنوال ، إذا كان مبدأ التصنيف المركب مكونًا من أربعة سمات ، فسيكون لدينا 2 4 = 2x 2 x 2 x 2 ، أي 16 فئة حصرية متبادلة. يجب أن يكون واضحا الآن كيف أن هذه الطريقة في إنشاء الفئات ، بدلاً من الحدس ، تجعل مهمة التصنيف أكثر سهولة وخداعًا.

ﻣن اﻟواﺿﺢ أن إﻧﺷﺎء ﻣﺟﻣوﻋﺔ ﻣن اﻟﻔﺋﺎت ﺳﮭل ﻧﺳﺑﯾﺎ إذا ﮐﺎﻧت اﻻﺳﺗﺟﺎﺑﺎت اﻟﺗﻲ ﺗم اﻟﺣﺻول ﻋﻟﯾﮭﺎ ﻣن اﻟﻣﺟﯾﺑﯾن أﺛﻧﺎء اﻟدراﺳﺔ ﺑﺳﯾطﺔ وواﺿﺣﺔ إﻟﯽ ﺣد ﻣﺎ ، وﺑﺎﻟﺗﺎﻟﻲ ﯾﻣﮐن ﺗﺣدﯾد اﻟﻔﺋﺎت ﺑﺳﮭوﻟﺔ ﺑطرﯾﻘﺔ ﻻ ﻟﺑس ﻓﻴﻬﺎ. على الرغم من أن هذه هي الطريقة التي يجب بها تعريف الفئات دائمًا ، تكون المهمة أكثر صعوبة مع أنواع معينة من المحتوى.

لنفترض في دراسة سألتها الباحثة عن الطلاب الذكور: "كيف تقولون أن الطالبات يشعرن بالدراسة في نفس الكلية مع طلاب من الذكور مثلك؟" من المرجح أن تتراوح الإجابات من مؤشرات على مواقف إيجابية للغاية (يُنسب إلى الطالبات). ) إلى التحولات من المواقف غير المواتية للغاية. لنفترض ، هذه بعض الإجابات التي وردت من المجيبين.

(1) يحبون الفكرة.

(2) "لا أعتقد أنهم يمانعون".

(3) "يعتقدون أنها تقللهم".

(4) أنا لا أتواصل معهم ، لذلك لا أعرف.

(5) "إنهم يكرهونها."

(6) "البعض منهم يحبون ذلك ، والبعض الآخر لا."

(7) "إنهم يريدون الدراسة هنا ليقولوا إنهم ليسوا أقل من الذكور".

(8) "في كلية السيدات البحتة ، سيفتقدن الكثير ، لذا يبدو أنهن يعجبهن هنا."

وفيما يتعلق بالاستجابات المذكورة أعلاه ، لن يكون من الصعب تطوير مجموعة بسيطة من الفئات على أساس المبدأ التصنيفي للمواقف المواتية مقابل غير المواتية التي يُنسب إليها الطالبات. لكننا نجد أن كل من الإجابات الإيجابية وغير المواتية تنقل ظلالًا مختلفة من المعاني.

الطالب الذكر الذي يقول: "إن (الطالبات) يرغبن في الدراسة هنا ليقولن بأنهن لا يقلن عن الذكور" ينقل شيئًا مختلفًا عن شخص يقول: "يحبون الفكرة". وبالمثل ، الطالب الذكر "يعتقدون أنهم يخفضونهم" يقولون مرة أخرى شيئًا مختلفًا عن الشخص الذي يقول: "إنهم يكرهون ذلك".

وهكذا ، نرى أن هناك صفتين ، أي:

(1) براءة المواقف الإيجابية أو غير المواتية تجاه الفتيات ، و

(2) الإشارة الصريحة أو عدم الإشارة إلى المنافع أو الأذى الذي يدعم المواقف الإيجابية أو غير المواتية هما مكونان هامان لمبدأ التصنيف المركب.

يمكن تصنيف الفئات في الفئة التي تتوافق مع المتطلبات المثالية لمجموعة الفئات التي تمت مناقشتها في وقت سابق ، على النحو التالي:

(1) موقف إيجابي لصالح الطالبات ، أوضح من حيث الفوائد التي تجنيها من الدراسة في نفس الكلية مع الطلاب الذكور (على سبيل المثال الإجابات 7 و 8).

(2) المواقف المواتية للفتيات دون الإشارة صراحة إلى الفوائد المكتسبة من الدراسة في نفس الكلية مع الذكور (على سبيل المثال ، البيان رقم 1).

(3) الموقف المحايد أو التكيفي مع الفتيات (على سبيل المثال ، البيان رقم 1).

(4) موقف غير ملائم للفتيات ، وأوضح من حيث العيوب (الفوائد السلبية) أنها مستمدة من الدراسة في نفس الكلية مع الطلاب الذكور.

(5) موقف غير ملائم للفتيات دون الإشارة صراحة إلى العيوب أو الخسائر الناجمة عن التعليم المختلط (على سبيل المثال ، البيان رقم 5).

(6) أجوبة أخرى ، لا يمكن أن أقول ، لا إجابة ، لا أعرف (على سبيل المثال ، البيان رقم 4).

سيعطي الرسم التوضيحي السابق فكرة حول كيفية الحصول على تصنيف معقد جدًا في العلوم الاجتماعية. يتطلب العمل مع هذه الفئات المعقدة قدرًا كبيرًا من العناية والجهد في التصنيف. حتى عندما تكون الفئات قد تم إعدادها بعناية ، فإن استخدامها سيعرض لمشاكل أكبر من استخدام الفئات بشكل أكثر دقة وتحديدًا بدقة.

إذا كان الطالب الذكر في المثال أعلاه يقول: "إنهم يحبونه على ما يرام هنا ، فإنهم يعرفون السبب" إنه سؤال موضوعي حول ما إذا كان هذا البيان ينطوي على فائدة أم لا. وبالتالي ، يجب وضع قواعد إضافية للتعامل مع هذه الإجابات.

يجب أن يقال حتى على حساب بعض التكرار أنه على الرغم من أنه من حيث المبدأ ، من الممكن استخدام العديد من سمات الردود لصياغة مجموعات الفئات ، في الممارسة العملية ، غالبًا ما يكون ذلك غير ضروري وغير اقتصادي وغير مربح لأنه ليس كل هذه المبادئ التصنيفية تحمل على هدف الدراسة.

دعونا ننتقل الآن للنظر في مشكلة اختيار مبدأ تصنيفي لتصنيف المواد غير المهيكلة (أي المعلومات التي يتم جمعها بواسطة أدوات غير منظمة).

في الدراسات التي تستخدم أدوات مهيكلة لجمع البيانات ذات الصلة بمسائل البحث أو الفرضيات المحددة بوضوح ، فإن المبدأ المناسب لتصنيف الردود يتم تحديده بوضوح بشكل واضح من طبيعة الأسئلة والاستجابات المضمونة.

ومع ذلك ، عند التعامل مع مواد أو بيانات غير منظمة ، تتمثل المشكلة الأولى في التوصل إلى قرارات بشأن أي جوانب من المادة سيتم تصنيفها ، أي ما هي المبادئ التصنيفية التي ينبغي استخدامها في تحديد الفئات.

في الدراسات الاستكشافية التي لا تبدأ بشكل محدد بمشكلة جيدة الصياغة أو فرضية صريحة ، يصعب الوصول إلى القرار المتعلق بالمبادئ التصنيفية. في وقت جمع البيانات ، لا يعرف المحقق الجوانب التي قد تكون أكثر أهمية.

لذلك يجب عليه جمع كمية كبيرة من البيانات من النوع غير المنظم. في سياق التحليل ، يواجه الباحث مشكلة التعامل ليس فقط مع المواد غير المهيكلة ولكن أيضا مع حجم كبير منها.

من المستحسن عند تحليل بيانات الدراسة الاستكشافية لتطوير فرضية العمل التي ستنتج مبادئ تصنيفية مرضية قابلة للتطبيق. يُطلب من الباحث أن يقرأ بعناية جميع مواده ، مع تنبيهه طوال الوقت إلى الأدلة الكامنة في البيانات. وغالبا ما يتم تأمين مثل هذه القرائن من خلال دراسة المواد على المواضيع أو المواقف التي تتناقض مع تلك التي يدرسها.

تساعد هذه الدراسة المحقق على رؤية الاختلافات المهمة بين الحالتين. إجراء آخر للحصول على مثل هذه القرائن هو وضع حالات الشخص في مجموعات يبدو أنها قريبة أو تبدو أنها تنتمي إلى بعضها البعض ثم تسأل نفسه ما الذي جعله يشعر أن الحالات التي وضعها في مجموعة واحدة متشابهة.

ومن الأساليب الأخرى التي قد تحفز القرائن على صياغة فرضية العمل أن نلاحظ الأمور التي تبدو مفاجئة في ضوء بعض التوقعات النظرية أو الفطرة السليمة ومن ثم البحث عن تفسير محتمل للظواهر المدهشة أو غير المتوقعة.

ومع ذلك ، ينبغي تذكر أنه حتى مع فرضية واضحة ، فإن تحليل المواد غير المنظمة يعرض مشاكل خاصة. أولا ، هناك دائما احتمال أن المعلومات في نقطة معينة قد تكون مفقودة من بعض الوثائق.

هناك أيضًا احتمال وجود قدر كبير من المواد التي ليس لها تأثير مباشر على الفرضية. إلى جانب ذلك ، هناك مشكلة في تحديد حجم وحدات المادة التي سيتم تطبيق الفئات عليها.

على سبيل المثال ، إذا كان أحد الباحثين يستخدم سجلات الحالات التي تحتفظ بها وكالات الرعاية الاجتماعية ، فعليه أن يقرر الوحدة (على سبيل المثال ، العملاء ، البيانات ، الأفعال ، الأخصائيون الاجتماعيون ، الجلسات مع العميل أو السجل بأكمله) هو الأنسب في تقديم إجابات له. أسئلة بحثية محددة.

الخطوة # 2. الترميز:

يتكون الترميز في تعيين رموز ، عادة أرقام لكل إجابة التي تقع في فئة محددة سلفا. وبعبارة أخرى ، يمكن اعتبار التشفير بمثابة عملية التصنيف اللازمة للتبويب اللاحق. من خلال الترميز ، يتم تحويل البيانات الخام إلى رموز قد يتم جدولتها وحسابها.

هذا التحول ليس تلقائيا ، لكنه ينطوي على قدر كبير من الحكم على جزء من المبرمج. "Coder" هو العنوان الرسمي للشخص المسئول عن إعطاء رموز معينة للردود بعد تقديم الملاحظات المسجلة إلى المكتب.

ومع ذلك ، يجب أن نتذكر أنه في كثير من الأحيان يتم إصدار الحكم على أي رمز يجب أن يتم تعيين رمز معين ، من قبل شخص آخر غير الشخص الذي يذهب من خلال التسمية الرسمية لـ "coder".

قد يحدث الترميز في ثلاث نقاط مختلفة في دراسة في كل منها ، قد تكون أنواع مختلفة من الأشخاص مسؤولة عن تعيين رموز للبيانات الخام. في العديد من الدراسات ، قد يُطلب من المدعى عليه نفسه تعيين رموز لردة فعله أو موقفه.

هذا صحيح بالنسبة للعديد من أسئلة الاستطلاع والأسئلة متعددة الخيارات. على سبيل المثال ، عندما يطلب من المدعى عليه تحديد أي من الفئات (مثل مجموعات الدخل) التي ينتمي إليها ، على سبيل المثال ، (أ) أقل من 3000 روبية بعد الظهر ، (ب) روبية. 3001 / - إلى روبية. 6000 / - مساء ، (ج) روبية. 6001 / - روبية. 9000 / - pm، (d) Rs. 9001 / - وفوق ذلك ، يرمي المدعى عليه رده ببساطة عن طريق وضع موقفه بين البدائل المعينة.

النقطة الثانية التي يمكن أن يحدث فيها الترميز هي عندما يقوم القائم بإجراء المقابلة أو المراقب بتصنيف ردود المشاركين في سياق جمع البيانات. هذا ما يتم فعله عندما يستخدم القائم بإجراء المقابلة أو مراقب مقياس تصنيف لوصف استجابة الشخص أو سلوكه.

وبطبيعة الحال ، فإن النقطة الأخيرة التي يمكن أن يتم بها الترميز هي عندما تُودع البيانات غير المصنّفة (التي يتم جمعها على وجه الخصوص من خلال أدوات جمع البيانات غير المهيكلة) في مكتب المشروع ، ويمارس المبرمجون الرسميون هنا حكمهم لتعيين رموز معينة على وجه الخصوص. الردود أو البيانات.

دعنا نقارن بين إيجابيات وسلبيات الترميز والمساوئ للتشفير من قبل المبرمجين الرسميين في المكتب والتشفير من قبل المحاورين أو المراقبين الذين يتم إجراؤهم في سياق جمع البيانات في الميدان.

يمكن للقائمين بالمقابلة أو المراقبين أن يلاحظوا الوضع وكذلك سلوك الفرد. وبالتالي ، فإن لديهم المزيد من المعلومات التي تستند عليها أحكامهم فيما يتعلق بتصنيف الردود المناسب بالمقارنة مع المبرمجين الذين يعملون على أساس السجلات المكتوبة التي قد لا تعطي فكرة كاملة عن المعنى الحقيقي للاستجابة.

ميزة أخرى للتشفير من قبل جامعي البيانات أنفسهم هي أنه يمكن توفير الوقت والعمل على حد سواء.

على العكس من ذلك ، فإن الترميز في المكتب بواسطة المبرمجين له مزايا إشارة معينة. ينبغي أن يتم عمل تشفير للبيانات المعقدة التي تتطلب وقتًا للتفكير من قِبل أجهزة تشفير المكاتب. قد لا يكون حكم الترميز الفوري الصادر عن جامعي البيانات متطابقًا مثل الأحكام الصادرة مع مزيد من الوقت للتداول.

قد يلون حكم جامعي البيانات بالعديد من العوامل ، وهي: مظاهر المستجيبين ، ونبراتهم ، وردودهم على الأسئلة السابقة ، والسلوكيات ، وما إلى ذلك. ثانياً ، هناك خطر يتمثل في أن جامعي البيانات يفتقرون إلى التماثل عند استجابات الترميز.

وبالتالي ، فإن إمكانية مقارنة البيانات التي تم الحصول عليها من عدد كبير من المستجيبين قد أعاقت. ثالثًا ، قد يقوم القائمون بالمقابلة أو المراقبون بوضع أطر مرجعية خاصة بهم فيما يتعلق بالمواد التي يتم ترميزها. وهذا من شأنه أن يجعل تصنيفاتهم غير موثوق بها ، بعد مرور الوقت. ومن الأسهل الحصول على إطار مرجعي مشترك في عملية تشفير المكاتب وصيانتها منه في الميدان.

دعونا نناقش بعض المشاكل الهامة المتعلقة بالموثوقية في الترميز. هناك العديد من الأشياء التي قد تعمل لجعل الحكم على المبرمجين غير موثوق به. قد تنشأ بعض العوامل من البيانات التي سيتم تصنيفها ، وبعضها من طبيعة الفئات التي سيتم تطبيقها وما زال البعض الآخر ينبثق من المبرمجين أنفسهم.

سننظر الآن بإيجاز في بعض هذه العوامل والطرق التي يمكن حراستها.

العديد من الصعوبات التي تحدث في الترميز نتيجة لعدم كفاية البيانات. في كثير من الأحيان ، لا تقدم البيانات معلومات كافية كافية لتشفير موثوق. قد يكون هذا بسبب إجراءات جمع البيانات غير كافية وغير كافية. ومع ذلك ، يمكن التغلب على هذه الصعوبات بشكل عام عن طريق تحرير البيانات بعناية. العملية التي تتمثل في فحص البيانات لتحسين جودتها للتشفير المعروف بالتحرير.

عندما يسلم جامع البيانات مواده إلى مكتب المشروع ، لا تزال هناك إمكانية لإزالة العديد من صعوبات التشفير المحتملة. فحص دقيق للبيانات بمجرد جمعها وإذا لزم الأمر ، يساعد التساؤل المنتظم للمقابلات أو المراقبين في تجنب العديد من مشاكل التشفير.

لا يساعد التعديل فقط في تجنب مشاكل التشفير في وقت لاحق ، بل قد يحسِّن أيضًا بشكل كبير جودة جمع البيانات من خلال الإشارة إلى المكان الذي قد يساء فهمه القائمون بالمقابلة أو المراقبون أو قد لا يكون لديهم بيانات مسجلة بتفاصيل كافية.

في الواقع ، يجب أن يتم التحرير في سياق الاختبار المسبق للمقابلة أو تدريب الجدول الزمني للمقابلات أو المراقبين ، وفي الحقيقة طوال فترة جمع البيانات. التحرير في مكتب المشروع يقطع شوطا طويلا في إزالة مشاكل الترميز.

وبالتالي ، يجب أن يتم التحرير بينما يمكن إجراء المقابلات أو المراقبين بسهولة للاستجواب. يتضمن التحرير تدقيقًا دقيقًا في المقابلة أو جداول المراقبة.

يجب التحقق من ذلك لما يلي:

(1) الاستيفاء: على المحررين أن يروا أن جميع البنود مملوءة على النحو الواجب. فالفراغ الفارغ بجوار سؤال في جدول المقابلة ، على سبيل المثال ، قد يعني إما "عدم الاستجابة" أو "لا أعرف" أو رفض الإجابة عن السؤال أو عدم قابليته للتطبيق ، أو السؤال الذي تم حذفه من خلال الرقابة ، إلخ.

(2) ينبغي على المحرر فحص المقابلة أو جداول الملاحظة لمعرفة ما إذا كان الخط اليدوي أو الرموز أو الرموز التي يعينها المحاور أو المراقب يمكن فهمها بسهولة بواسطة المبرمج.

من المستحسن دائمًا التحقق من الوضوح عندما يتم تسليم المادة وإذا كان ذلك ضروريًا حتى يتمكن القائم بالمقابلة أو المراقب من إعادة كتابتها. إذا لم يتم ذلك ، فقد يتعطل الترميز في مرحلة قد لا يتم فيها استدعاء المستجوبين أو المراقبين للاستجواب بسهولة.

(3) يتضمن التحرير أيضًا فحص جداول القابلية للفهم. وغالبًا ما يحدث أن الرد المسجل مفهوم تمامًا للمقابل أو المراقب ، ولكن ليس مفهومًا للمبرمج لأن سياق السلوك أو الاستجابة غير معروف للمشفّر. ومن شأن الاستجواب المنتظم لهواة جمع البيانات أن يزيل الارتباك والغموض وأن يحسن بدرجة كبيرة نوعية الترميز.

(4) ينبغي أيضا فحص البيانات أو التحقق منها لمعرفة ما إذا كانت هناك بعض التناقضات فيما يتعلق بالردود المسجلة في الجدول.

على سبيل المثال ، ربما قال أحد المستجيبين رداً على أحد الأسئلة السابقة أنه لم يلتق قط بأشخاص من مجموعة معينة ، ومع ذلك ، رداً على سؤال لاحق ، ربما قال شيئًا عن زيارة أشخاص معينين من هذه المجموعة أثناء عمله. جولات. إذا كان هذا هو الحال ، هناك حاجة واضحة للتحقيق في هذا التناقض ، والحصول على توضيح من خلال التشكيك في جامعي البيانات.

(5) من الضروري أيضاً التحقق من درجة التماثل التي اتبعها القائمون بالمقابلات بتعليمات في جمع وتسجيل البيانات. قد يتعطل التشفير إذا تم تسجيل استجابة في وحدات غير تلك المحددة في التعليمات.

(6) وتجدر الإشارة إلى أن بعض الاستجابة قد يبدو ببساطة غير ذي صلة لغرض التحقيق. من المحتمل أن يحدث هذا إذا لم يتم عمل سؤال بشكل واضح أو لم يتم طرحه بذكاء. وبالتالي ينبغي فحص البيانات بعناية بهدف فصل الردود غير الملائمة عن الاستجابات المناسبة.

تعتمد قيمة تصنيف البيانات بشكل طبيعي على سلامة الفئات المستخدمة. من الضروري أن يتم تعريف الفئات إلى جانب كونها ذات صلة بهدف البحث من وجهة نظر مفاهيمية.

لن يكون الترميز موثوقًا إذا لم يتم تعريف الفئات بوضوح من حيث المؤشرات القابلة للتطبيق على البيانات ، هنا والآن. في الممارسة ، يتم تعريف الفئات عن طريق أمثلة من البيانات الموجودة. من المفيد جدًا أن تظهر الرسوم التوضيحية من البيانات ليس فقط نوع الردود التي تميز الفئة بل تساعد أيضًا في تمييز الحد الفاصل بين الفئات المتشابهة ظاهريًا.

من الواضح أن جودة الترميز تتأثر باختصاص المبرمجين. وبالتالي فإن تدريب المبرمجين يعد خطوة مهمة في أي دراسة.

قد يستمر تدريب المبرمجين بالمراحل التالية:

أولاً ، يتم شرح الرموز المختلفة للتدرج (المبرمجين) وموضحة بأمثلة من البيانات المراد تصنيفها.

ﺛﺎﻧﯾﺎً ، ﮐل اﻟﻣﺗدرﺑﯾن اﻟﻣدرﺑﯾن ﯾﻌﺗﻣدون ﻋﻟﯽ ﻋﯾﻧﺔ ﻣن اﻟﺑﯾﺎﻧﺎت ، واﻟﻣﺷﮐﻼت اﻟﺗﻲ ﺗﻧﺷﺄ ﺗﻧﺎﻗش ﻣن ﻗﺑل اﻟﻣﺷﻔرﯾن ﮐﻣﺟﻣوﻋﺔ ﻣﻊ اﻟﻣﺷرف ﻟﺗطوﯾر إﺟراءات وﺗﻌرﯾﻔﺎت ﻣﺷﺗرﮐﺔ.

ثالثاً ، تستخدم القرائن الناتجة عن تشفير الممارسات لإحداث مراجعات في الفئات لجعلها أكثر قابلية للتطبيق على المادة ووضع الإجراءات والتعاريف التي تطورت أثناء الترميز الأولي كتابةً.

رابعاً ، في مرحلة ما في فترة الممارسة عندما تنشأ بعض المشاكل الجديدة نسبياً ، يعمل المبرمجون على جزء متماثل من البيانات دون استشارة بعضهم البعض أو المشرف. ومن ثم يُحسب تناسق الترميز أو موثوقيته لتحديد ما إذا كان من المجدي البدء في التشفير بجدية صحيحة.

اعتمادا على نتائج الموثوقية أو التحقق من الاتساق ، قد تقرر القضاء على الفئات التي تبدو غير موثوق بها للغاية أو لقضاء المزيد من الوقت في تدريب المبرمجين أو للقضاء على المبرمجين الذين هم أكثر غير متناسقة وهلم جرا.

وأخيرا ، يتم إجراء اختبارات دورية للتأكد من أن المبرمجين لا يصبحون مهملين مع خبرة أكبر أو أنهم لا يطورون أساليب شخصية خاصة للتعامل مع المشاكل الجديدة في المواد. لضمان الاتساق ، والقرار الذي يتم بعد بدء الترميز يجب إبلاغه لجميع المبرمجين دون تأخير.

من الواضح أن الاتساق والملاءمة اللذين يتم تعيين نوع معين من إجابتهما لفئة معينة سيكون لهما تأثير هام على نتيجة التحليل ، ومن ثم ، فمن المهم التحقق من موثوقية الترميز وزيادة الاتفاق بين المبرمجين قدر الإمكان. بقدر الإمكان.

بالطبع ، من الصعب تحديد مستوى معين من الموثوقية كمعيار يتم تحقيقه. تعرض أنواع مختلفة من المواد درجات مختلفة من الصعوبة في تحقيق الاعتمادية. وكقاعدة عامة ، كلما كانت المادة التي يتم ترميزها أكثر تنظيماً ، وبالتالي أبسط الفئات المستخدمة ، زادت الموثوقية.

تجدر الإشارة إلى أن أنواع الرموز المستخدمة في الدراسة ستختلف حسب ما إذا كانت البيانات سيتم جدولتها بواسطة آلة أو باليد. إذا تم فرز البيانات يدويًا ، فسيكون وصف الكلمة للفصول مرضٍ.

كما يمكن استخدام اختصارات أو أحرف ألفا بايت ، على سبيل المثال ، "Y for Yes" و "N" من أجل لا ، إلخ. من ناحية أخرى ، تتطلب جدولة الماكينة أن يتم التعبير عن الفئات في رموز رقمية ، حيث أنه يمكن تغذية الماكينات فقط ببيانات رقمية.

تتطلب الجدولة الميكانيكية استخدام البطاقات المثقوبة. ومع ذلك ، فإن عدد الفصول المختلفة التي يمكن عرضها على البطاقة المثقبة محدود. في أي حال ، يمكن أيضًا استخدام جميع الرموز المستخدمة لتبويب الآلة لجدولة اليد.

في حالة وضع الأكواد على بطاقات مثقوبة يكون حجمها بشكل عام ، أي 80 بطاقة أعمدة و 54 بطاقة عمود ، من المستحسن استخدام عشرة على فئات / فئات أقل لمعظم عناصر المعلومات أو الاستجابة.

تحتوي البطاقة المثقبة على 10 مسافات مرقمة و X و Y في كل عمود مما يجعل إجمالي 12 رمزًا يمكن استخدامه. إنه إجراء معقد إلى حد ما للحصول على أكثر من نوع واحد من العناصر في عمود. على سبيل المثال ، لا يمكن أن يتم ضرب سن المهد والعمر في عمود واحد إلا إذا تم استخدام ست مجموعات عمرية لكل منها.

الخطوة # 3. الجدولة:

الجدولة جزء من العملية الفنية في التحليل الإحصائي للبيانات. العنصر الأساسي في الجدولة هو تلخيص النتائج في شكل جداول إحصائية.

فقط عندما تنقسم البيانات الخام إلى مجموعات وتعدادات من عدد الحالات التي تقع في هذه المجموعات المختلفة ، فإنه من الممكن للباحث تحديد ما تعنيه النتائج ونقل النتائج التي توصل إليها إلى المستهلك في شكل يمكن يكون مفهوما بسهولة.

تعتمد الجدولة بشكل طبيعي على إنشاء فئات للبيانات الخام ، وتحرير وترميز الاستجابة (التثقيب وتشغيل البطاقات من خلال آلات للفرز الميكانيكي وفرز وترقيم لجداول اليد).

يقوم الباحثون ذوو الخبرة بوضع خطط جدولة بشكل عام في نفس الوقت الذي يقومون فيه بصياغة أو إنشاء أدوات جمع البيانات ووضع خطط لأخذ العينات. نادراً ما يهتم الباحثون عديمي الخبرة أنفسهم بخطط الجدولة حتى يتم جمع البيانات. بالطبع ، من المستحيل بالنسبة للباحث أن يتنبأ بالنطاق الكامل للجدولة التي سوف تكون مطلوبة في وقت لاحق.

يجب أن يكون على دراية كافية بمشاكله البحثية أو موضوع التحقيق حتى يتمكن من وضع الجداول التي توفر إجابات على الأسئلة التي أدت إلى الدراسة. ينبغي أن يكون الباحث قادراً على إعداد خطط جدولة كافية إذا استخدم النتائج التي توصلت إليها الأبحاث السابقة التي تحتوي على عناصر مشتركة مع تلك التي يتم رسم الخطط لها.

في الدراسات الاستكشافية ، يتمثل إجراء أفضل وأكثر أمانًا في اختبار أداة جمع البيانات على عينة من السكان من النوع الذي سيتم تغطيته في الدراسة النهائية. بهذه الطريقة ، يمكن الحصول على بعض الأدلة فيما يتعلق بأي نوع من الجداول يمكن أن تكون ذات مغزى.

الجدولة ، يمكن أن تتم بالكامل بالطرق اليدوية ؛ هذا يعرف باسم جدولة اليد. بدلا من ذلك ، يمكن أن يتم ذلك عن طريق الطرق الميكانيكية التي تستخدم آلات الطاقة الأوتوماتيكية والسريعة للجزء الأكبر من البيانات ، وتعرف العملية باسم الجدولة الميكانيكية.

يجب أن يقرر الباحث قبل أن يستخرج خطط جدولة تفصيلية لدراسته ، ما هي طريقة الجدولة التي سيستخدمها. سوف يعتمد هذا القرار على اعتبارات مختلفة مثل التكلفة والوقت والموظفين ، إلخ.

كل من جدولة اليد وكذلك إجراءات الجدولة الميكانيكية لها مزاياها وحدودها. إن تنبيه الباحث إلى هذه المزايا والعيوب هو أفضل طريقة لتقرير أي طريقة تناسب مشكلته.

سنقوم بإيجاز بمراجعة مزايا هاتين الطريقتين من الجدولة:

(1) الجدولة الميكانيكية تنطوي على الكثير من الأعمال الكتابية والعمليات المتخصصة. وبطبيعة الحال ، فإنه يسهل السرعة ولكن السرعة قد لا تكون دائمًا تعويضًا كافيًا عن العمل الكتابي الإضافي.

(2) إذا لم يتم تحديد عدد وأنواع الجداول المطلوبة قبل بدء العمل في الجدولة. قد تكون جدولة الماكينة أكثر ملاءمة. ولكن إذا اعتبرت جدولة اليد فعالة ، فسيتم تحديد الترتيب الذي يتم من خلاله فرز الأنواع والتعدادات قبل عملية الجدولة.

(3) الميزة الرئيسية في تبويب الآلة هي أنها تسهل التصنيفات المتقاطعة. ﻓﻲ دراﺳﺎت واﺳﻌﺔ اﻟﻧطﺎق ﺣﯾث ﯾﺟب رﺑط اﻟﻌدﯾد ﻣن اﻟﻣﺗﻐﯾرات أو ﺗﺻﻧﯾﻔﮭﺎ ﻋﺑر اﻟﻣﺻﻔوﻓﺔ ، ﺗﮐون ﺟدوﻟﺔ اﻵﻟﺔ ﻣﻔﺿﻟﺔ ﺑﺷﮐل ﻣﻌﻘول.

ولهذا السبب يتم استخدام الجدولة الميكانيكية في الدراسات التي تتطلب العديد من الارتباطات المتبادلة بين المتغيرات. ولكن إذا كان العدد الإجمالي للمستجيبين صغيرًا ، فقد يكون العد اليدوي لهم وفقًا للمبدأ عبر التصنيفي اقتصاديًا نسبيًا.

(4) عندما يكون هناك قدر كبير من المعلومات المشفرة والعديد من البطاقات المثقبة المطلوبة لكل حالة ، قد يكون من المفيد جدولة اليد.

(5) إذا كان من المطلوب الاحتفاظ بالبيانات في نموذج جاهز لجدولة جديدة في بطاقات لكمة الإشعار قصيرة نسبيا عادة ما تكون مفيدة. الجدولة الميكانيكية مفيدة للدراسات أو الدراسات الاستقصائية الدورية التي يلزم فيها الحصول على نفس النوع من المعلومات على فترات متقاربة.

(6) إن عملية الفرز والعد هي أقل احتمالا لإنتاج الأخطاء إذا تم تنفيذها بواسطة الآلة عما لو كانت مصنوعة باليد. وبالطبع ، يمكن أن تحدث الأخطاء في جدول الآلة ، وعندما يحدث ذلك ، غالباً ما يكون من الصعب تحديدها والتحقق منها.

يمكن لأي أخطاء يتم اكتشافها في مراحل الترميز أو التحرير أو العمل الميداني في المسح إجراء عمل جدولة الآلة. غالبا ما يكون من المرغوب فيه المضي قدما في جدولة اليد جنبا إلى جنب مع العمل الميداني.

(7) تعتبر تكلفة عمليات الجدولة من الاهتمامات الهامة للباحث. غالبًا ما تنطوي عملية جدولة الآلات على تكلفة أكبر بكثير نظرًا لأن معظم البطاقات المثقبة ورسوم التثقيب والتحقق ورسوم الآلات لآلات الفرز والتبويب والنفقات على توظيف خدمات متخصصة لأنواع محددة من مشغلي الآلات غالبًا ما تضيف إلى أكثر بكثير من تلك المستخدمة في اليد جدولة.

(8) آخر اعتبار مهم هو الوقت. في الجدولة الميكانيكية يتم عمل الجدولة على هذا النحو في وقت قصير جدا ، ولكن المراحل التحضيرية وكذلك التدريب والإشراف وعدم توفر أنواع معينة من الآلات على التأجير مما يؤدي إلى خلع العمل قد تسهم حتما في الهدر من الوقت.

(9) لا يمكن تجاهل اعتبارات الراحة. إذا تطلب الجدولة الميكانيكية إرسال بيانات أولية إلى مكتب ما بعيدًا عن مكتب المشروع ، فإن الإزعاج الذي ينطوي عليه التعبئة والنقل وما إلى ذلك يحدث.

(10) وأخيرًا ، قد تؤثر كمية مادة التعليق التي سيتم تسجيلها وتحليلها أيضًا على اختيار طرق الجدولة. في بعض استطلاعات الرأي ، تعتبر التعليقات الحرفية للمخبرين مهمة. يمكن أن توفر بطاقة الرمز اليدوي المستخدمة في الجدولة اليدوية وحدها مساحة لمثل هذه الملاحظات أو التعليقات.

الآلات التي تعالج أعمال الجدولة هي من أنواع كثيرة. كانت التطورات في هذا المجال سريعة للغاية خلال السنوات الأخيرة. بعض الأجهزة تقوم ببساطة بفرز و عد البطاقات ، بينما يقوم الآخرون بفرز و عد وطباعة النتائج ، و البعض الآخر مجهز للقيام بأكثر العمليات الإحصائية أو العمليات الحسابية تعقيدا.

هذه الآلات المذكورة أعلاه معقدة للغاية ويجب أن تكون مبرمجة لعملية معينة من قبل متخصص في الخط. والجدول هو معرض للبيانات العددية مرتبة بشكل منهجي في الأعمدة المسمى (عمودي) والصفوف (أفقية).

يشير جدول بسيط أو أولي إلى التعدادات البسيطة للترددات التي تحدث بها الفئات المختلفة في كل مجموعة في البيانات ، على سبيل المثال ، عدد الأشخاص في العينة الذين التحقوا بالمدرسة الثانوية ولكن لم يتم اجتيازهم ، وعدد الأشخاص الذين حضروا الكلية ولكن ليس متخرجا وهلم جرا. يشير الجدول الوارد أدناه ببساطة إلى ترددات زيارات خمسين مستجيباً للسينما.

في البحث ، غالباً ما نرغب في معرفة العلاقة بين متغيرين أو أكثر ، على سبيل المثال ، التعليم والدخل والخصوبة ، جداول بسيطة (موضحة أعلاه) تبين توزيع الترددات على المستجيبين فيما يتعلق بخاصية واحدة ، مثل التعليم أو الدخل. أو لا تساعدنا على رؤية العلاقة بين متغيرين أو أكثر.

طريقة رؤية العلاقة هي عن طريق إعداد الجداول المتقاطعة أو الجداول التفصيلية. هذه الجداول تجعل من الممكن تجميع الحالات التي تحدث بشكل مشترك في فئتين أو أكثر ، على سبيل المثال ، جدولة عدد الحالات التي تكون عالية في التعليم ، منخفضة في الدخل ولديها ما بين 2 و 3 أطفال ، أو عدد الحالات التي انخفاض في التعليم ، وانخفاض في الدخل ولديهم ما بين 4 و 5 أطفال وهلم جرا. الشكل الأكثر ابتدائية من التبويبات المتقاطعة التي يعرفها الطلاب هي جدول الوقت للكلية.

لنفترض أن الباحث يريد أن يرى العلاقة بين ثلاثة متغيرات ، أي ، والوظيفة ، والدخل والخصوبة. يجب عليه أن يوظف مخطط جدولة سيوفر جميع المجموعات الممكنة من الفئات المختلفة لهذه المتغيرات الثلاثة.

يمكن عرض البيانات المتقاطعة على عينة افتراضية من 100 شخص على النحو التالي:

في الجدول أعلاه ، أشرنا إلى عدد الأطفال في الصفوف. وقد تم تقسيم هذا المتغير من الخصوبة إلى خمس فئات ، أي لا توجد مشكلة ، من 1 إلى 2 ، 3 إلى 4 ، 5 إلى 6 ، 7 وما فوق. لذا في الهامش على اليد اليسرى ، لدينا 5 فئات من الخصوبة. لقد أشرنا إلى دخل 100 مشارك في الأعمدة.

تم تقسيم متغير الدخل إلى خمس فئات ، أي أقل من Rs.200 ، Rs.201-400 ، 401-600 ، 601-800 ، 801-1000. وبالتالي ، لدينا خمسة أعمدة تقابل هذه الفئات.

ومرة أخرى ، بما أن لدينا متغير واحد آخر ، أي مهنة لاستيعابها ، فقد قسمت كل عمود للدخل إلى جزأين يقابلان الفئتين اللتين تم فيهما تقسيم المهن ، أي احتلال ذوي الياقات البيضاء والاحتلال من ذوي الياقات الزرقاء. .

وبالتالي ، لدينا عشرة أعمدة عمودية ، تقابل الدخل والمهنة. عدد الصفوف الأفقية لدينا لفئات متغير الخصوبة هو خمسة. وبالتالي ، لدينا عشرة أعمدة متقاطعة من خمسة صفوف تشكل جسد الطاولة.

وقد أدى تقاطع الأعمدة والصفوف إلى إنشاء 50 خلية أو خمسين صندوقًا. تحتوي كل من هذه الصناديق أو الخانات على عدد محدد من الحالات التي تختلف عن تلك الموجودة في الخلايا الأخرى سواء فيما يتعلق بالدخل أو المهنة أو الخصوبة أو في أي من هذه الحالات أو في كل هذه الحالات. دعنا نقرأ الجدول للحصول على فكرة عما تمثله.

ومن بين العينة الكلية لـ 100 حالة ، هناك 25 حالة من بين 3 و 4 أعداد. من هؤلاء الخمسة والعشرين ، القراءة من الجانب الأيسر ، 5 أشخاص (مع ما بين 3 و 4 أطفال) لديهم دخل أقل من Rs.200 / - ويعملون في مهن ذوي الياقات البيضاء.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.