4 تستخدم عادة من تشتيت التدابير

هناك أربعة إجراءات شائعة الاستخدام للإشارة إلى التباين (أو التشتت) ضمن مجموعة من التدابير. هم: 1. المدى 2. الانحراف الربعي 3. متوسط ​​الانحراف 4. الانحراف المعياري.

قياس # 1. المدى:

المدى هو الفاصل الزمني بين أعلى وأعلى درجة. المدى هو مقياس للتنوع أو التبعثر في المتغيرات أو الملاحظات فيما بينها ولا يعطي فكرة حول انتشار الملاحظات حول بعض القيمة المركزية.

رمزيًا R = Hs - Ls. حيث R = المدى ؛

Hs هي "أعلى درجة" و Ls هي أدنى درجة.

حساب المدى (بيانات غير مجمعة):

مثال 1:

عشرات الأولاد في الاختبار هم:

17 و 23 و 30 و 36 و 45 و 51 و 58 و 66 و 72 و 77.

المثال 2:

عشرات من الفتيات في الاختبار هي:

48 و 49 و 51 و 52 و 55 و 57 و 50 و 59 و 61 و 62.

على سبيل المثال ، أعلى درجة هي 77 وأدنى درجة هي 17.

إذاً النطاق هو الفرق بين هاتين الدرجات:

. . . المدى = 77 - 17 = 60

بطريقة مماثلة ، في المثال الثاني

المدى = 62 - 48 = 14

هنا نجد أن عشرات الأولاد متناثرة على نطاق واسع. وبالتالي فإن درجات الأولاد تختلف كثيرا ولكن عشرات الفتيات لا تختلف كثيرا (بالطبع أنها تختلف أقل). وبالتالي فإن تقلب درجات الأولاد أكثر من تقلب درجات الفتيات.

حساب المدى (البيانات المجمعة):

المثال 3:

ابحث عن نطاق البيانات في التوزيع التالي:

حل:

في هذه الحالة ، يكون الحد الحقيقي الأعلى لأعلى فئة 70-79 هو Hs = 79.5 والحد الأدنى الحقيقي لأقل فئة 20-29 هو Ls = 19.5

لذلك ، Range R = Hs - Ls

= 79.5 - 19.5 = 60.00

المدى هو مؤشر من التباين. عندما يكون المدى أكثر المجموعة أكثر متغير. كلما كان النطاق أصغر كلما كانت المجموعة أكثر تجانسا. المدى هو المقياس الأكثر عمومية "للانتشار" أو "الانتثار" للعشرات (أو المقاييس). عندما نرغب في إجراء مقارنة تقريبية بين تقلبات مجموعتين أو أكثر ، يمكننا حساب النطاق.

نطاق مقارنة أعلاه هو في شكل الخام أو هو مقياس مطلق للتشتت وغير صالحة لأغراض المقارنة ، وخاصة عندما تكون السلسلة في وحدتين مختلفتين. ولغرض المقارنة ، يتم حساب معامل النطاق بقسمة النطاق على مجموع أكبر البنود وأصغرها.

مزايا:

1. يمكن حساب المدى بسهولة تامة.

2. إنه أبسط مقياس للتشتت.

3. يتم حسابها عندما نريد إجراء مقارنة تقريبية بين اثنين أو أكثر من الرسوم البيانية المتغيرة.

محددات:

1. لا يعتمد النطاق على جميع ملاحظات السلسلة. يأخذ في الاعتبار فقط الحالات الأكثر تطرفا.

2. يساعدنا ذلك على إجراء مقارنة تقريبية فقط لمجموعتين أو أكثر من التقلبات.

3. يأخذ النطاق بعين الاعتبار الدرجات القصوى في سلسلة.

وبالتالي عندما تكون N صغيرة أو عندما تكون هناك فجوات كبيرة في توزيع التردد ، فإن المدى كمقياس للتغير غير موثوق به إلى حد كبير.

المثال 4:

المجموعة الأولى - 3 و 5 و 8 و 11 و 20 و 22 و 27 و 33

هنا مجموعة = 33 - 3 = 30

نتائج المجموعة ب - 3 و 5 و 8 و 11 و 20 و 22 و 27 و 93

هنا المدى = 93 - 3 = 90.

ما عليك سوى مقارنة سلسلة الدرجات في المجموعة A والمجموعة B. في المجموعة A إذا تم تغيير درجة واحدة 33 (النتيجة الأخيرة) إلى 93 ، فإن النطاق يتغير على نطاق واسع. وبالتالي قد يؤدي ارتفاع درجة واحدة إلى زيادة النطاق من منخفض إلى مرتفع. هذا هو السبب في أن النطاق ليس مقياسًا موثوقًا للتقلبية.

4. يتأثر بشدة تقلبات في أخذ العينات. قيمتها ليست مستقرة أبدا. في الفصل حيث يتراوح عادةً ارتفاع الطلاب بين 150 سم و 180 سم ، إذا تم قبول قزم ، يبلغ ارتفاعه 90 سم ، فإن المدى سوف يرتفع من 90 سم إلى 180 سم.

5. لا يقدم النطاق السلسلة والتشتت حقاً. التوزيع غير المتماثل والتناظر يمكن أن يكون له نفس المدى ولكن ليس بنفس التشتت. إنها ذات دقة محدودة ويجب استخدامها بحذر.

ومع ذلك ، ينبغي ألا نتغاضى عن حقيقة أن النطاق مقياس فادح للتشتت وهو غير مناسب تمامًا لدراسات دقيقة ودقيقة.

التدبير # 2. الانحراف الرباعي:

المدى هو الفاصل الزمني أو المسافة على مقياس القياس الذي يشمل 100 بالمائة من الحالات. ترجع قيود النطاق إلى اعتماده على القيمتين المتطرفتين فقط.

هناك بعض مقاييس التشتت التي تكون مستقلة عن هاتين القيمتين المتطرفتين. وأكثر هذه العوامل شيوعًا هو الانحراف الربعي الذي يستند إلى الفترة الفاصلة التي تحتوي على 50٪ من الحالات المتوسطة في توزيع معين.

إن الانحراف في الربع هو نصف المسافة بين الربع الثالث والربيع الأول. إنه النطاق شبه المشترك بين التوزيع:

قبل أن نتحمل الانحراف الربعي ، يجب أن نعرف معنى الأرباع والأرباع.

على سبيل المثال نتائج الاختبار 20 نتائج ويتم ترتيب هذه الدرجات بترتيب تنازلي. دعونا نقسم توزيع الدرجات إلى أربعة أجزاء متساوية. كل جزء سيقدم "ربع". في كل فصل ، سيكون هناك 25٪ (أو 1/4 من N) حالات.

كما يتم ترتيب النتائج بترتيب تنازلي ،

ستكون أعلى 5 درجات في الربع الأول ،

ستكون الدرجات الخمس التالية في الربع الثاني ،

ستكون الدرجات الخمس التالية في الربع الثالث و

وستكون أدنى 5 درجات في الربع الرابع.

من أجل الحصول على دراسة أفضل لتركيبة السلسلة ، قد يكون من الضروري تقسيمها إلى ثلاثة أو أربعة أو ستة أو سبعة أو ثمانية أو تسعة أو عشرة أو مائة جزء.

عادة ، يتم تقسيم سلسلة في أربعة أو عشرة أو مائة جزء. يقسم بند واحد السلسلة في جزأين ، ثلاثة عناصر في أربعة أجزاء (الربعية) ، وتسعة بنود في عشرة أجزاء (عشرية) ، وتسعة وتسعين قطعة في مائة جزء (المئوي).

هناك ، بالتالي ، ثلاث رُبع ، تسع عشري وتسعة وتسعون في المائة في سلسلة. والرقم الثاني ، أو العشري الخامس أو الخمسين المئوي هو المتوسط ​​(انظر الشكل).

إن قيمة العنصر الذي يقسم النصف الأول من سلسلة (مع قيم أقل من قيمة الوسيط) إلى جزئين متساويين تسمى الربع الأول (Q 1 ) أو الربع الأدنى. بمعنى آخر ، Q 1 هي نقطة تحتها 25٪ من الحالات. Q 1 هو النسبة المئوية رقم 25.

الربعية الثانية (Mdn) أو الربع الأوسط هي المتوسط. بعبارة أخرى ، إنها نقطة أقل من 50٪ من النتائج. المتوسط ​​هو المئين الخمسين.

تُسمى قيمة العنصر الذي يقسم النصف الأخير من السلسلة (ذات القيم أكثر من قيمة الوسيط) إلى جزئين متساويين "الربع الثالث" (Q 3 ) أو الربع الأعلى. بعبارة أخرى ، Q 3 هي نقطة تحتها 75٪ من النقاط. Q 3 هو النسبة المئوية 75.

ملحوظة:

يجب على الطالب أن يميز بوضوح بين الربع والربيع. الربع هو نطاق. لكن الربعية هي نقطة على المقياس. يتم ترقيم الأحياء من الأعلى إلى الأسفل (أو من أعلى درجة إلى أدنى درجة) ، ولكن يتم ترقيم الربعية من الأسفل إلى الأعلى.

إن الانحراف في الربع (Q) هو نصف مسافة المقياس بين الربع الثالث (Q 3 ) و الربع الأول (Q 1 ):

L = الحد الأدنى من ci حيث Q 3 تقع ،

3N / 4 = 3/4 من 75٪ من N.

F = إجمالي جميع الترددات تحت "L" ،

fq = تردد ci الذي تقع عليه Q 3 و i = حجم أو طول ci

L = الحد الأدنى من ci حيث تقع Q 1 ،

N / 4 = ربع واحد (أو 25٪) من N ،

F = إجمالي جميع الترددات تحت "L" ،

fq = تردد ci الذي تقع عليه Q1 ،

و i = حجم أو طول ci

النطاق الربيعي:

ويعرف المدى بين الربع الثالث والربيع الأول باسم النطاق بين الربعين. المدى بين الربعين رمزياً = Q 3 - Q 1 .

نصف المدى Interquartile:

إنها نصف المسافة بين الربع الثالث والربيع الأول.

وهكذا ، SI R. = Q 3 - Q 1/4

يعرف Q أو الانحراف الربعي باسم النطاق شبه الرباعي (أو SIR)

وهكذا ، س = س 3 - س 1/2

إذا كنا سنقارن صيغة Q 3 و Q 1 بصيغة الوسيط ، فستكون الملاحظات التالية واضحة:

أنا. في حالة Median ، نستخدم N / 2 بينما نستخدم N / 4 في Q 1 ونستخدم QN 3N / 4 في Q 3 .

ثانيا. في حالة الوسيط ، نستخدم fm للإشارة إلى تكرار ci ، الذي يكمن في الأكاذيب المتوسطة ؛ ولكن في حالة Q 1 و Q 3 نستخدم fq للإشارة إلى تكرار ci الذي تقع عليه Q1 أو Q 3 .

حساب Q (بيانات غير مجمعة):

لحساب Q ، يلزمنا حساب Q 3 و Q 1 أولاً. يتم حساب Q 1 و Q 3 بالطريقة نفسها التي كنا نحسب بها الوسيط.

الاختلافات الوحيدة هي:

(i) في حالة الوسيط كنا نحسب 50٪ من الحالات (N / 2) من القاع ، ولكن

(2) في حالة Q1 يجب أن نحسب 25٪ من الحالات (أو N / 4) من القاع و

(iii) في حالة Q 3 ، يجب أن نحسب 75٪ من الحالات (أو 3N / 4) من القاع.

المثال 5:

اكتشف Q من الدرجات 20 و 21 و 22 و 23 و 24 و 25 و 26 و 27 و 28 و 29 و 30 و 31 و 32 و 33 و 34 و 35 و 36 و 37 و 38 و 39 التالية.

هناك 20 درجة.

25٪ من العدد = 20/4 = 5

Q 1 هي النقطة التي تقع تحتها 25٪ من الحالات. في هذا المثال ، Q1 هي نقطة تحتها 5 حالات. من مجرد فحص البيانات المطلوبة وجد أن أقل من 24.5 هناك 5 حالات. وهكذا س 1 = 24.5

وبالمثل ، فإن Q 3 هي النقطة التي تقع تحتها 75٪ من السهولة.

75٪ من N = 3/4 x 20 = 15

نجد أن أقل من 34.5،15 حالة تكمن

وهكذا س 3 = 34.5.

في توزيع متناظر ، يقع الوسيط في منتصف المسافة على المقياس من Q 1 و Q 3 . ولذلك ، فإن القيمة Q 1 + Q أو Q 3 - Q تعطي قيمة الوسيط. ولكن ، بشكل عام ، لا تكون التوزيعات متماثلة ولذا فإن Q 1 + Q أو Q 3 - Q لن تعطي قيمة الوسيط.

حساب Q (البيانات المجمعة):

مثال 6:

يتم عرض النتائج التي حصل عليها 36 طالبًا في الاختبار في الجدول. العثور على الانحراف الرباعي من الدرجات.

في العمود 1 ، أخذنا الفاصل الزمني للفئة ، في العمود 2 ، أخذنا التردد ، وفي العمود 3 ، تمت كتابة الترددات التراكمية التي تبدأ من الأسفل.

هنا N = 36 ، لذلك بالنسبة لـ Q 1 ، يجب أن نأخذ N / 4 = 36/4 = 9 حالات ولل Q3 يجب أن نأخذ 3N / 4 = 3 x 36/4 = 27 حالة. بالنظر إلى العمود 3 ، سيتم تضمين cf = 9 في ci 55 - 59 ، الحد الفعلي له هو 54.5 - 59.5. سوف تكمن Q1 في الفترة 54.5 - 59.5.

يجب حساب قيمة Q 1 على النحو التالي:

لحساب Q 3 ، سيتم تضمين cf = 27 في ci 65 - 69 ، التي تبلغ حدودها الفعلية 64. 5 - 69.5. لذا فإن Q 3 سوف تكمن في الفترة الزمنية 64.5 - 69.5 ، ويتم حساب قيمتها على النحو التالي:

تفسير الانحراف الرباعي:

أثناء تفسير قيمة الانحراف في الربع ، من الأفضل الحصول على قيم Median و Q 1 و Q 3 ، بالإضافة إلى Q. إذا كانت قيمة Q أكثر ، فإن التشتت سيكون أكثر ، ولكن مرة أخرى تعتمد القيمة على المقياس القياس. لا تقارن قيمتا Q إلا إذا كان المقياس المستخدم هو نفسه. لا يمكن مقارنة Q المقاسة بالعلامات من 20 بشكل مباشر مع Q للحصول على درجات من 50.

إذا كان متوسط ​​وسؤال معروفين ، فيمكننا القول إن 50٪ من الحالات تقع بين "Median - Q" و "Median + Q". هذه هي منتصف 50 ٪ من الحالات. هنا ، نتعرف على نطاق 50٪ فقط من الحالات المتوسطة. لا يتم معرفة كيفية انخفاض 25 ٪ من الحالات و 25 ٪ من الحالات العليا ، من خلال هذا الإجراء.

وفي بعض الأحيان ، لا تكون الحالات أو القيم المتطرفة معروفة ، وفي هذه الحالة يكون البديل الوحيد المتاح لنا هو حساب الانحراف الوسيط والربعي كمقياس للوسط والميل والتشتت. من خلال المتوسط ​​والربيع يمكننا الاستدلال على التناظر أو الانحراف للتوزيع. دعونا إذن نحصل على فكرة عن توزيعات متماثلة ومتماثلة.

التوزيعات المتناظرة والمتزورة:

ويقال أن التوزيع متناظر عند توزيع الترددات بشكل متناظر حول مقياس الاتجاه المركزي. وبعبارة أخرى ، يمكننا القول أن التوزيع متناظر إذا كانت القيم على مسافة متساوية على جانبي مقياس الاتجاه المركزي لها ترددات متساوية.

مثال 7:

ابحث عما إذا كان التوزيع المعطى متناظر أم لا.

هنا مقياس الاتجاه المركزي ، متوسط ​​ومتوسط ​​، هو 5. إذا بدأنا بمقارنة ترددات القيم على جانبي 5 ، نجد أن القيم 4 و 6 و 3 و 7 و 2 و 8 ، 1 و 9 و 0 و 10 لديهم نفس عدد الترددات. وبالتالي فإن التوزيع متماثل تمامًا.

في توزيع متماثل ، الوسط والوسيط متساويان والوسط يكمن على مسافة متساوية من الربعين ، أي Q 3 - Median = Median - Q 1 .

إذا لم يكن التوزيع متماثلًا ، يشير الرحيل من التماثل إلى التواءه. ويشير الانحراف إلى أن المنحنى يتجه نحو جانب واحد أكثر من الآخر. لذا سيكون المنحنى ذو ذيل طويل على جانب واحد.

ويقال إن التواء يكون إيجابيا إذا كان الذيل الأطول على الجانب الأيمن ويقال إلى السلبية إذا كان الذيل الطويل في الجانب الأيسر.

تظهر الأشكال التالية مظهر منحنى منحرف إيجابياً وسلبياً:

Q 3 - Mdn> Mdn - Q 1 يشير إلى + ve skewness

Q 3 - Mdn <Mdn - Q 1 يشير إلى - skewness

Q 3 - Mdn = Mdn - Q 1 يشير إلى عدم الالتصاق

مزايا س:

1. هو مقياس أكثر تمثيلاً وموثوقاً بالتنوع من المدى الإجمالي.

2. إنه مؤشر جيد لكثافة العلامات في منتصف التوزيع.

3. الأرباع مفيدة في الإشارة إلى تشوه التوزيع.

4. مثل الوسيط ، تنطبق Q على التوزيعات المفتوحة.

5. كلما كان المتوسط ​​المفضل هو مقياس الاتجاه المركزي ، يفضل الانحراف الربعي كمقياس للتشتت.

حدود س:

1. على أية حال ، مثل الإنحراف الوسيط ، فإن الانحراف الربعي غير قابل للمعالجة الجبرية ، لأنه لا يأخذ في الاعتبار جميع قيم التوزيع.

2. تحسب فقط الربعية الثالثة والأولى وتتحدث عنا عن النطاق. من Q 'لا يمكننا الحصول على صورة حقيقية حول كيفية توزيع الدرجات من القيمة المركزية. هذا هو "س" لا يعطينا أي فكرة عن تكوين الدرجات. قد تكون "Q" من سلسلتين متساويتين ، ولكن قد تكون السلسلة متشابهة تمامًا في التركيب.

3. يعطي تقريبا فكرة التشتت.

4. يتجاهل الدرجات أعلى من الربع الثالث والنتائج دون الربع الأول. إنه ببساطة يتحدث عنا عن 50٪ من التوزيع.

استخدامات س:

1. عندما يكون الوسيط مقياس للاتجاه المركزي ؛

2. عندما يكون التوزيع غير مكتمل في أي من الطرفين ؛

3. عندما تكون هناك نقاط متفرقة أو متطرفة تؤثر بشكل غير متناسب على SD ؛

4. عندما يكون التركيز حول الوسيط ، فإن 50٪ من الحالات المتوسطة تكون ذات أهمية أساسية.

معامل الانحراف الرباعي:

إن الانحراف الرباعي هو مقياس مطلق للتشتت ولجعله نسبيًا ، نحسب "معامل انحراف ربعي". يتم احتساب المعامل من خلال تقسيم انحراف الربع بمعدل متوسط ​​الرباعات.

يتم إعطاؤه بواسطة:

معامل الانحراف الربعي = Q 3 - Q 1 / Q 3 + Q 1

حيث يشير Q 3 و Q 1 إلى الربحيتين العلوية والسفلية على التوالي.

التدبير # 3. متوسط ​​الانحراف (AD) أو الانحراف المتوسط ​​(MD):

كما ناقشنا بالفعل النطاق و "Q" يعطينا فكرة عن التباين. قد يكون نطاق سلسلتين هو نفسه أو قد يكون الانحراف الربعي من سلسلتين متشابهتين ، ومع ذلك قد تكون السلسلة اثنين متباينة. لا يتحدث النطاق ولا "Q" عن تركيبة السلسلة. لا يأخذ هذان التدبيران في الاعتبار الدرجات الفردية.

تميل طريقة الانحراف المتوسط ​​أو "الانحراف المتوسط" ، كما يطلق عليه أحيانًا ، إلى إزالة عيب خطير في كلتا الطريقتين (المدى و "Q"). ويسمى متوسط ​​الانحراف أيضا أول لحظة من التشتت ويستند إلى جميع العناصر في سلسلة.

متوسط ​​الانحراف هو المتوسط ​​الحسابي لانحرافات سلسلة محسوبة من بعض مقاييس الاتجاه المركزي (المتوسط ​​، الوسيط أو النمط) ، جميع الانحرافات تعتبر إيجابية. بمعنى آخر ، يُعرف متوسط ​​الانحرافات لجميع القيم من الوسط الحسابي بأنه متوسط ​​الانحراف أو الانحراف المتوسط. (عادة ، يتم أخذ الانحراف من وسيلة التوزيع.)

حيث ∑ هو المجموع الإجمالي ؛

X هي النتيجة ؛ M هو المتوسط N هو العدد الإجمالي للدرجات.

و "د" تعني انحراف الدرجات الفردية عن المتوسط.

حساب متوسط ​​الانحراف (بيانات غير مجمعة):

المثال 8:

العثور على متوسط ​​الانحراف للمجموعة التالية من الأشكال:

X = 55 ، 45 ، 39 ، 41 ، 40 ، 48 ، 42 ، 53 ، 41 ، 56

حل:

من أجل إيجاد انحراف متوسط ​​، نحسب أولاً متوسط ​​مجموعة الملاحظات.

ويرد في الجدول 4-2 الانحرافات والانحرافات المطلقة:

مثال 9:

ابحث عن متوسط ​​الانحراف للنتائج المذكورة أدناه:

25 و 36 و 18 و 29 و 30 و 41 و 49 و 26 و 16 و 27

تم العثور على متوسط ​​الدرجات المذكورة أعلاه ليكون 29.7.

لحساب متوسط ​​الانحراف:

ملحوظة:

إذا قمت بتطبيق بعض الجبر ، يمكنك أن ترى أن ∑ (X - M) هو صفر

حساب متوسط ​​الانحراف (البيانات المجمعة):

مثال 10:

العثور على الانحراف المتوسط ​​لتوزيع الترددات التالي:

هنا ، في العمود 1 ، نكتب ci 's ، في العمود 2 ، نكتب الترددات المقابلة ، في العمود 3 ، نكتب النقاط الوسطى لـ ci' التي تشير إليها 'X' ، في العمود 4 ، نكتب نواتج الترددات ونقاط الوسط لـ ci التي تشير إليها X، في العمود 5، نكتب الانحرافات المطلقة لنقاط منتصف ci من المتوسط ​​الذي تدل عليه | d | وفي العمود 6 ، نكتب نتاج الانحرافات والترددات المطلقة ، المشار إليها بـ | fd |.

مزايا متوسط ​​الانحراف:

1. يعني الانحراف أبسط مقياس للتشتت يأخذ في الاعتبار جميع القيم في توزيع معين.

2. من السهل فهمها حتى من قبل شخص ليس على دراية جيدة في الإحصاءات.

3. لا يتأثر كثيرا من قيمة العناصر المتطرفة.

4. هو متوسط ​​انحراف الدرجات الفردية عن المتوسط.

محددات:

1. الانحراف يعني تجاهل العلامات الجبرية للانحرافات ، وبالتالي فهو غير قادر على مزيد من المعالجة الرياضية. لذلك ، يتم استخدامه فقط كمقياس وصفي للتغير.

2. في الواقع ، MD ليس في الاستعمال الشائع. ونادرا ما يستخدم في الاحصاءات الحديثة ويتم دراسة التشتت عموما بالانحراف المعياري.

استخدامات MD:

1. عند الرغبة في وزن جميع الانحرافات وفقا لحجمها.

2. عندما يكون مطلوباً معرفة مدى انتشار التدابير على جانبي الوسط.

3. عندما تؤثر الانحرافات المفرطة دون مبرر على الانحراف المعياري.

تفسير متوسط ​​الانحراف:

لتفسير متوسط ​​الانحراف ، من الأفضل دائمًا النظر فيه مع متوسط ​​وعدد الحالات. المتوسط ​​مطلوب لأن الوسط ووسط الانحراف هما على التوالي النقطة والمسافة على نفس مقياس القياس.

بدون المتوسط ​​، لا يمكن تفسير الانحراف المتوسط ​​، حيث لا يوجد أي دليل لمقياس القياس أو وحدة القياس. عدد الحالات مهم لأن مقياس التشتت يعتمد عليها. بالنسبة لعدد أقل من الحالات ، من المحتمل أن يكون المقياس أكثر.

في المثالين ، لدينا:

في الحالة الأولى ، يعني الانحراف تقريبا 25٪ من المتوسط ​​، بينما في الحالة الثانية يكون أقل. ولكن قد يكون الانحراف المتوسط ​​أكثر في الحالة الأولى بسبب عدد أقل من الحالات. لذا فإن الانحرافين المتوسطين المحسوبين أعلاه يشيران إلى تشتت مماثل تقريبًا.

التدبير # 4. الانحراف المعياري أو SD و Variance:

من بين العديد من مقاييس التشتت ، يعتبر المقياس الأكثر استخدامًا هو "الانحراف المعياري". وهو أيضا الأكثر أهمية بسبب كونه المقياس الوحيد للتشتت القابل للعلاج الجبري.

هنا أيضا ، تعتبر انحرافات عن جميع القيم من وسيلة التوزيع. هذا الإجراء يعاني من أقل عيوب ويوفر نتائج دقيقة.

إنه يزيل العيب في تجاهل العلامات الجبرية أثناء حساب انحرافات العناصر من المتوسط. بدلاً من إهمال العلامات ، نقوم بتوزيع الانحرافات ، مما يجعلها إيجابية.

وهو يختلف عن ميلادي في عدة جوانب:

أنا. في الحوسبة أو MD ، نتجاهل العلامات ، بينما في العثور على SD نتجنب صعوبة الإشارات عن طريق تربيع الانحرافات المنفصلة ؛

ثانيا. دائماً ما يتم أخذ الانحرافات التربيعية المستخدمة في حساب SD من الوسط ، وليس من الوسيط أو النمط.

"الانحراف المعياري أو SD هو الجذر التربيعي لمتوسط ​​الانحرافات التربيعية للدرجات الفردية من متوسط ​​التوزيع".

ولكي نكون أكثر وضوحًا ، يجب أن نلاحظ هنا أنه عند حساب SD ، نقوم بتجميع كل الانحرافات بشكل منفصل. ابحث عن مجموعهم ، قسّم المجموع على العدد الإجمالي للعشرات ، ثم ابحث عن الجذر التربيعي لمتوسط ​​الانحرافات المربعة.

يسمى SD أيضًا "الانحرافات الجذرية للمربع" من المتوسط ​​، ويتم الإشارة إليها عمومًا بالحرف اليوناني الصغير σ (sigma).

رمزياً ، يتم تعريف الانحراف المعياري للبيانات غير المبوبة على النحو التالي:

حيث d = انحراف الدرجات الفردية عن المتوسط ​​؛

(يستخدم بعض المؤلفين "س" على أنها انحراف الدرجات الفردية عن المتوسط)

sum = مجموع المجموع ؛ N = العدد الإجمالي للحالات.

يشار إلى انحرافات المربعات المتوسطة على أنها تباين. أو بكلمات بسيطة ، يسمى مربع معيار الانحراف "لحظة التشرد أو التباين".

حساب SD (بيانات غير مجمعة):

هناك طريقتان لحساب SD للبيانات غير المبوبة:

(أ) الطريقة المباشرة.

(ب) الطريقة المختصرة.

(أ) الطريقة المباشرة:

ابحث عن الانحراف المعياري للدرجات الواردة أدناه:

X = 12 ، 15 ، 10 ، 8 ، 11 ، 13 ، 18 ، 10 ، 14 ، 9

تستخدم هذه الطريقة الصيغة (18) للبحث عن SD الذي يتضمن الخطوات التالية:

الخطوة 1:

حساب المتوسط ​​الحسابي للبيانات المعطاة:

الخطوة 2:

اكتب قيمة الانحراف d ie X - M مقابل كل درجة في العمود 2. وهنا يجب أخذ انحراف الدرجات من 12. الآن ستجد أن ∑d أو ∑ (X - M) تساوي الصفر. فكر ، لماذا هو كذلك؟ افحصها. إذا لم يكن الأمر كذلك ، فابحث عن الخطأ في الحساب وتصحيحه.

الخطوه 3:

قم بخلع الانحرافات واكتب قيمة d 2 مقابل كل درجة في العمود 3. ابحث عن مجموع الانحرافات التربيعية. 2d 2 = 84.

الجدول 4.5 حساب SD:

الانحراف المعياري المطلوب هو 2.9.

الخطوة الرابعة:

حساب متوسط ​​الانحرافات التربيعية ثم معرفة الجذر التربيعي الموجب للحصول على قيمة الانحراف المعياري مثل σ.

باستخدام الصيغة (19) ، سيكون التباين σ 2 = 2d 2 / N = 84/10 = 8.4

(ب) الطريقة المختصرة:

في معظم الحالات ، يحدث المتوسط ​​الحسابي للبيانات المعطاة كقيمة كسرية ، ثم تصبح عملية أخذ الانحرافات وتربيعها عملية شاقة واستهلاك الجير في حساب SD

لتسهيل الحساب في مثل هذه الحالات ، قد يتم أخذ الانحرافات من متوسط ​​مفترض. ستكون الصيغة المختصرة المختصرة لحساب SD عندئذ ،

أين،

د = الانحراف عن النتيجة من وسط مفترض ، مثلا AM ؛ أي د = (س - صباحا).

د 2 = مربع الانحراف.

=d = مجموع الانحرافات.

2d 2 = مجموع انحرافات التربيعية.

N = عدد الدرجات أو المتغيرات.

يتم توضيح إجراء الحساب في المثال التالي:

المثال 11:

أوجد SD للعلامات المعطاة في الجدول 4.5 من X = 12 ، 15 ، 10 ، 8 ، 11 ، 13 ، 18 ، 10 ، 14 ، 9. استخدم الطريقة المختصرة.

حل:

دعونا نأخذ المتوسط ​​المفترض AM = 11.

وترد في الجدول التالي انحرافات ومربعات الانحرافات المطلوبة في الصيغة:

وضع القيم من الجدول في الصيغة ، و SD

الطريقة المختصرة تعطي نفس النتيجة التي حصلنا عليها باستخدام الطريقة المباشرة في المثال السابق. لكن الطريقة المختصرة تقلل من عملية الحساب في الحالات التي لا يكون فيها المتوسط ​​الحسابي عددًا صحيحًا.

حساب SD (البيانات المجمعة):

(أ) الطريقة الطويلة / الطريقة المباشرة:

المثال 12:

ابحث عن SD للتوزيع التالي:

وهنا أيضًا ، تتمثل الخطوة الأولى في العثور على المتوسط ​​M ، الذي يجب أن نأخذ منه النقاط المتوسطة لـ c.i التي يشير إليها X 'والعثور على المنتج f X.'. يُعطى المتوسط ​​بـ ∑ f x '/ N. الخطوة الثانية هي العثور على انحرافات النقاط المتوسطة للفواصل الزمنية X 'من المتوسط ​​أي X'- M الذي يشير إليه d.

الخطوة الثالثة هي انحراف الانحرافات والعثور على منتج الانحرافات التربيعية والتردد المقابل.

لحل المشكلة المذكورة أعلاه ، تتم كتابة ci في العمود 1 ، تتم كتابة الترددات في العمود 2 ، تتم كتابة النقاط المتوسطة من c.i أي X 'في العمود 3 ، مكتوب منتج f X' في العمود 4 ، الانحراف من X 'من المتوسط ​​مكتوب في العمود 5 ، تتم كتابة الانحراف التربيعي d 2 في العمود 6 ، ويتم كتابة المنتج f d 2 في العمود 7 ،

كما هو مبين أدناه:

لذا ، فإن انحرافات نقاط المنتصف ستؤخذ من 11.1.

وبالتالي ، فإن الانحراف المعياري المطلوب هو 4.74.

(ب) الطريقة المختصرة:

في بعض الأحيان ، في الطريقة المباشرة ، يلاحظ أن الانحرافات عن النتائج الفعلية للقيمة العشرية وقيم d 2 و fd 2 يصعب حسابها. من أجل تجنب هذه المشكلة ، نتبع طريقة قص قصيرة لحساب الانحراف المعياري.

في هذه الطريقة ، بدلاً من أخذ الانحرافات عن المتوسط ​​الفعلي ، نتخذ انحرافات عن متوسط ​​مفترض مناسب ، قول AM

ثم يتم استخدام الصيغة التالية لحساب SD:

حيث d هو الانحراف عن المتوسط ​​المفترض.

ثم يتم تضمين الخطوات التالية في حساب الانحراف المعياري:

(1) الحصول على انحرافات عن المتغيرات من المتوسط ​​المفترض AM كما d = (X - AM)

(2) قم بضرب هذه الانحرافات بالترددات المقابلة للحصول على عمود fd . مجموع هذا العمود يعطي ∑ fd.

fd مع الانحراف المقابل (d)

(3) اضرب للحصول على العمود fd 2 . سيكون مجموع هذا العمود ∑ fd 2 .

(4) استخدم الصيغة (22) للعثور على SD

المثال 13:

باستخدام طريقة اختصار البحث عن SD من البيانات في الجدول 4.7.

حل:

دعونا نأخذ القيمة المفترضة AM = 10. وترد الحسابات الأخرى اللازمة لحساب SD في الجدول 4.8.

وضع القيم من الجدول

باستخدام الصيغة (19) ، التباين

(ج) طريقة الخطوة الانحراف:

في هذا الأسلوب ، في العمود 1 نكتب ci 's؛ في العمود 2 نكتب الترددات. في العمود 3 نكتب قيم d ، حيث d = X'-AM / i؛ في العمود 4 نكتب منتج fd ، وفي العمود 5 ، نكتب قيم fd 2 ، كما هو موضح أدناه:

هنا ، المفترَط المتوسط ​​هو النقطة الوسطى لـ 9-11 أي 10 ، لذلك تم أخذ الانحرافات d من 10 وقسمت على 3 ، طول ci صيغة SD في طريقة الانحراف الانحرافي

حيث i = طول ال c.i ،

و = تردد ؛

د = انحرافات النقاط الوسطى لـ ci من المتوسط ​​المفترض (AM) في فاصل (i) فئتي ، والتي يمكن ذكرها:

وضع القيم من الجدول

يمكن أيضا ذكر إجراءات الحساب بالطريقة التالية:

الانحراف المعياري المشترك ( σ com b ):

عند الجمع بين مجموعتين من الدرجات في حصة واحدة ، يمكن حساب σ التوزيع الكلي من σ الخاص بتوزيعات المكونين.

الصيغة هي:

حيث σ 1 ، = SD للتوزيع 1

σ 2 = SD للتوزيع 2

d 1 = (M 1 - M comb )

d 2 = (M 2 - M comb )

ن 1 = عدد الحالات في التوزيع 1.

ن 2 = عدد الحالات في التوزيع 2.

مثال يوضح كيفية استخدام الصيغة.

المثال 14:

لنفترض أننا حصلنا على الوسائل و SD في اختبار الإنجاز لفئتين مختلفتين في الحجم ، ويطلب منهم العثور على المجموعة المدمجة.

البيانات هي كما يلي:

أولا ، نجد ذلك

يمكن تمديد الصيغة (24) إلى أي عدد من التوزيعات. على سبيل المثال ، في حالة ثلاث توزيعات ، سيكون

خصائص SD:

1. في حالة زيادة كل قيمة متباينة بنفس القيمة الثابتة ، تبقى قيمة SD للتوزيع بدون تغيير:

سنناقش هذا التأثير على SD من خلال النظر في التوضيح. يعرض الجدول (4-10) الدرجات الأصلية من 5 طلاب في اختبار بمتوسط ​​حسابي قدره 20.

يتم إعطاء الدرجات الجديدة (X ') أيضًا في نفس الجدول الذي نحصل عليه بإضافة ثابت 5 لكل درجة أصلية. باستخدام صيغة البيانات غير المبوبة ، نلاحظ أن SD من الدرجات يبقى كما هو في كلتا الحالتين.

وبالتالي ، تظل قيمة SD في كلتا الحالتين كما هي.

2. عندما يتم طرح قيمة ثابتة من كل متغير ، تبقى قيمة SD للتوزيع الجديد بدون تغيير:

يمكن للطلاب أيضًا أن يدرسوا أنه عندما نطرح ثابتًا من كل درجة ، ينخفض ​​المتوسط ​​بالثابت ، ولكن SD هو نفسه. ومن المقرر أن السبب هو أن " د " لم يتغير.

3. إذا تم ضرب كل قيمة ملاحظتها بقيمة ثابتة ، فسيتم ضرب SD من الملاحظات الجديدة بنفس الثابت:

دعونا نضاعف كل درجة من التوزيع الأصلي (الجدول 4-10) في 5.

وبالتالي ، سيتم ضرب SD للتوزيع الجديد بنفس الثابت (هنا ، هو 5).

4. إذا تم تقسيم كل قيمة ملاحظتها على قيمة ثابتة ، سيتم أيضًا تقسيم SD من الملاحظات الجديدة على نفس الثابت. يمكن للطلاب فحص مع مثال:

وهكذا ، في الختام ، SD مستقلة عن تغيير المنشأ (الجمع والطرح) ولكن تعتمد على تغيير الحجم (الضرب والقسمة).

قياسات التشتت النسبي (معامل الاختلاف):

تعطي لنا مقاييس التشتت فكرة عن مدى انتشار النقاط حول قيمتها المركزية. لذلك ، يمكن مقارنة توزيعين تردد لهما نفس القيمتين المركزية مباشرة بمساعدة مختلف مقاييس التشتت.

إذا ، على سبيل المثال ، في اختبار في الفصل الدراسي ، فإن الأولاد لديهم متوسط ​​درجات M = = 60 مع SD σ 1 = 15 والفتيات يعني أن النتيجة هي M 2 = 60 مع SD σ 2 = 10. من الواضح أن الفتيات اللواتي لديهن SD أقل ، هي أكثر اتساقا في تسجيل درجات حول متوسط ​​درجاتهم من الفتيان.

لدينا حالات عندما يتم مقارنة توزيعين أو أكثر لهما وسائل غير متساوية أو وحدات مختلفة من القياسات فيما يتعلق بتشتتهما أو تباينهما. لإجراء مثل هذه المقارنات ، نستخدم معاملات التشتت النسبي أو معامل الاختلافات (CV).

الصيغة هي:

(معامل الاختلاف أو معامل التغير النسبي)

يعطي V النسبة التي تكون of من متوسط ​​الاختبار. ومن ثم فهي نسبة مستقلة عن وحدات القياس.

V مقيد في استخدامه بسبب بعض الغموض في تفسيره. وهي قابلة للدفاع عند استخدامها مع مقاييس النسب - المقاييس التي تكون فيها الوحدات متساوية وهناك نقطة الصفر الحقيقية أو المرجعية.

على سبيل المثال ، يمكن استخدام V بدون تردد في المقاييس الفيزيائية - تلك المعنية بالمقاييس الخطية والوزن والوقت.

تنشأ حالتان في استخدام V مع مقاييس النسب:

(1) عندما تختلف الوحدات ، و

(2) عندما تكون M غير متساوية ، تكون وحدات القياس هي نفسها.

1. عندما تختلف الوحدات عن:

المثال 15:

مجموعة من الفتيان يبلغ من العمر 10 سنوات يبلغ متوسط ​​ارتفاعها 137 سم. مع س من 6.2 سم. نفس مجموعة الأولاد يبلغ وزنها 30 كجم. مع 3.5 كجم. في أي سمة ، هل المجموعة أكثر متغيرًا؟

حل:

من الواضح أنه لا يمكننا المقارنة بين السنتيمترات والكيلوجرامات مباشرة ، ولكن يمكننا مقارنة التباين النسبي للتوزيعين من حيث V.

في المثال الحالي ، لا تختلف مجموعتان فقط فيما يتعلق بالوسط ، ولكن أيضًا في وحدات القياس التي تبلغ cm. في الحالة الأولى والكيلوغرام. في الثانية. يمكن استخدام معامل التباين لمقارنة تقلب المجموعات في مثل هذه الحالة.

نحن ، وبالتالي حساب:

وهكذا ، من الحساب أعلاه ، يبدو أن هؤلاء الأولاد يتضاعف وزنهم (11.67 / 4.53 = 2.58) في الوزن كما في الارتفاع.

2. عندما تكون الوسائل غير متساوية ، ولكن وحدات القياس هي نفسها :

لنفترض أن لدينا البيانات التالية حول اختبار لمجموعة من الفتيان ومجموعة من الرجال:

ثم قارن:

(ط) أداء المجموعتين على الاختبار.

(2) تباين الدرجات في المجموعتين.

حل:

(ط) بما أن متوسط ​​درجة مجموعة الأولاد أكبر من درجة الرجال ، لذلك أعطت مجموعة البنين أداء أفضل للاختبار.

‘2‘ لمقارنة مجموعتين فيما يتعلق بالتنوع بين الدرجات ، يحسب معامل التباين الخامس للبنين = 26.67 و V للرجال = 38.46.

لذلك ، فإن تقلب درجات أكبر في مجموعة من الرجال. الطلاب في مجموعة الأولاد ، الذين لديهم سيرة ذاتية أقل ، أكثر اتساقا في تسجيل درجاتهم في المتوسط ​​مقارنة بمجموعتهم.

التنمية المستدامة وانتشار الملاحظات:

في توزيع متماثل (طبيعي) ،

(ط) يعني متوسط ​​± 1 SD 68.26 ٪ من الدرجات.

يعني يعني SD 2 SD 95.44 ٪ من النقاط.

يعني يعني ± 3 SD 99.73 ٪ من درجات.

(2) في العينات الكبيرة (العدد = 500) ، يكون المدى حوالي 6 أضعاف SD.

إذا كان N حوالي 100 ، فإن المدى هو حوالي 5 أضعاف SD.

إذا كان N حوالي 50 ، فإن النطاق يبلغ حوالي 4.5 ضعف SD.

إذا كان N حوالي 20 ، فإن المدى هو حوالي 3.7 أضعاف SD

تفسير الانحراف المعياري:

الانحراف المعياري يميز طبيعة توزيع الدرجات. عندما تكون الدرجات أكثر انتشارًا ، يكون SD أكثر و عندما تكون الدرجات أقل تشتتًا SD. لتفسير قيمة مقياس التشتت ، يجب علينا أن نفهم أنه كلما زادت قيمة " σ " كلما كانت النتائج المبعثرة أكثر من المتوسط.

كما في حالة الانحراف المتوسط ​​، يتطلب تفسير الانحراف المعياري قيمة M و N للنظر فيهما.

في الأمثلة التالية ، يتم إعطاء القيم المطلوبة من σ ، يعني و N مثل:

هنا ، يكون التشتت أكثر في المثال 2 مقارنة بالمثال 1. وهو يعني أن القيم أكثر تناثرًا في المثال 2 ، مقارنة بقيم المثال 1.

مزايا SD:

1. يتم تعريف SD بشكل صارم وقيمتها دائما محددة.

2. إنه مقياس التشتت الأكثر استخدامًا والأهمية. تحتل موقعا مركزيا في الإحصاءات.

3. على غرار الانحراف المتوسط ​​، فإنه يعتمد على جميع قيم التوزيع.

4. هنا ، لا يتم تجاهل علامات الانحراف ، بدلا من ذلك يتم القضاء عليها عن طريق تربيع كل من الانحرافات.

5. هو المقياس الرئيسي للتقلبية حيث أنه قابل للمعالجة الجبرية ويستخدم في العمل المترابط وفي التحليل الإحصائي الإضافي.

6. هو أقل تأثرا بتقلبات أخذ العينات.

7. هو المقياس الموثوق والأدق للتنوع. SD دائما مع المتوسط ​​الذي هو المقياس الأكثر موثوقية من الاتجاه المركزي.

8. يوفر وحدة قياس قياسية تمتلك معنى مشابها من اختبار إلى آخر. علاوة على ذلك ، يرتبط المنحنى الطبيعي مباشرة بـ SD

محددات:

1. ليس من السهل حسابها ولا يمكن فهمها بسهولة.

2. إنه يعطي أوزان أكثر للعناصر المتطرفة وأقل إلى تلك القريبة من المتوسط. عندما تربيع الانحراف من درجة متطرفة فإنه يؤدي إلى قيمة أكبر.

استخدامات SD:

يتم استخدام الانحراف المعياري:

(ط) عندما يكون المطلوب إجراء قياس التباين الأكثر دقة وموثوقية وثباتًا.

(2) عندما يعطى المزيد من الوزن للانحرافات الشديدة عن المتوسط.

(3) عندما يتم لاحقاً حساب معامل الارتباط والإحصاءات الأخرى.

(4) عندما يتم حساب مقاييس الموثوقية.

(5) عندما يتم تفسير الدرجات بشكل صحيح مع الإشارة إلى المنحنى الطبيعي.

(6) عندما يتم حساب النقاط القياسية.

(السابع) عندما نريد اختبار أهمية الفرق بين إحصائين.

(ثامنا) عندما يحسب معامل الاختلاف والتباين وما إلى ذلك.