الخطأ المعياري للمتوسط

بعد قراءة هذه المقالة سوف تتعلم عن مستوى المتوسط.

كما يساعدنا الاستدلال الإحصائي على اختبار الفرضية القائلة بأن "الإحصائية المستندة إلى العينة لا تختلف اختلافاً كبيراً عن المعلمة السكانية وأن الاختلاف في حال وجود أي من الملاحظين يرجع فقط إلى اختلاف الصدفة" .

الخطأ المعياري للمتوسط ​​(SE M أو σ M )

الخطأ المعياري للمتوسط ​​(SE M ) مهم جدا لاختبار التمثيل أو الجدارة بالثقة أو أهمية الوسط.

لنفترض أننا قمنا بحساب متوسط ​​درجات 200 فتى في الصف العاشر من دلهي في اختبار القدرة العددية ليكون 40. وبالتالي فإن 40 هو متوسط ​​عينة واحدة فقط مأخوذة من السكان (كل الأولاد يقرؤون في الصف X في دلهي).

يمكننا كذلك استخلاص عينات عشوائية مختلفة من 200 فتى من السكان. لنفترض أن نختار عشوائيا 100 عينة مختلفة ، كل عينة تتكون من 200 الأولاد من نفس السكان ويحسب متوسط ​​كل عينة.

على الرغم من أن العدد "n" هو 200 في كل حالة ، فإن 200 ولد يتم اختيارهم عشوائياً لتشكيل العينات المختلفة غير متطابقين ، وبسبب التقلبات في أخذ العينات ، سنحصل على 100 قيمة متوسطة من هذه العينات المختلفة البالغ عددها 100 عينة.

هذه القيم المتوسطة ستختلف عن بعضها البعض وستشكل سلسلة. هذه القيم تشكل توزيع العينات من الوسائل. يمكن التعبير رياضيا عن أن هذه الوسائل العينة موزعة بشكل طبيعي.

ستندرج القيم المتوسطة الـ 100 (في مثالنا) في توزيع طبيعي حول M pop ، و M pop هو متوسط ​​توزيع عينات الوسائل. ويسمى الانحراف المعياري لهذه الطرق العيّنة الـ100 بـ SE M أو الخطأ المعياري للمتوسط ​​الذي سيكون مساوياً للانحراف المعياري للسكان مقسوماً على الجذر التربيعي (حجم العينة).

يظهر SE M أن انتشار العينة يعني حول M pop . وهكذا SE SE هو مقياس لتقلبات وسائل العينة. إنه مقياس الاختلاف في وسائل العينة من M pop . SE M مكتوبة أيضًا باسم σ M.

يتم حساب الخطأ القياسي للمتوسط ​​(SE M أو σ M ) باستخدام الصيغة (للعينات الكبيرة)

(أ) حساب SE M في عينات كبيرة :

حيث σ = الانحراف المعياري للسكان و

ن = عدد الحالات المدرجة في العينة

(لأننا نادراً ما نمتلك SD من السكان ، لأننا use نستخدم قيمة SD من وسائل العينة).

فاصل الثقة:

إن فترتي الثقة أي 95٪ و 99٪ تستخدمان بشكل عام. تحدد RA Fisher حدود فترة الثقة التي تحتوي على المعلمة على أنها "حدود ائتمانية" وتسمى الثقة الموضوعة في الفترة على أنها احتمال ائتماني.

(أ) 95 ٪ من فترة الثقة:

بالإشارة إلى جدول المساحة تحت المنحنى الطبيعي نجد أن 95٪ من الحالات تقع بين M ± 1.96 SE M. أننا على ثقة 95٪ أو صواب لنقول M pop سوف تكمن في الفاصل الزمني M + 1.96 SE M و M + 1.96 SE M ونحن على خطأ 5٪ القول أن M البوب سوف تكمن جانبا هذا الفاصل الزمني.

بعبارة أخرى ، احتمال وجود البوب M في النطاق M ± 1.96 SE M هو 95٪ (أو .95) ويكون احتمال البوب M خارج النطاق هو 5٪ (أو .05). القيمة ، 1.96 هي القيمة الحرجة عند مستوى 0.05 من الأهمية.

(ب) 99 ٪ من فترة الثقة:

بالإشارة إلى جدول المساحة تحت المنحنى الطبيعي نجد أن 99٪ من الحالات تقع بين M ± 2.58 SE M. أننا على ثقة بنسبة 99٪ أو صواب لنقول M pop سوف تكمن في الفاصل الزمني M-2.58 SE M و M + 2.58 SE M ونحن 1٪ خطأ أن نقول أن M pop سوف تقع خارج هذا الفاصل.

وبعبارة أخرى ، فإن احتمال وجود البوب M في النطاق M ± 2.58 SE M هو 99٪ (أو .99) ويكون احتمال البوب M خارج النطاق هو 1٪ (أو .01). القيمة ، 2.58 هي القيمة الحرجة في مستوى 0.01 من الأهمية.

هنا نجد أن مستوى الأهمية يرتبط عكسيا بمدى الدقة. في مستوى الأهمية البالغ 5 ، سنكون دقيقين في 95٪ من الحالات وفي مستوى 0.01 من الأهمية ، سنكون دقيقين في 99٪ من الإنحرافات.

الجدول التالي سوف يسبقك:

مثال 1:

بلغ متوسط ​​و 125 من الصبيان من الدرجة الثانية عشرة من دلهي في اختبار القدرة العددية 48 و 6 على التوالي. مدى جودة هذا يعني تمثيل M pop أو تقدير M pop . (ن = 225 ، σ = 6 ، المتوسط ​​= 48)

بالإشارة إلى جدول التوزيع الطبيعي (الجدول A) نجد أن معظم الحالات (99.7) جميعها تقع في ±3σ. في حالة مثالنا فإن جميع وسائل العينة سوف تقع بين M pop + 3σ m و M pop - 3σ M. لذلك ، سيكون أي متوسط ​​عينة أفضل بثلاث مرات على الأقل من M M على 3σ M أكثر من M pop .

وبالتالي إذا كنا نعرف قيمة σ M يمكننا الاستدلال على البوب M من متوسط ​​العينة. هنا 4 هو الانحراف المعياري لتوزيع وسائل العينة التي يقصد بها متوسطنا. جميع العينات التي يتم توزيعها عادة حول M pop سوف تقع بين M pop + 3 SE M و M pop - 3 SE M.

3 SE M = 3 x .4 = 1.2

على الرغم من أننا لا نعرف القيمة الدقيقة لـ M pop ، يمكننا على الأقل أن نقول بثقة أن M pop يكمن بينهما

(48 -1.2) و (48 + 1.2) أو 46.8 → 49.2

من الجدول (أ) نجد أن 95٪ من الاحتمالات تقع بين ± 1.96 σ. في حالة مثالنا 95 ٪ فاصل الثقة للنطاقات M M من M - 1.96 SE M إلى M + 1.96 SE M.

الآن ، 1.96 SE M = 1.96 x .4 = .78

. . . M- 1.96 SE M = 48 - .78 = 47.22 و M + 1.96 SE M = 48 + .78 = 48.78

. . . تتراوح فواصل الثقة 95٪ من 47.22 إلى 48.78. فاصل الثقة 99 ٪ للنطاقات M M من M - 2.58 SE M إلى M + 2.58 SE M.

الآن 2.58 SE M = 2.58 X .4 = 1.03

. . . M - 2.58 SE M = 48 -1.03 = 46.97 و M + 2.58 SE M = 48 + 1.03 = 49.03

. . . فاصل الثقة 99 ٪ للنطاقات الشعبية M من 46.97 إلى 49.03.

المثال 2:

تم العثور على المتوسط ​​و SD من 400 طالب في اختبار أن يكون 42 و 8. يمكنك تقدير متوسط ​​درجة السكان في كل من فترة الثقة 99 ٪ و 95 ٪؟

حل:

(ط) فاصل ثقة قدره 95٪ لنطاقات البوب M من M - 1.96 SE M إلى M + 1.96 SE M.

الآن 1.96 SE M = 1.96 x .4 = .784

. . . M-1.96 SE M = 42-.784 = 41.22

و M + 1.96 SE M = 42 + .784 = 42.78 (حتى رقمين عشريين).

وبالتالي تتراوح فواصل الثقة 95٪ من 41.22 إلى 42.78. نحن دقيقون بنسبة 95٪ أن M pop يكمن بين 41.22 إلى 42.78.

(2) فاصل ثقة 99٪ لنطاقات البوب M من M - 2.58 SE M إلى M + 2.58 SE M

الآن 2.58 SE M = 2.58 x 4 = 1.03

. . . M - 2.58 SE M = 42- 1.03 = 40.97

و M +2.58 SE M = 42 + 1.03 = 43.03

وبالتالي تتراوح فواصل الثقة 99 ٪ من 40.97 إلى 43.03. نحن واثقون بنسبة 99٪ أن M m pop تقع بين 40.97 و 43.03.

المثال 3:

وسائل و SD لعينة من 169 فتى في اختبار القدرة العددية هي 50 و 6 على التوالي:

(ط) تحديد فاصل 95٪ لمتوسط ​​عدد السكان وتفسيره.

(2) تحديد الخطأ المعتمد للمعاينة عند مستوى الأهمية 0.05 و .01.

(3) تحديد 99 ٪ فاصل الثقة ل M البوب .

حل:

م = 50

(1) فاصل الثقة 95٪ لمدى Mp 0p من M - 1.96 SE M إلى M + 1.96 SE M.

الآن 1.96 SE m = 1.96 x .46 = .90

وبالتالي M-1.96 SE M = 50-.90 = 49.10

و M + 1.96 SE M = 50 +.90 = 50.90

. . . فاصل الثقة 95 ٪ لنطاقات البوب M من 49.10 إلى 50.90. من العينة 50 ، نقدر أن البوب M هو قيمة ثابتة ما بين 49.10 و 50.90 ، ونقول إننا متأكدون بنسبة 95٪.

بعبارة أخرى ، لن تفوت عينة العينة 50 الخاصة بنا البوب M بأكثر من .90 ، وسيكون هذا صحيحًا بالنسبة لـ 95 حالة في 100. وبدلاً من ذلك ، في 5 حالات فقط في 100 ، سيفوت نموذج العينة 50 الخاص بنا أكثر من.

(2) القيمة الحرجة عند مستوى 0.05 للدلالة = 1.96

القيمة الحرجة عند مستوى 0،01 للدلالة = 2.58

"خطأ في المعاينة = قيمة حرجة × SE م "

وبالتالي فإن الخطأ في أخذ العينات عند مستوى 0.05 من الأهمية هو 1.96 SE M وأن مستوى الأهمية 0،0 هو 2.58 SE M

خطأ أخذ العينات المقبول عند 0.05 = 1.96 SE M = 1.96 x .46 = .90

الخطأ المسموح به لأخذ العينات عند 0،01 = 2.58 SE M = 2.58 X .46 = 1.19

(3) تتراوح فواصل الثقة 99٪ من M - 2.58 SE M إلى M + 2.58 SE M

الآن 2.58 SE M = 2.58 X .46 = 1.19

وبالتالي M-2.58 SE M = 50- 1.19 = 48.81

و M +2.58 SE M = 50 + 1.19 = 51.19

تتراوح فواصل الثقة 99٪ من 48.81 إلى 51.19.

المثال 4:

بالنسبة لمجموع معين من 500 جندي ، فإن معدل AGCT هو 95.00 و SD هو 25.

(ii) تحديد فاصل الثقة .99 للمتوسط ​​الصحيح.

(2) من غير المحتمل أن يكون المتوسط ​​الحقيقي أكبر من أي قيمة؟

حل:

(1) تتراوح فواصل الثقة 99٪ من M - 2.58 SE M إلى M + 2.58 SE M.

الآن 2.58 SE M = 2.58 x 1.12 = 2.89

وبالتالي M-2.58 SE M = 95.0-2.89 = 92.11

و M + 2.58 SE M = 95.0 + 2.89 = 97.89

. . . تتراوح فواصل الثقة 99٪ من 92.11 إلى 97.89.

من خلال عينة من 95.0 نقدر المتوسط ​​الحقيقي ليكون بعض القيم الثابتة بين 92.11 و 97.89 وقلنا لذلك نحن واثقون بنسبة 99٪.

(2) لن يفوت متوسط ​​العينة لدينا 95.0 الوسط الحقيقي بأكثر من 2.89 ، أي أن true ليس أكبر من 97.89.

(ب) حساب SE M في عينة صغيرة:

من المعتاد استدعاء أي عينة أكبر من 30 عينة كبيرة. عندما يكون N كبيرًا ، لا يجدي التصحيح. ولكن عندما تكون N "صغيرة" (أقل من 30) ، فمن المستحسن استخدام (N - 1) ، ومن الضروري عندما يكون N صغيرًا جدًا - أقل من 10.

يجب على الطالب أن يتذكر (1) أنه يجب استخدام النظرية (N - 1) دائمًا عندما يكون SD بمثابة تقدير للسكان ؛ (2) أن التمييز بين "إحصاءات العينات الكبيرة" و "إحصاءات العينات الصغيرة" من حيث نقطة القطع في N = 30 هو أمر تعسفي ، وهو في جزء منه مسألة ملائمة.

عندما يكون N أقل من 30 تقريباً ، يجب قراءة الصيغة لـ M أو M SE:

المثال 5:

بعد حصول خمسة طلاب على درجات في اختبار:

تحديد حدود حدود الثقة 95 ٪ لمتوسط ​​عدد السكان.

الدرجات هي - 11 ، 13 ، 9 ، 12 ، 15:

حل:

M = 12

هنا df = n- 1 = 5-1 = 4

بالإشارة إلى الجدول D ، مع df = 4 ، تكون قيمة t -value عند مستوى 0.05 للدلالة (أي مستوى ثقة 95٪) هي 2.78.

تحدد فاصل الثقة 95٪ M ± 2.78 SE M

2.78 SE M = 2.78 x 1.0 = 2.78

M - 2.78 SE M = 12 - 2.78 x1.0 = 9.22 and

M + 2.78 SE M = 12 + 2.78 x1.0 = 14.78

. . . حدود فاصل الثقة 95٪ هي 9.22 و 14.78.

هذا يعني أن P = .95 أن M pop يكمن في الفترة الزمنية 9.22 إلى 14.78.

مثال 6:

تؤخذ عشرة مقاييس من وقت رد الفعل للضوء من المراقب الممارس. المتوسط ​​هو ms 175.50 (مللي ثانية) و S 5.82 مللي ثانية. تحديد فاصل الثقة .95 للبوب M ؛ فاصل الثقة .99.

حل:

n = 10، S = 5.82 ms، M = 175.50 ms

تكون df (درجات الحرية) المتاحة لتحديد t (n - 1) أو (10 - 1) = 9

(ط) تحديد 95 ٪ (أو 95) فاصل الثقة:

عند دخول الجدول D مع 9 df ، نقرأ أن t = 2.26 عند النقطة .05.

فاصل الثقة 95 ٪ ل M نطاقات البوب من M - 2.26 SE M إلى M + 2.26 SE M.

الآن 2.26 SE M = 2.26 × 1.84 = 4.16

وبالتالي M - 2.26 SE M = 175.50 -4.16 = 171.34

و M + 2.26 SE M = 175.50 + 4.16 = 179.66

. . . فاصل الثقة 95 ٪ للنطاقات البوب M من 171.34 إلى 179.66. P هو .95 أن البوب M ليس أقل من 171.34 ولا أكبر من 179.66. إذا استنتجنا أن البوب M يكمن في هذا الفاصل الزمني ، فعلى مدى سلسلة طويلة من التجارب ، يجب أن نكون على صواب بنسبة 95٪ من الوقت و 5٪ خطأ.

(ب) تحديد فترة الثقة 99٪ (أو .99):

بدخول الجدول D مع 9 df ، نقرأ أن t = 3.25 عند النقطة 0،01. فاصل الثقة 99 ٪ للنطاقات الشعبية M من M - 3.25 SE M إلى M + 3.25 SE M.

الآن 3.25 SE M = 3.25 × 1.84 = 5.98

وبالتالي M - 3.25 SE M = 175.50 - 5.98 = 169.52

و M + 3.25 SE M = 175.50 + 5.98 = 181.48

. . . فاصل الثقة 99 ٪ للنطاقات بوب M من 169.52 إلى 181.48.

P هو .99 أن البوب M ليس أقل من 169.52 ولا أكبر من 181.48. إذا استنتجنا أن البوب M يكمن في هذا الفاصل الزمني ، فعلى مدى سلسلة طويلة من التجارب ، يجب أن نكون على صواب بنسبة 99٪ من الوقت ونسبة خطأ 1٪.

الاستدلالات المتعلقة بالاحصائيات الأخرى:

بما أن جميع الإحصائيات لها توزيعات لأخذ العينات وأخطاء معيارية ، يمكن تفسير أهمية الانحراف المتوسط ​​، والانحراف الرباعي ، والانحراف المعياري ، والنسب المئوية ، وغيرها من الإحصائيات ، مثلما هو الحال في المتوسط ​​ويمكننا تقدير المعلمة.

(1) الخطأ القياسي في الوسيط (أو SE Mdn -):

من حيث SD و Q ، يمكن حساب SE من الوسيط للعينات الكبيرة من خلال اتباع الصيغ التالية:

حيث σ = SD من العينة ، n = حجم العينة و Q = الانحراف الربعي للعينة.

مثال يوضح استخدام وتفسير الصيغ:

مثال 7:

على مقياس Trabue Language A ، حقق 801 من الفتيان البالغ عددهم 1101 الرقم القياسي التالي:

الوسيط = 21.40 و Q = 4.90. إلى أي مدى يمثل هذا الوسيط متوسط ​​السكان الذي تم رسم هذه العينة منه؟

حل:

n = 801 ، Mdn = 21.40 ، Q = 4.90.

من خلال تطبيق الصيغة الثانية ، فإن

نظرًا لأن N كبير ، يمكن اعتبار توزيع أخذ العينات أمرًا عاديًا وفترة الثقة التي تم العثور عليها من السطر الأخير في الجدول D. فاصل الثقة .99 ل popn هو 21.40 ± 2.58 x .32 أو 21.40 ± .83.

قد نكون على ثقة من أن متوسط ​​السكان لا يقل عن 20.57 ولا يزيد عن 22.23. يبين هذا النطاق الضيق درجة عالية من الجدارة بالثقة في نموذج العينة.

(2) الخطأ المعياري للانحراف المعياري (SE σ ):

تم العثور على الخطأ المعياري للانحراف المعياري ، مثل SE M ، من خلال حساب الانحراف المحتمل لعينة SD من معلمتها (سكان SD). صيغة SE σ هي

المثال 8:

ن = 400 ، σ = 6

إلى أي مدى يمثل SD هذا SD للسكان الذين يتم رسم العينة منهم؟

حل:

عندما تكون العينات كبيرة ويتم سحبها عشوائياً من سكانها ، يمكن تطبيق الصيغة أعلاه وتفسيرها بنفس طريقة SE M.

ونظرًا لأن N كبير ، يمكن أخذ فاصل الثقة .99 لـ SD pop بأمان عند الحدود ± 2.58 σ σ . التعويض عن σ σ لدينا 6 ± 2.58 x .21 أي الحدود بين (6 - .54) و (6 + .54) أو 5.46 و 6.54.

إذا افترضنا أن البوب SD يقع بين الحدود 5.46 و 6.54 ، فيجب أن نكون على صواب بنسبة 99٪ من الوقت ونسبة خطأ 1٪.

(iii) الخطأ المعياري للانحراف الرباعي (أو SE Q أو σ q ):

يمكن العثور على SE Q من الصيغ:

مثال 9:

ن = 801 ، س = 4.90

إلى أي مدى يمثل Q هذا التغير الرباعي السكاني؟

حل:

من خلال تطبيق الصيغة

فاصل الثقة .99 للبوب من Q هو 4.90 ± 2.58 x .203 أي من 4.38 إلى 5.42. يوضح هذا النطاق أن العينة Q هي إحصائيات يمكن الاعتماد عليها بشكل كبير.

(4) الخطأ القياسي للنسبة المئوية (أو SE٪ أو σ٪):

إعطاء النسبة المئوية لحدوث سلوك ، السؤال الذي يطرح نفسه في كثير من الأحيان مدى الثقة التي يمكن أن نضعها في الشكل. ما مدى موثوقية المؤشر هو النسبة المئوية لنا من حدوث السلوك الذي نحن مهتمون به؟ للإجابة على هذا السؤال ،

يجب أن نحسب SE النسبة المئوية من خلال الصيغة:

بحيث

p = النسبة المئوية لحدوث السلوك ، q = (1 - p)

ن = عدد الحالات.

مثال 10:

في دراسة أجريت على الغش بين أطفال المدارس الابتدائية ، وجد أن 100 أو 25٪ من 400 طفل من منازل ذات وضع اجتماعي-اقتصادي عال قد خدعوا في اختبارات مختلفة. إلى أي مدى تمثل نسبة السكان؟

حل:

ع = 25 ٪ (النسبة المئوية للحدث)

q = 75٪ (100٪ - 25٪)

99 ٪ فاصل الثقة لنسبة السكان يتراوح من

25٪ ± 2.58 x 2.17٪.

25٪ - 2.58 x 2.17٪ = 25٪ - 5.60٪ = 19.4٪

و 25٪ + 2.58 x 2.17٪ = 25٪ + 5.60 = 30.60٪

يمكننا أن نفترض بنسبة 99٪ أن أطفال المدارس الابتدائية الذين يتمتعون بوضع اجتماعي-اقتصادي عال سيخدعون بما لا يقل عن 19.4٪ ولن يكونوا أكبر من 30.60٪.

(ت) الخطأ المعياري لمعامل الارتباط (SE r أو σ r ):

الصيغة الكلاسيكية ل SE من أ

(SE من معامل الارتباط r عندما تكون N كبيرة)

المثال 11:

ن = 120 ، ص = .60.

ما هي حدود فاصل الثقة 99 ٪ للسكان ص

حل:

فاصل الثقة 99 ٪

= r ± 2.58 SE r = .60 ± 2.58 SE r

= .60 ± 0.15 أو .45 إلى .75

شروط إحصائية هامة:

(ط) المستويات:

0.05:

احتمال حدوث خطأ في 5 عينات من بين 100 عينة.

0.01:

احتمال حدوث خطأ في عينة واحدة من بين 100 عينة.

(2) الثقة:

في مستوى 0.05 من الأهمية لدى المجرب ثقة 95 ٪ بأن البيانات يجب أن تمثل السكان.

في المستوى .01 من الأهمية ، يمتلك المجرب ثقة بنسبة 99٪ بأن عينة الإحصاء يجب أن تمثل السكان.

(3) مستويات الأهمية:

قبل اختبار الفرضية ، علينا أن نقرر المعايير التي نرغب في قبول أو رفض فرضية العدم. يجب علينا إعداد مستوى الأهمية قبل الاختبار. مستويين من الأهمية هي في الاستخدام العام أي. ، مستوى 0.05 و .01 المستوى.

(أ) .05 مستوى الأهمية:

نقرأ من الجدول (أ) أن 95٪ من الحالات في التوزيع الطبيعي تقع ضمن الحدود ± 1.96 SE M. إذا أخذنا الحدود المحددة بـ M ± 1.96 SE M ، فإننا نحدد فاصلًا يكون مستوى الثقة فيه هو 95. استنادًا إلى حكمنا كحجم M البوب على هذه الحدود ، فإننا نقف على حق 95٪ من الوقت و 5٪ خطأ.

تعرف المنطقة الواقعة بين 1.96 SE M و + 1.96 SE M بأنها منطقة قبول H o ومنطقة ما بعد - 1.96 SE M و + 1.96 SE M معروفة بمنطقة الرفض. إذا وجدت أي عينة في منطقة القبول ، فنحن نقبل H o . في رفض H o نقر بأن متوسط ​​العينة قد يقع خارج ± 1.96 SE M.

وبالتالي عند رفض H o نجعل خطأ 5٪ لأنه في 5٪ من أصل 100 تخفيف قد تحدث مثل هذه العينة. نحن على استعداد لتخطي ما يصل إلى 5٪ من خطر رفض H o عندما يحدث ذلك. وبالتالي فإن معايير رفض H o هي التي تحط من مستوى الأهمية.

(ب) .01 مستوى الأهمية:

نقرأ من الجدول (أ) أن 99٪ من الإنحرافات في التوزيع الطبيعي تقع ضمن الحدود ± 2.58 SE M. إذا قمنا بوضع الحدود المحددة بـ M ± 2.58 SE M ، فإننا نحدد فاصلة يكون مستوى الثقة فيها .99. استنادًا إلى تقديرنا لحجم M البوب على هذه الحدود ، فإننا نقف على حق 99 ٪ من الوقت ونسبة خطأ 1 ٪.

المنطقة بين 2.58 SE M و + 2.58 SE M ستكون منطقة قبول H 0 والمساحة التي تتجاوزها ستكون منطقة رفض H o . نحن نرغب في تحمل مخاطر بنسبة 1٪ في رفض H o عندما يصح ذلك.

.01 مستوى الأهمية أكثر دقة من مستوى 0.05 لأنه في مستوى 001 الخطأ في رفض H o هو 1٪ بينما في مستوى 0.05 هذا الخطأ هو 5٪.

(رابعا) t- التوزيع:

عندما يكون N أقل من حوالي 30 ، عندما تكون العينة صغيرة ، يطلق على توزيع العينات " t- diffistre".

لا يختلف توزيع t بشكل كبير عن المعتاد ما لم يكن N صغيراً. ومع زيادة N في الحجم ، فإن التوزيع t يقترب أكثر وأكثر من الشكل العادي.

خصائص توزيع t:

1. يبدو وكأنه منحنى على شكل جرس. لكن توزيعها أكثر تنوعًا مع عدم وجود انحراف و "Ku" أكبر من 3.

2. هو متماثل حول السطر t = 0.

3. إنه أحادي الشكل مع التنسيق الأقصى عند t = 0.

4. عندما يكون N صغيراً ، يكمن t- التوزيع تحت المنحنى الطبيعي ، ولكن ذيول أو نهايات المنحنى أعلى من الأجزاء المقابلة من المنحنى الطبيعي.

5. وحدات على طول خط الأساس من t- التوزيع هي في الواقع σ عشرات ، أي ،

(ت) درجات الحرية (دف):

مفهوم درجات الحرية مهم للغاية في إحصاءات العينات الصغيرة. ومن الأهمية بمكان أيضًا ، في تحليل التباين وفي الإجراءات الأخرى. درجات الحرية تعني الحرية في الاختلاف.

دعونا نختار خمسة درجات ، يعني 15 منها. الآن لنفترض أن الدرجات الأربع هي 18 ، 10 ، 20 ، 15. إذا كان المتوسط ​​يساوي 15 ، يجب أن تكون النتيجة الخامسة 12. ولدينا ، بالطبع ، حرية اختيار أي أربع درجات.

لكن ليس لدينا حرية اختيار الدرجة الخامسة لأن النتيجة الخامسة تجعل التعديلات في الاختلاف ناتجة عن النتائج الأربعة الأولى وبافتراض أن المتوسط ​​سيكون 15. هنا يتم فرض N = 5 وقيود واحد ، يجب أن يكون 15. يجب أن تكون درجة الحرية N - 1 أو 4.

إذا كان لدينا 5 نقاط 5 و 6 و 7 و 8 و 9 ، فإن المتوسط ​​هو 7 ؛ وانحراف درجاتنا من 7 هي - 2 ، - 1 ، 0 ، 1 و 2. ومجموع هذه الانحرافات هو صفر. من بين الانحرافات الخمس ، يمكن اختيار 4 (N - 1) "بحرية" كشرط أن يساوي المجموع مساويًا الصفر قيمة الانحراف الخامس مباشرةً.

SD ، بالطبع ، على أساس مربعات الانحرافات التي اتخذت حول الوسط. يوجد N df لحساب الوسط ، ولكن فقط (N - 1) المتاح لـ S (SD) حيث يتم فقدان df واحد في حساب المتوسط.

وفي مثال آخر ، حيث N = 10 ، أعطيت قيمة df المتاحة لتقدير البوب M على أنها 9 أو (N - 1) أي أقل من عدد الملاحظات ، أي 10. ويضيع df واحد في حساب M ومن ثم يتم ترك 9 فقط لتقدير البوب M عن طريق 'S' وتوزيع t.

وكلما استخدمت إحصائية لتقدير معلمة ، تكون القاعدة هي أن df المتوفر يساوي N ناقص عدد المعلمات المقدرة بالفعل من العينة. M هو تقدير للبوب M وفي الحوسبة نفقد 1 مد .

عند تقدير موثوقية r ، على سبيل المثال (التي تعتمد على الانحرافات عن وسيلتين) ، تكون df (N - 2). في حالة اختبارات مربع كاي وتحليل التباين ، تُتبع إجراءات منفصلة لتحديد قيمة df .

(vi) فرضية خالية:

تعتبر فرضية العدم أداة مفيدة في اختبار أهمية الاختلافات. تؤكد هذه الفرضية أنه لا يوجد فرق حقيقي بين اثنين من السلالات ، وأن الفرق الموجود بين وسائل العينة هو ، بالتالي ، غير مقصود وغير مهم.

ترتبط الفرضية الصفرية بالمبدأ القانوني القائل بأن "الرجل بريء حتى تثبت إدانته". إنه يشكل تحديًا ووظيفة التجربة هي إعطاء الحقائق فرصة لدحض (أو فشل في دحض) هذا التحدي.

لتوضيح ذلك ، لنفترض أنه تم الادعاء بأن "المعايير التعليمية لمدارس النوبة الواحدة هي أفضل من مدارس الفترتين". هذه الفرضية مبينة بوضوح ولا يمكن اختبارها بدقة.

إذا كنا نؤكد أن "مدارس التحول الفردي لا تعطي معايير تعليمية أفضل من المدارس المزدوجة" (الفرق الحقيقي هو صفر). هذه الفرضية الصفرية دقيقة ويمكن اختبارها. إذا كانت فرضية العدم غير خاضعة للضريبة ، فيجب رفضها. تفترض العبارة no-difference أنه سيتم اختبار المجموعتين وتبين أنها متساوية.

يُفضل الشكل الفارغ من قبل معظم موظفي الأبحاث ذوي الخبرة. يحدد شكل البيان هذا بسهولة أكبر النموذج الرياضي الذي سيتم استخدامه في الاختبار الإحصائي للفرضية.

لا يتم إثبات أو إفشاء الفرضية الصفرية أبدًا. يمكن قبوله أو رفضه بدرجة معينة من الثقة (أو على مستوى معين من الأهمية).

قبل اختبار فرضية يجب أن نأخذ بعين الاعتبار ما يلي:

1. ما إذا كانت العينة كبيرة أو صغيرة.

2. ما هو مستوى الأهمية.

3. ما إذا كان الاختبار هو اختبار ثنائي الذيل أو اختبار واحد الذيل.

(vii) أخطاء في عمل الاستدلالات:

عند قبول فرضية العدم أو رفضها ، هناك إمكانية لارتكاب نوعين من الأخطاء والإشباع من قبل العاملين في مجال البحث.

يمكن توضيح ما يسمى بأخطاء النوع الأول والنوع الثاني أدناه:

أخطاء النوع الأول:

يتم ارتكاب مثل هذه الأخطاء عندما نرفض فرضية فارغة من خلال تمييز فرق كبير ، على الرغم من عدم وجود فرق حقيقي. لنفترض أن الفرق بين اثنين من السكان يعني (ميل بوب - م = 0) هو في الواقع صفر. (على سبيل المثال ، يمكن اعتبار الأولاد والبنات بمثابة نفس السكان فيما يتعلق بمعظم الاختبارات العقلية). إذا كان اختبار أهمية اثنين من وسائل العينة يعكس حقيقة أن الفرق في عدد السكان كبير ، فإننا نرتكب خطأ من النوع الأول.

أخطاء النوع الثاني:

يتم ارتكاب مثل هذا النوع من الأخطاء عندما نقبل فرضية باطلة من خلال وضع علامة على اختلاف ليس كبيرًا ، على الرغم من وجود فرق حقيقي. لنفترض وجود فرق حقيقي بين السكانيتين.

إذا كان اختبارنا للأهمية المطبق على المعيارين ، فإن هذا يعني أننا نعتقد أن الفرق في عدد السكان لا يعني أننا نرتكب خطأ من النوع الثاني.

يمكن اتخاذ الاحتياطات المختلفة لتجنب كلا النوعين من الأخطاء. إذا قمنا بإعداد مستوى منخفض من الأهمية (P أكبر من 0.05) ، فإننا نزيد احتمال أخطاء النوع الأول ؛ بينما ، إذا قمنا بإعداد مستوى عالي من الأهمية (P أقل من 0.05) ، فإن أخطاء Type I ستكون أقل. يتم تحسين إمكانية استخلاص الاستدلالات الخاطئة من النوع الثاني عندما نضع مستوى عاليًا جدًا من الأهمية.

(8) اختبارات ثنائية الذيل وذات طرف واحد ذات دلالة:

في فروض فرضية الخلاء بين الوسائل التي تم الحصول عليها (أي M1 - M 2 ) قد تكون إما زائد أو ناقص. عند تحديد الاحتمالات ، نأخذ كلا ذيول توزيع توزيع العينات.

(التاسع) نسبة الحرجة (CR):

تم العثور على نسبة حرجة (CR) عن طريق تقسيم الفرق بين وسائل العينة عن طريق الخطأ المعياري (CR = D / SE D ). عندما تكون N من العينات كبيرة (30 أو أكثر هي "كبيرة") ، من المعروف أن توزيع CR يكون طبيعيًا حول الفرق الحقيقي بين عدد السكان ، t هي النسبة الحرجة التي فيها تقدير أكثر دقة لـ σ D يستخدم. توزيع أخذ العينات لـ t ليس طبيعياً عندما تكون N صغيرة (أقل من 30 ، مثلاً) ، t هي CR ؛ ولكن جميع CR هي ليست ر.

اختبار ثنائي الذيل:

1. في اختبار ثنائي الذيل نأخذ في الاعتبار كل من ذيول المنحنى الطبيعي.

2. في حالة فرضية بديلة غير الذيل فإننا نجري اختبارًا ثنائي الذيل.

3. مثال:

يتم إجراء اختبار الفائدة على بعض الأولاد في التعليم المهني. فئة تدريب وبعض الأولاد في فصل لاتيني. هل الفرق المتوسط ​​بين المجموعتين مهم عند مستوى 0.05؟

4. ينحرف نموذج العينة من M pop في أي من الاتجاهين أو -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. القيمة لتكون مهمة:

1.96 على مستوى 0.05

2.58 عند مستوى 0.01

7. يتم تقسيم منطقة الرفض على كل من نهايات (المنحنى) من المنحنى الطبيعي (أي 05 إلى .025 و .025 ، و 01 إلى 005 و. 005).

اختبار واحد الذيل:

1. علينا أن نأخذ واحدة طويلة أي في الجانب الأيسر أو الجانب الأيمن من منحنى طبيعي في الاعتبار.

2. في حالة فرضية بديلة اتجاهية ، فإننا نجري اختبارًا أحادي الطرف ، M 1 > M 2 . في مثل هذا الاتجاه هو واضح جدا من جانب واحد.

3.Example:

تعطى عشرة مواضيع 5 مسارات متتالية على اختبار رمز رقم والتي تظهر فقط درجات للممرات 1 و 5. هل المكاسب المتوسطة من التجربة الأولية إلى النهائية مهمة؟

4. ينحرف نموذج العينة عن متوسط ​​عدد السكان في اتجاه واحد.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 أو M 1 <m 2

6. القيمة لتكون مهمة:

1.62 عند مستوى 0.05

2.33 عند مستوى 0.01

7. هناك منطقة رفض واحدة في الذيل الأيمن للتوزيع أو الذيل الأيسر للتوزيع.