» »

تباين القياس. الاختلافات المطلقة

19.10.2019

دعونا نحسب فيآنسةاكسلالتباين و الانحراف المعياريعينات. دعونا أيضا حساب التباين متغير عشوائيإذا كان توزيعه معروفا.

دعونا نفكر أولا تشتت، ثم الانحراف المعياري.

تباين العينة

تباين العينة (تباين العينة,عينةالتباين) يميز انتشار القيم في المصفوفة بالنسبة إلى .

جميع الصيغ الثلاث متكافئة رياضيا.

ومن الصيغة الأولى يتضح ذلك تباين العينةهو مجموع الانحرافات التربيعية لكل قيمة في المصفوفة من المتوسطمقسومًا على حجم العينة ناقص 1.

الفروق عيناتيتم استخدام الدالة DISP() باللغة الإنجليزية. الاسم VAR، أي. التباين. من الإصدار MS EXCEL 2010، يوصى باستخدام DISP.V() التناظري، باللغة الإنجليزية. اسم VARS، أي. نموذج التباين. بالإضافة إلى ذلك، بدءًا من إصدار MS EXCEL 2010، توجد وظيفة DISP.Г() باللغة الإنجليزية. اسم VARP، أي. التباين السكاني، الذي يحسب تشتتل سكان. يعود الاختلاف بالكامل إلى المقام: بدلاً من n-1 مثل DISP.V()، يحتوي DISP.G() على n فقط في المقام. قبل MS EXCEL 2010، تم استخدام الدالة VAR() لحساب تباين المحتوى.

تباين العينة
=QUADROTCL(عينة)/(COUNT(عينة)-1)
=(SUM(عينة)-COUNT(عينة)*المتوسط(عينة)^2)/ (COUNT(عينة)-1)- الصيغة المعتادة
=SUM((العينة -المتوسط(العينة))^2)/ (COUNT(العينة)-1) –

تباين العينةيساوي 0، فقط إذا كانت جميع القيم متساوية مع بعضها البعض، وبالتالي متساوية متوسط ​​القيمة. عادة، كلما كانت القيمة أكبر الفروقكلما زاد انتشار القيم في المصفوفة.

تباين العينةهو تقدير نقطة الفروقتوزيع المتغير العشوائي الذي تم تكوينه منه عينة. حول البناء فترات الثقةعند التقييم الفروقيمكن قراءتها في المقال.

تباين متغير عشوائي

لكي يحسب تشتتالمتغير العشوائي، عليك أن تعرفه.

ل الفروقغالبًا ما يُشار إلى المتغير العشوائي X بـ Var(X). تشتتيساوي مربع الانحراف عن المتوسط ​​E(X): Var(X)=E[(X-E(X)) 2 ]

تشتتتحسب بواسطة الصيغة:

حيث x i هي القيمة التي يمكن أن يأخذها المتغير العشوائي، و μ هي القيمة المتوسطة ()، و p(x) هو احتمال أن يأخذ المتغير العشوائي القيمة x.

إذا كان المتغير العشوائي يحتوي على تشتتتحسب بواسطة الصيغة:

البعد الفروقيتوافق مع مربع وحدة قياس القيم الأصلية. على سبيل المثال، إذا كانت القيم في العينة تمثل قياسات الوزن الجزئي (بالكجم)، فإن بعد التباين سيكون كجم 2 . قد يكون من الصعب تفسير ذلك، لذلك لوصف انتشار القيم، قيمة تساوي الجذر التربيعيمن الفروقالانحراف المعياري.

بعض الخصائص الفروق:

Var(X+a)=Var(X)، حيث X متغير عشوائي وa ثابت.

فار(aХ)=أ 2 فار(X)

فار(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

يتم استخدام خاصية التشتت هذه في مقالة عن الانحدار الخطي.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y)، حيث X وY متغيران عشوائيان، Cov(X;Y) هو التباين المشترك لهذه المتغيرات العشوائية.

إذا كانت المتغيرات العشوائية مستقلة فإنها التغايريساوي 0، وبالتالي Var(X+Y)=Var(X)+Var(Y). يتم استخدام خاصية التشتت هذه في الاشتقاق.

دعونا نبين أنه بالنسبة للكميات المستقلة Var(X-Y)=Var(X+Y). في الواقع، Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 فار(Y)= فار(X)+فار(Y)= فار(X+Y). يتم استخدام خاصية التشتت هذه في البناء.

الانحراف المعياري للعينة

الانحراف المعياري للعينةهو مقياس لمدى انتشار القيم في العينة بالنسبة إلى قيمها.

أ-بريوري، الانحراف المعيارييساوي الجذر التربيعي ل الفروق:

الانحراف المعياريلا يأخذ في الاعتبار حجم القيم الموجودة فيه عينةولكن فقط درجة تشتت القيم حولهم متوسط. لتوضيح ذلك، دعونا نعطي مثالا.

دعونا نحسب الانحراف المعياري لعينتين: (1؛ 5؛ 9) و (1001؛ 1005؛ 1009). في كلتا الحالتين، ق = 4. ومن الواضح أن نسبة الانحراف المعياري إلى قيم المصفوفة تختلف بشكل كبير بين العينات. لمثل هذه الحالات يتم استخدامه معامل الاختلاف(معامل التباين، السيرة الذاتية) - النسبة الانحراف المعياريإلى المتوسط علم الحساب، معبرا عنها كنسبة مئوية.

في MS EXCEL 2007 والإصدارات السابقة للحساب الانحراف المعياري للعينةيتم استخدام الدالة =STDEVAL() باللغة الإنجليزية. اسم STDEV، أي. الانحراف المعياري. من إصدار MS EXCEL 2010، يوصى باستخدام نظيره =STDEV.B() باللغة الإنجليزية. اسم STDEV.S، أي. الانحراف المعياري للعينة.

بالإضافة إلى ذلك، بدءًا من إصدار MS EXCEL 2010، توجد وظيفة STANDARDEV.G() باللغة الإنجليزية. اسم STDEV.P، أي. السكان DEViation القياسي، الذي يحسب الانحراف المعياريل سكان. يعود الاختلاف بالكامل إلى المقام: بدلاً من n-1 كما في STANDARDEV.V()، يحتوي STANDARDEVAL.G() على n فقط في المقام.

الانحراف المعيارييمكن أيضًا حسابه مباشرةً باستخدام الصيغ أدناه (انظر ملف المثال)
=ROOT(QUADROTCL(عينة)/(COUNT(عينة)-1))
=ROOT((SUM(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

تدابير أخرى للتشتت

تقوم الدالة SQUADROTCL () بالحساب باستخدام مجموع الانحرافات التربيعية للقيم منها متوسط. ستُرجع هذه الدالة نفس النتيجة مثل الصيغة =DISP.G( عينة)*يفحص( عينة) ، أين عينة- إشارة إلى نطاق يحتوي على مجموعة من قيم العينة (). يتم إجراء الحسابات في الدالة QUADROCL() وفقًا للصيغة:

تعتبر الدالة SROTCL() أيضًا مقياسًا لانتشار مجموعة البيانات. تقوم الدالة SROTCL () بحساب متوسط ​​القيم المطلقة لانحرافات القيم عنها متوسط. ستعيد هذه الوظيفة نفس نتيجة الصيغة =SUMPRODUCT(ABS(عينة-متوسط(عينة)))/COUNT(عينة)، أين عينة- رابط لنطاق يحتوي على مجموعة من قيم العينة.

يتم إجراء الحسابات في الدالة SROTCL () وفقًا للصيغة:

إلا أن هذه الخاصية وحدها لا تكفي لدراسة المتغير العشوائي. دعونا نتخيل اثنين من الرماة يطلقون النار على الهدف. أحدهما يطلق النار بدقة ويضرب بالقرب من المنتصف، بينما الآخر... يستمتع فقط ولا يصوب حتى. لكن المضحك هو أنه متوسطوستكون النتيجة بالضبط نفس مطلق النار الأول! يتم توضيح هذا الموقف بشكل تقليدي من خلال المتغيرات العشوائية التالية:

أما التوقع الرياضي "القناص" فهو يساوي "الشخص المثير للاهتمام": - فهو أيضًا صفر!

وبالتالي، هناك حاجة لتحديد مدى ذلك مبعثرالرصاص (قيم متغيرة عشوائية) نسبة إلى مركز الهدف (التوقع الرياضي). حسنا و نثرالمترجمة من اللاتينية ليست طريقة أخرى غير تشتت .

دعونا نرى كيف يتم تحديد هذه الخاصية العددية باستخدام أحد الأمثلة من الجزء الأول من الدرس:

هناك وجدنا توقعًا رياضيًا مخيبًا للآمال لهذه اللعبة، والآن علينا حساب تباينها، والذي يُشار إليه بـخلال .

دعنا نتعرف على مدى "تشتت" المكاسب/الخسائر بالنسبة إلى القيمة المتوسطة. من الواضح أننا بحاجة إلى الحساب لهذا الغرض اختلافاتبين قيم متغيرة عشوائيةوهي توقع رياضي:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

الآن يبدو أنك بحاجة إلى تلخيص النتائج، لكن هذه الطريقة ليست مناسبة - لأن التقلبات إلى اليسار سوف تلغي بعضها البعض مع التقلبات إلى اليمين. لذلك، على سبيل المثال، مطلق النار "الهواة". (المثال أعلاه)الاختلافات ستكون ، وعند إضافتها سيعطون صفرًا، لذلك لن نحصل على أي تقدير لمدى تشتت إطلاق النار.

للتغلب على هذه المشكلة يمكنك التفكير وحداتالاختلافات، ولكن لأسباب فنية ترسخ هذا النهج عندما تم تربيعها. من الأنسب صياغة الحل في جدول:

وهنا يطرح الحساب متوسط ​​الوزنقيمة الانحرافات التربيعية. ما هذا؟ إنها ملكهم القيمة المتوقعة، وهو مقياس للتشتت:

تعريفالفروق. من التعريف يتضح ذلك على الفور لا يمكن أن يكون التباين سلبيا- خذ ملاحظة للممارسة!

دعونا نتذكر كيفية العثور على القيمة المتوقعة. اضرب الفروق المربعة في الاحتمالات المقابلة (مواصلة الجدول):
- بالمعنى المجازي، هذه هي "قوة الجر"،
وتلخيص النتائج:

ألا تعتقد أنه بالمقارنة مع المكاسب، تبين أن النتيجة كبيرة جدًا؟ هذا صحيح، لقد قمنا بتربيعها، وللعودة إلى أبعاد لعبتنا، علينا أن نأخذ الجذر التربيعي. تسمى هذه الكمية الانحراف المعياري ويرمز له بالحرف اليوناني "سيجما":

تسمى هذه القيمة أحيانًا الانحراف المعياري .

ما هو معناها؟ إذا انحرفنا عن التوقع الرياضي إلى اليسار واليمين بالمتوسط الانحراف المعياري:

- عندها سيتم "تركيز" القيم الأكثر احتمالا للمتغير العشوائي في هذه الفترة. ما نلاحظه في الواقع:

ومع ذلك، يحدث أنه عند تحليل التشتت، يتم العمل دائمًا تقريبًا بمفهوم التشتت. دعونا معرفة ما يعنيه فيما يتعلق بالألعاب. إذا كنا نتحدث في حالة الأسهم عن "دقة" الضربات نسبة إلى مركز الهدف، فإن التشتت هنا يتميز بأمرين:

أولاً، من الواضح أنه مع زيادة الرهانات، يزداد التشتت أيضاً. لذلك، على سبيل المثال، إذا زدنا بمقدار 10 مرات، فإن التوقع الرياضي سيزيد بمقدار 10 مرات، وسيزيد التباين بمقدار 100 مرة (لأن هذه كمية تربيعية). لكن لاحظ أن قواعد اللعبة نفسها لم تتغير! فقط المعدلات تغيرت، تقريبًا، قبل أن نراهن بـ 10 روبل، أصبح الآن 100.

النقطة الثانية الأكثر إثارة للاهتمام هي أن التباين يميز أسلوب اللعب. أصلح رهانات اللعبة عقليًا عند مستوى معين، ودعنا نرى ما هو:

لعبة التباين المنخفض هي لعبة حذرة. يميل اللاعب إلى اختيار المخططات الأكثر موثوقية، حيث لا يخسر/يربح الكثير في وقت واحد. على سبيل المثال، نظام الأحمر/الأسود في لعبة الروليت (انظر المثال 4 من المقال المتغيرات العشوائية) .

لعبة التباين العالي. غالبا ما يتم استدعاؤها مشتتلعبة. هذا هو أسلوب اللعب المغامر أو العدواني، حيث يختار اللاعب مخططات "الأدرينالين". دعونا نتذكر على الأقل "مارتينجال"حيث تكون المبالغ على المحك أكبر من اللعبة "الهادئة" في النقطة السابقة.

الوضع في لعبة البوكر يدل: هناك ما يسمى ضيقاللاعبون الذين يميلون إلى توخي الحذر و"المرتعشين" بشأن أموال الألعاب الخاصة بهم (تمويل). وليس من المستغرب أن لا يتقلب تمويلهم بشكل كبير (تباين منخفض). على العكس من ذلك، إذا كان اللاعب لديه تباين كبير، فهو معتدٍ. غالبًا ما يخاطر ويراهن بمراهنات كبيرة ويمكنه إما كسر بنك ضخم أو خسارة قطع صغيرة.

نفس الشيء يحدث في الفوركس، وهكذا - هناك الكثير من الأمثلة.

علاوة على ذلك، في جميع الأحوال، لا يهم ما إذا كانت اللعبة تُلعب مقابل أجر ضئيل أو آلاف الدولارات. كل مستوى له لاعبين منخفضين وعاليين التشتت. حسنًا، كما نتذكر، متوسط ​​الفوز “مسؤول” القيمة المتوقعة.

ربما لاحظت أن العثور على التباين هو عملية طويلة ومضنية. لكن الرياضيات سخية:

صيغة لإيجاد التباين

هذه الصيغة مشتقة مباشرة من تعريف التباين، وقمنا بوضعها موضع الاستخدام على الفور. سأقوم بنسخ العلامة مع لعبتنا أعلاه:

والتوقع الرياضي الموجود.

دعونا نحسب التباين بالطريقة الثانية. أولاً، دعونا نوجد التوقع الرياضي - مربع المتغير العشوائي. بواسطة تحديد التوقع الرياضي:

في في هذه الحالة:

وهكذا، وفقا للصيغة:

كما يقولون، اشعر بالفرق. ومن الناحية العملية، بالطبع، من الأفضل استخدام الصيغة (ما لم يتطلب الشرط خلاف ذلك).

نتقن تقنية الحل والتصميم:

مثال 6

أوجد التوقع الرياضي والتباين والانحراف المعياري.

تم العثور على هذه المهمة في كل مكان، وكقاعدة عامة، لا معنى لها.
يمكنك أن تتخيل عدة مصابيح كهربائية بأرقام تضيء في مستشفى المجانين مع احتمالات معينة :)

حل: من الملائم تلخيص الحسابات الأساسية في جدول. أولاً، نكتب البيانات الأولية في السطرين العلويين. ثم نقوم بحساب المنتجات، ثم وأخيرا المبالغ في العمود الأيمن:

في الواقع، كل شيء تقريبا جاهز. يوضح السطر الثالث توقعًا رياضيًا جاهزًا: .

نحسب التباين باستخدام الصيغة:

وأخيرا الانحراف المعياري:
- شخصيًا، عادةً ما أقوم بالتقريب إلى منزلتين عشريتين.

يمكن إجراء جميع العمليات الحسابية على الآلة الحاسبة، أو حتى الأفضل - في برنامج Excel:

من الصعب أن تخطئ هنا :)

إجابة:

أولئك الذين يرغبون يمكنهم تبسيط حياتهم بشكل أكبر والاستفادة من خدماتي آلة حاسبة (تجريبي)، والتي لن تحل هذه المشكلة على الفور فحسب، بل ستبنيها أيضًا الرسومات الموضوعية (سوف نصل إلى هناك قريبا). يمكن أن يكون البرنامج تحميل من المكتبة– إذا قمت بتنزيل واحد على الأقل المواد التعليمية، أو الحصول على طريق اخر. شكرا لدعم المشروع!

زوجان من المهام لحلها بنفسك:

مثال 7

احسب تباين المتغير العشوائي في المثال السابق حسب التعريف.

ومثال مشابه:

مثال 8

يتم تحديد المتغير العشوائي المنفصل بواسطة قانون التوزيع الخاص به:

نعم، يمكن أن تكون قيم المتغيرات العشوائية كبيرة جدًا (مثال من العمل الحقيقي)وهنا، إذا أمكن، استخدم Excel. كما، بالمناسبة، في المثال 7 - إنه أسرع وأكثر موثوقية وأكثر متعة.

الحلول والأجوبة في أسفل الصفحة.

في ختام الجزء الثاني من الدرس، سننظر إلى مشكلة نموذجية أخرى، يمكن للمرء أن يقول حتى لغزًا صغيرًا:

مثال 9

يمكن للمتغير العشوائي المنفصل أن يأخذ قيمتين فقط: و و. الاحتمال والتوقع الرياضي والتباين معروفان.

حل: لنبدأ باحتمال غير معروف. وبما أن المتغير العشوائي يمكن أن يأخذ قيمتين فقط، فإن مجموع احتمالات الأحداث المقابلة هو:

ومنذ ذلك الحين .

كل ما تبقى هو العثور عليه...، من السهل القول :) ولكن حسنًا، ها نحن ذا. حسب تعريف التوقع الرياضي:
– استبدال الكميات المعروفة :

– ولا يمكن استخلاص أي شيء من هذه المعادلة، باستثناء أنه يمكنك إعادة كتابتها في الاتجاه المعتاد:

أو:

أعتقد أنه يمكنك تخمين الخطوات التالية. دعونا نؤلف ونحل النظام:

الكسور العشرية- هذا بالطبع عار كامل. اضرب المعادلتين في 10:

ونقسم على 2 :

هذا أفضل. من المعادلة الأولى نعبر عن:
(هذه هي الطريقة الأسهل)– نعوض في المعادلة الثانية :


نحن نبني تربيعوقم بالتبسيط:

اضرب بـ:

وكانت النتيجة معادلة من الدرجة الثانية، نجد تمييزها:
- عظيم!

ونحصل على حلين:

1) إذا ، الذي - التي ;

2) إذا ، الذي - التي .

يتم استيفاء الشرط بواسطة الزوج الأول من القيم. مع احتمال كبيركل شيء صحيح، ولكن، مع ذلك، دعونا نكتب قانون التوزيع:

وإجراء فحص، أي العثور على التوقع:

تباين المتغير العشوائي هو مقياس لانتشار قيم هذا المتغير. التباين المنخفض يعني أن القيم متجمعة بالقرب من بعضها البعض. يشير التشتت الكبير إلى انتشار قوي للقيم. يستخدم مفهوم التباين للمتغير العشوائي في الإحصاء. على سبيل المثال، إذا قمت بمقارنة التباين بين قيمتين (مثل بين المرضى الذكور والإناث)، فيمكنك اختبار أهمية المتغير. يتم استخدام التباين أيضًا عند إنشاء نماذج إحصائية، نظرًا لأن التباين المنخفض يمكن أن يكون علامة على أنك تقوم بتجاوز القيم.

خطوات

حساب تباين العينة

  1. سجل قيم العينة.في معظم الحالات، لا يتمكن الإحصائيون من الوصول إلا إلى عينات من مجموعات سكانية محددة. على سبيل المثال، كقاعدة عامة، لا يقوم الإحصائيون بتحليل تكلفة الحفاظ على إجمالي جميع السيارات في روسيا - فهم يقومون بتحليل عينة عشوائية من عدة آلاف من السيارات. ستساعد هذه العينة في تحديد متوسط ​​\u200b\u200bتكلفة السيارة، ولكن على الأرجح، ستكون القيمة الناتجة بعيدة عن القيمة الحقيقية.

    • على سبيل المثال، دعونا نحلل عدد الكعك الذي تم بيعه في مقهى على مدار 6 أيام، بترتيب عشوائي. تبدو العينة كما يلي: 17، 15، 23، 7، 9، 13. هذه عينة وليست مجموعة سكانية، لأنه ليس لدينا بيانات عن الكعك المباع لكل يوم يكون فيه المقهى مفتوحًا.
    • إذا تم إعطاؤك مجتمعًا بدلاً من عينة من القيم، فانتقل إلى القسم التالي.
  2. اكتب صيغة لحساب تباين العينة.التشتت هو مقياس لانتشار قيم كمية معينة. كيف قيمة أقربالتشتت إلى الصفر، كلما اقتربت القيم من بعضها البعض. عند العمل مع تحديد القيمة، استخدم الصيغة التاليةلحساب التباين:

    • ق 2 (\displaystyle s^(2)) = ∑[(س ط (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (ن - 1)
    • ق 2 (\displaystyle s^(2))- هذا هو التشتت. يتم قياس التشتت بالوحدات المربعة.
    • س ط (\displaystyle x_(i))- كل قيمة في العينة.
    • س ط (\displaystyle x_(i))تحتاج إلى طرح x̅، وتربيعها، ثم إضافة النتائج.
    • x̅ – متوسط ​​العينة (متوسط ​​العينة).
    • ن – عدد القيم في العينة.
  3. حساب متوسط ​​العينة.ويشار إليه بـ x̅. يتم حساب متوسط ​​العينة كوسيلة حسابية بسيطة: قم بجمع كافة القيم الموجودة في العينة، ثم قسمة النتيجة على عدد القيم الموجودة في العينة.

    • في مثالنا، أضف القيم الموجودة في العينة: 15 + 17 + 23 + 7 + 9 + 13 = 84
      الآن قم بتقسيم النتيجة على عدد القيم في العينة (في مثالنا هناك 6): 84 ÷ 6 = 14.
      متوسط ​​العينة x̅ = 14.
    • متوسط ​​العينة هو القيمة المركزية التي تتوزع حولها القيم في العينة. إذا كانت القيم الموجودة في مجموعة العينة حول متوسط ​​العينة، فإن التباين صغير؛ وإلا فإن التباين كبير.
  4. اطرح متوسط ​​العينة من كل قيمة في العينة.الآن احسب الفرق س ط (\displaystyle x_(i))- س̅، أين س ط (\displaystyle x_(i))- كل قيمة في العينة. تشير كل نتيجة يتم الحصول عليها إلى درجة انحراف قيمة معينة عن متوسط ​​العينة، أي مدى بعد هذه القيمة عن متوسط ​​العينة.

    • في مثالنا:
      × 1 (\displaystyle x_(1))- س = 17 - 14 = 3
      × 2 (\displaystyle x_(2))- س̅ = 15 - 14 = 1
      × 3 (\displaystyle x_(3))- س = 23 - 14 = 9
      × 4 (\displaystyle x_(4))- س̅ = 7 - 14 = -7
      × 5 (\displaystyle x_(5))- س̅ = 9 - 14 = -5
      × 6 (\displaystyle x_(6))- س̅ = 13 - 14 = -1
    • من السهل التحقق من صحة النتائج التي تم الحصول عليها، حيث يجب أن يكون مجموعها يساوي الصفر. ويرتبط ذلك بتحديد القيمة المتوسطة، حيث أن القيم السلبية(المسافات من القيمة المتوسطة إلى القيم الأصغر) يتم تعويضها بالكامل القيم الإيجابية(المسافات من القيم المتوسطة إلى الكبيرة).
  5. كما ذكر أعلاه، مجموع الاختلافات س ط (\displaystyle x_(i))- x̅ يجب أن تساوي الصفر. وهذا يعني أن متوسط ​​التباين يكون دائمًا صفرًا، وهو ما لا يعطي أي فكرة عن انتشار قيم كمية معينة. لحل هذه المشكلة، قم بتربيع كل اختلاف س ط (\displaystyle x_(i))- س̅. سيؤدي هذا إلى حصولك على أرقام موجبة فقط، والتي لن يصل مجموعها إلى 0 أبدًا.

    • في مثالنا:
      (× 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • لقد وجدت مربع الفرق - x̅) 2 (\displaystyle ^(2))لكل قيمة في العينة
  6. احسب مجموع مربعات الاختلافات.بمعنى، ابحث عن ذلك الجزء من الصيغة المكتوب بهذا الشكل: ∑[( س ط (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. هنا الإشارة Σ تعني مجموع الفروق المربعة لكل قيمة س ط (\displaystyle x_(i))في العينة. لقد وجدت بالفعل الاختلافات التربيعية (س ط (\displaystyle (x_(i))-x̅) 2 (\displaystyle ^(2))لكل قيمة س ط (\displaystyle x_(i))في العينة؛ الآن فقط أضف هذه المربعات.

    • في مثالنا: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. اقسم النتيجة على n - 1، حيث n هو عدد القيم في العينة.منذ بعض الوقت، لحساب تباين العينة، قام الإحصائيون ببساطة بتقسيم النتيجة على n؛ في هذه الحالة سوف تحصل على متوسط ​​التباين التربيعي، وهو مثالي لوصف التباين في عينة معينة. لكن تذكر أن أي عينة لا تمثل سوى جزء صغير من مجموعة القيم. إذا أخذت عينة أخرى وأجريت نفس الحسابات، فسوف تحصل على نتيجة مختلفة. كما اتضح، فإن القسمة على n - 1 (بدلاً من n فقط) تعطي تقديرًا أكثر دقة لتباين السكان، وهو ما يهمك. أصبح القسمة على n – 1 أمرًا شائعًا، لذا تم تضمينه في صيغة حساب تباين العينة.

    • في مثالنا، تتضمن العينة 6 قيم، أي n = 6.
      تباين العينة = ث 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. الفرق بين التباين والانحراف المعياري.لاحظ أن الصيغة تحتوي على أس، لذلك يتم قياس التشتت بوحدات مربعة من القيمة التي يتم تحليلها. في بعض الأحيان يكون من الصعب جدًا تشغيل مثل هذا الحجم؛ في مثل هذه الحالات، استخدم الانحراف المعياري، الذي يساوي الجذر التربيعي للتباين. ولهذا السبب يشار إلى تباين العينة على أنه ق 2 (\displaystyle s^(2))، والانحراف المعياري للعينة كما هو س (\displaystyle s).

    • في مثالنا، الانحراف المعياري للعينة هو: s = √33.2 = 5.76.

    حساب التباين السكاني

    1. تحليل مجموعة من القيم.تتضمن المجموعة جميع قيم الكمية قيد النظر. على سبيل المثال، إذا كنت تدرس عمر سكان منطقة لينينغراد، فإن المجموع يشمل عمر جميع سكان هذه المنطقة. عند العمل مع السكان، يوصى بإنشاء جدول وإدخال القيم السكانية فيه. خذ بعين الاعتبار المثال التالي:

      • يوجد في غرفة معينة 6 أحواض سمك. يحتوي كل حوض السمك الكمية التاليةسمكة:
        × 1 = 5 (\displaystyle x_(1)=5)
        × 2 = 5 (\displaystyle x_(2)=5)
        × 3 = 8 (\displaystyle x_(3)=8)
        × 4 = 12 (\displaystyle x_(4)=12)
        × 5 = 15 (\displaystyle x_(5)=15)
        × 6 = 18 (\displaystyle x_(6)=18)
    2. اكتب صيغة لحساب التباين السكاني.وبما أن المجموع يشمل جميع قيم كمية معينة، فإن الصيغة أدناه تسمح لنا بالحصول عليها القيمة الدقيقةالفروق السكانية. لتمييز التباين السكاني عن تباين العينة (وهو مجرد تقدير)، يستخدم الإحصائيون متغيرات مختلفة:

      • σ 2 (\displaystyle ^(2)) = (∑(س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/ن
      • σ 2 (\displaystyle ^(2))- التشتت السكاني (اقرأ باسم "مربع سيجما"). يتم قياس التشتت بالوحدات المربعة.
      • س ط (\displaystyle x_(i))- كل قيمة في مجملها.
      • Σ – علامة المجموع. أي من كل قيمة س ط (\displaystyle x_(i))تحتاج إلى طرح μ وتربيعها ثم إضافة النتائج.
      • μ - متوسط ​​عدد السكان.
      • ن – عدد القيم في السكان.
    3. احسب متوسط ​​عدد السكان.عند العمل مع مجتمع ما، يُشار إلى متوسطه بـ μ (mu). يتم حساب المتوسط ​​السكاني كوسيلة حسابية بسيطة: قم بجمع جميع القيم في المجتمع، ثم قسمة النتيجة على عدد القيم في المجتمع.

      • ضع في اعتبارك أن المتوسطات لا يتم حسابها دائمًا على أنها المتوسط ​​الحسابي.
      • في مثالنا، يعني عدد السكان: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. اطرح متوسط ​​عدد السكان من كل قيمة في عدد السكان.كلما اقتربت قيمة الفرق من الصفر، كلما اقتربت القيمة المحددة من متوسط ​​المجتمع. أوجد الفرق بين كل قيمة في المجتمع ووسطها، وستحصل على فكرة أولية عن توزيع القيم.

      • في مثالنا:
        × 1 (\displaystyle x_(1))- μ = 5 - 10.5 = -5.5
        × 2 (\displaystyle x_(2))- μ = 5 - 10.5 = -5.5
        × 3 (\displaystyle x_(3))- μ = 8 - 10.5 = -2.5
        × 4 (\displaystyle x_(4))- μ = 12 - 10.5 = 1.5
        × 5 (\displaystyle x_(5))- μ = 15 - 10.5 = 4.5
        × 6 (\displaystyle x_(6))- μ = 18 - 10.5 = 7.5
    5. مربع كل نتيجة تم الحصول عليها.ستكون قيم الفرق إيجابية وسلبية؛ إذا تم رسم هذه القيم على خط الأعداد، فسوف تقع على يمين ويسار متوسط ​​المجتمع. هذا غير مناسب لحساب التباين، حيث أنه موجب و أرقام سلبيةتعويض بعضهم البعض. لذا، قم بتربيع كل فرق للحصول على أرقام موجبة حصريًا.

      • في مثالنا:
        (س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))لكل قيمة سكانية (من i = 1 إلى i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2))، أين س ن (\displaystyle x_(n))- القيمة الأخيرة في عدد السكان.
      • لحساب القيمة المتوسطة للنتائج التي تم الحصول عليها، تحتاج إلى إيجاد مجموعها وتقسيمه على n :(( × 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (× 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (س ن (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/ن
      • الآن لنكتب الشرح أعلاه باستخدام المتغيرات: (∑( س ط (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n واحصل على صيغة لحساب التباين السكاني.

المؤشرات العامة الرئيسية للتباين في الإحصائيات هي التشتت والانحرافات المعيارية.

تشتت هذا المتوسط ​​الحسابي الانحرافات التربيعية لكل قيمة مميزة عن المتوسط ​​العام. ويسمى التباين عادة بمتوسط ​​مربع الانحرافات ويرمز له بالرمز  2. اعتماداً على البيانات المصدرية، يمكن حساب التباين باستخدام الوسط الحسابي البسيط أو المرجح:

 التباين غير المرجح (البسيط)؛

 التباين المرجح.

الانحراف المعياري هذه خاصية عامة للأحجام المطلقة الاختلافات علامات في المجموع. ويتم التعبير عنها بنفس وحدات القياس مثل السمة (بالأمتار، الأطنان، النسبة المئوية، الهكتار، وما إلى ذلك).

الانحراف المعياري هو الجذر التربيعي للتباين ويرمز له بالرمز :

 الانحراف المعياري غير المرجح؛

 الانحراف المعياري المرجح.

الانحراف المعياري هو مقياس لموثوقية المتوسط. كلما كان الانحراف المعياري أصغر، كلما كان المتوسط ​​الحسابي يعكس إجمالي السكان الممثلين بشكل أفضل.

حساب الانحراف المعياري يسبقه حساب التباين.

يكون الإجراء الخاص بحساب التباين الموزون كما يلي:

1) تحديد الوسط الحسابي المرجح:

2) حساب انحرافات الخيارات عن المتوسط:

3) قم بتربيع انحراف كل خيار عن المتوسط:

4) اضرب مربعات الانحرافات بالأوزان (التكرارات):

5) تلخيص المنتجات الناتجة:

6) يتم تقسيم المبلغ الناتج على مجموع الأوزان:

مثال 2.1

دعونا نحسب الوسط الحسابي المرجح:

يتم عرض قيم الانحرافات عن الوسط ومربعاتها في الجدول. دعونا نحدد التباين:

الانحراف المعياري سيكون مساوياً لـ:

إذا تم تقديم البيانات المصدر في شكل فاصل زمني سلسلة التوزيع ، فأنت بحاجة أولاً إلى تحديد القيمة المنفصلة للسمة، ثم تطبيق الطريقة الموضحة.

مثال 2.2

دعونا نعرض حساب التباين لسلسلة فاصلة باستخدام بيانات حول توزيع المساحة المزروعة في المزرعة الجماعية حسب إنتاجية القمح.

الوسط الحسابي هو:

دعونا نحسب التباين:

6.3. حساب التباين باستخدام صيغة تعتمد على البيانات الفردية

تقنية الحساب الفروق معقدة، ومع وجود قيم كبيرة من الخيارات والترددات يمكن أن تكون مرهقة. يمكن تبسيط الحسابات باستخدام خصائص التشتت.

التشتت لديه الخصائص التالية.

1. إن تقليل أو زيادة الأوزان (الترددات) ذات الخاصية المتغيرة بعدد معين من المرات لا يغير من التشتت.

2. إنقاص أو زيادة كل قيمة للخاصية بنفس المقدار الثابت ألا يغير التشتت.

3. إنقاص أو زيادة كل قيمة للصفة بعدد معين من المرات كعلى التوالي يقلل أو يزيد التباين في ك 2 مرات الانحراف المعياري  في كمرة واحدة.

4. يكون تشتت الخاصية بالنسبة إلى القيمة التعسفية دائمًا أكبر من التشتت بالنسبة إلى المتوسط ​​الحسابي لكل مربع للفرق بين القيم المتوسطة والقيم التعسفية:

لو أ= 0 فنصل إلى المساواة التالية:

أي أن تباين الخاصية يساوي الفرق بين مربع متوسط ​​قيم الخصائص ومربع الوسط.

يمكن استخدام كل خاصية بشكل مستقل أو بالاشتراك مع خصائص أخرى عند حساب التباين.

إجراء حساب التباين بسيط:

1) تحديد المتوسط ​​الحسابي :

2) تربيع الوسط الحسابي :

3) مربع انحراف كل متغير من السلسلة:

X أنا 2 .

4) أوجد مجموع مربعات الخيارات:

5) اقسم مجموع مربعات الخيارات على عددها، أي حدد المربع المتوسط:

6) حدد الفرق بين مربع متوسط ​​الخاصية ومربع المتوسط:

مثال 3.1تتوفر البيانات التالية عن إنتاجية العمال:

لنقم بالحسابات التالية:

إذا تم تقسيم المجتمع إلى مجموعات وفقًا للخاصية التي تتم دراستها، فيمكن حساب أنواع التباين التالية لهذا المجتمع: الإجمالي، المجموعة (داخل المجموعة)، متوسط ​​المجموعة (متوسط ​​​​داخل المجموعة)، بين المجموعات.

في البداية، يقوم بحساب معامل التحديد، الذي يوضح أي جزء من التباين الكلي للسمات قيد الدراسة هو التباين بين المجموعات، أي. بسبب خاصية التجمع:

تميز علاقة الارتباط التجريبية مدى قرب العلاقة بين التجميع (المضروب) وخصائص الأداء.

يمكن أن تأخذ نسبة الارتباط التجريبية القيم من 0 إلى 1.

لتقييم مدى قرب الاتصال على أساس نسبة الارتباط التجريبية، يمكنك استخدام علاقات تشادوك:

مثال 4.البيانات التالية متاحة عن أداء العمل من قبل منظمات التصميم والمسح أشكال مختلفةملكية:

يُعرِّف:

1) التباين الكلي.

2) فروق المجموعة.

3) متوسط ​​تباينات المجموعة.

4) التباين بين المجموعات.

5) التباين الإجمالي على أساس قاعدة إضافة التباينات.


6) معامل التحديد ونسبة الارتباط التجريبية.

استخلاص النتائج.

حل:

1. دعونا نحدد متوسط ​​الحجمأداء العمل من قبل المؤسسات ذات شكلين من الملكية:

دعونا نحسب التباين الكلي:

2. تحديد متوسطات المجموعة:

مليون روبل

مليون روبل

تباينات المجموعة:

;

3. احسب متوسط ​​تباينات المجموعة:

4. دعونا نحدد التباين بين المجموعات:

5. احسب التباين الإجمالي بناءً على قاعدة إضافة التباينات:

6. لنحدد معامل التحديد:

.

وبالتالي فإن حجم العمل الذي تقوم به منظمات التصميم والمسح يعتمد بنسبة 22% على شكل ملكية المؤسسات.

يتم حساب نسبة الارتباط التجريبية باستخدام الصيغة

.

تشير قيمة المؤشر المحسوب إلى أن اعتماد حجم العمل على شكل ملكية المؤسسة صغير.

مثال 5.ونتيجة لدراسة الانضباط التكنولوجي لمجالات الإنتاج، تم الحصول على البيانات التالية:

تحديد معامل التحديد