» »

שונות של נוסחת משתנה אקראי. שונות וסטיית תקן

19.10.2019

.

לעומת זאת, אם הוא לא שלילי א.ה. לתפקד כך , אז יש מדד הסתברות רציף לחלוטין על כך שהוא הצפיפות שלו.

    החלפת המידה באינטגרל לבסג:

,

היכן נמצאת כל פונקציית Borel הניתנת לאינטגרציה ביחס למדד ההסתברות.

פיזור, סוגי ומאפיינים של פיזור מושג הפיזור

פיזור בסטטיסטיקההוא כממוצע סטיית תקןערכים בודדים של המאפיין בריבוע מהממוצע האריתמטי. בהתאם לנתונים הראשוניים, הוא נקבע באמצעות נוסחאות השונות הפשוטות והמשוקללות:

1. שונות פשוטה(עבור נתונים לא מקובצים) מחושב באמצעות הנוסחה:

2. שונות משוקללת (עבור סדרות וריאציות):

כאשר n הוא תדירות (החזרה של גורם X)

דוגמה למציאת שונות

דף זה מתאר דוגמה סטנדרטית למציאת שונות, אתה יכול גם להסתכל על בעיות אחרות כדי למצוא אותה

דוגמה 1. קביעת השונות הקבוצתית, הממוצעת הקבוצתית, הבין-קבוצתית והשונות הכוללת

דוגמה 2. מציאת השונות ומקדם השונות בטבלת קיבוץ

דוגמה 3. מציאת שונות בסדרה בדידה

דוגמה 4. הנתונים הבאים זמינים עבור קבוצה של 20 סטודנטים להתכתבות. יש צורך לבנות סדרת מרווחים של התפלגות המאפיין, לחשב את הערך הממוצע של המאפיין וללמוד את פיזורו

בואו נבנה קיבוץ אינטרוולים. בואו נקבע את טווח המרווח באמצעות הנוסחה:

כאשר X max הוא הערך המקסימלי של מאפיין הקיבוץ; X min - ערך מינימלי של מאפיין הקיבוץ; n - מספר מרווחים:

אנו מקבלים n=5. השלב הוא: h = (192 - 159)/ 5 = 6.6

בואו ניצור קיבוץ מרווחים

לחישובים נוספים, נבנה טבלת עזר:

X"i – אמצע המרווח. (לדוגמה, אמצע המרווח 159 – 165.6 = 162.3)

אנו קובעים את הגובה הממוצע של תלמידים באמצעות נוסחת הממוצע האריתמטי המשוקלל:

בואו נקבע את השונות באמצעות הנוסחה:

ניתן לשנות את הנוסחה כך:

מהנוסחה הזו נובע מכך השונות שווה ל ההפרש בין ממוצע הריבועים של האופציות לבין הריבוע והממוצע.

פיזור בסדרות וריאציותעם מרווחים שווים בשיטת המומנטים ניתן לחשב בדרך הבאה באמצעות התכונה השנייה של פיזור (חלוקת כל האפשרויות בערך המרווח). קביעת שונות, מחושב בשיטת הרגעים, השימוש בנוסחה הבאה הוא פחות מייגע:

כאשר i הוא הערך של המרווח; A הוא אפס רגיל, שעבורו נוח להשתמש באמצע המרווח בתדירות הגבוהה ביותר; m1 הוא הריבוע של רגע הסדר הראשון; m2 - רגע מסדר שני

שונות תכונה חלופית (אם באוכלוסייה סטטיסטית מאפיין משתנה בצורה כזו שיש רק שתי אפשרויות סותרות זו את זו, אז שונות כזו נקראת אלטרנטיבה) ניתן לחשב באמצעות הנוסחה:

החלפת q = 1- p בנוסחת הפיזור הזו, נקבל:

סוגי שונות

שונות מוחלטתמודד את השונות של מאפיין על פני כל האוכלוסייה כולה בהשפעת כל הגורמים הגורמים לשונות זו. זה שווה לריבוע הממוצע של הסטיות של ערכים בודדים של מאפיין x מהערך הממוצע הכולל של x וניתן להגדיר אותו כשונות פשוטה או שונות משוקללת.

שונות בתוך הקבוצה מאפיין וריאציה אקראית, כלומר. חלק מהשוני הנובע מהשפעתם של גורמים לא מטופלים ואינו תלוי בתכונת הגורם המהווה את הבסיס לקבוצה. פיזור כזה שווה לריבוע הממוצע של הסטיות של ערכים בודדים של התכונה בתוך קבוצה X מהממוצע האריתמטי של הקבוצה וניתן לחשב אותו כפיזור פשוט או כפיזור משוקלל.

לכן, מדדי שונות בתוך הקבוצהוריאציה של תכונה בתוך קבוצה והיא נקבעת על ידי הנוסחה:

כאשר xi הוא ממוצע הקבוצה; ni הוא מספר היחידות בקבוצה.

לדוגמה, שונות תוך-קבוצתית שיש לקבוע במשימת לימוד השפעת כישורי העובדים על רמת פריון העבודה בסדנה מראות שונות בתפוקה בכל קבוצה הנגרמת על ידי כל הגורמים האפשריים (מצב טכני של ציוד, זמינות של כלים וחומרים, גיל העובדים, עוצמת העבודה וכו' .), למעט הבדלים בקטגוריית ההסמכה (בתוך קבוצה לכל העובדים יש את אותן הכישורים).

הממוצע של השונות בתוך הקבוצה משקף וריאציה אקראית, כלומר, אותו חלק של השונות שהתרחש בהשפעת כל הגורמים האחרים, למעט גורם הקיבוץ. זה מחושב באמצעות הנוסחה:

שונות בין קבוצותמאפיין את השונות השיטתית של המאפיין המתקבל, הנובעת מהשפעת תכונת הגורם המהווה את הבסיס לקבוצה. זה שווה לריבוע הממוצע של הסטיות של ממוצע הקבוצה מהממוצע הכולל. השונות בין קבוצות מחושבת באמצעות הנוסחה:

עם זאת, מאפיין זה לבדו אינו מספיק למחקר. משתנה רנדומלי. בואו נדמיין שני יורים יורים למטרה. אחד יורה במדויק ופוגע קרוב למרכז, בעוד השני... פשוט נהנה ואפילו לא מכוון. אבל מה שמצחיק זה שהוא מְמוּצָעהתוצאה תהיה בדיוק כמו היורה הראשון! מצב זה מומחש באופן קונבנציונלי על ידי המשתנים האקראיים הבאים:

הציפייה המתמטית של "צלף" שווה ל-, לעומת זאת, עבור "האדם המעניין": - היא גם אפס!

לפיכך, יש צורך לכמת עד כמה מְפוּזָרכדורים (ערכי משתנים אקראיים) ביחס למרכז המטרה (ציפייה מתמטית). טוב ו פִּזוּרתרגום מלטינית אינו אלא פְּזִירָה .

בואו נראה כיצד מאפיין מספרי זה נקבע באמצעות אחת הדוגמאות מהחלק הראשון של השיעור:

שם מצאנו ציפייה מתמטית מאכזבת מהמשחק הזה, ועכשיו עלינו לחשב את השונות שלו, אשר מסומן על ידידרך .

בואו לגלות עד כמה הניצחונות/ההפסדים "פזורים" ביחס לערך הממוצע. ברור, בשביל זה אנחנו צריכים לחשב הבדליםבֵּין ערכי משתנים אקראייםוהיא ציפייה מתמטית:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

כעת נראה שצריך לסכם את התוצאות, אבל הדרך הזו לא מתאימה - מהסיבה שתנודות שמאלה יבטלו זו את זו עם תנודות ימינה. אז, למשל, יורה "חובב". (דוגמה למעלה)ההבדלים יהיו , וכשהוסיפו הם יתנו אפס, ולכן לא נקבל שום הערכה לפיזור הירי שלו.

כדי לעקוף את הבעיה הזו אתה יכול לשקול מודוליםהבדלים, אבל מסיבות טכניות הגישה השתרשה כשהם בריבוע. יותר נוח לנסח את הפתרון בטבלה:

וכאן מתבקש לחשב ממוצע משוקללערך הסטיות בריבוע. מה זה? זה שלהם ערך צפוי, שהיא מידת פיזור:

הַגדָרָהשונות. מההגדרה ברור מיד ש השונות לא יכולה להיות שלילית- שימו לב לתרגול!

בואו נזכור איך למצוא את הערך הצפוי. הכפל את ההבדלים בריבוע בהסתברויות המתאימות (המשך הטבלה):
- באופן פיגורטיבי, זהו "כוח המתיחה",
ולסכם את התוצאות:

אתה לא חושב שבהשוואה לזכייה, התוצאה התבררה כגדולה מדי? זה נכון - ריבוע את זה, וכדי לחזור למימד המשחק שלנו צריך לחלץ שורש ריבועי. כמות זו נקראת סטיית תקן והוא מסומן באות היוונית "סיגמה":

ערך זה נקרא לפעמים סטיית תקן .

מה המשמעות שלו? אם נחרוג מהציפייה המתמטית לשמאל ולימין בסטיית התקן:

- אז הערכים הסבירים ביותר של המשתנה האקראי "יתרכזו" במרווח זה. מה שאנו רואים בפועל:

עם זאת, קורה שכאשר מנתחים פיזור פועלים כמעט תמיד עם המושג פיזור. בואו נבין מה זה אומר ביחס למשחקים. אם במקרה של חיצים אנחנו מדברים על "דיוק" של פגיעות ביחס למרכז המטרה, אז כאן הפיזור מאפיין שני דברים:

ראשית, ברור שככל שההימורים גדלים, גם הפיזור גדל. אז, למשל, אם נגדיל פי 10, אז התוחלת המתמטית תגדל פי 10, והשונות תגדל פי 100 (מכיוון שזו כמות ריבועית). אבל שימו לב שכללי המשחק עצמם לא השתנו! רק התעריפים השתנו, בערך, לפני שהימרנו על 10 רובל, עכשיו זה 100.

הנקודה השנייה, המעניינת יותר, היא ששונות מאפיינת את סגנון המשחק. תקן נפשית את ההימורים במשחק ברמה מסוימת, ובואו נראה מה זה:

משחק עם שונות נמוכה הוא משחק זהיר. השחקן נוטה לבחור את התוכניות האמינות ביותר, שבהן הוא לא מפסיד/מנצח יותר מדי בבת אחת. לדוגמה, המערכת האדומה/שחורה ברולטה (ראה דוגמה 4 של המאמר משתנים אקראיים) .

משחק שונות גבוהה. לעתים קרובות קוראים לה מפזרמִשְׂחָק. זהו סגנון משחק הרפתקני או אגרסיבי, שבו השחקן בוחר תוכניות "אדרנלין". בואו לפחות נזכור "מרטינגייל", שבו הסכומים שעל כף המאזניים הם בסדרי גודל גדולים יותר מהמשחק ה"שקט" של הנקודה הקודמת.

המצב בפוקר מעיד: יש מה שנקרא הדוקשחקנים שנוטים להיות זהירים ו"רועדים" לגבי כספי המשחקים שלהם (לְמַמֵן). באופן לא מפתיע, הכספים שלהם לא משתנה באופן משמעותי (שונות נמוכה). להיפך, אם לשחקן יש שונות גבוהה, אז הוא תוקפן. לעתים קרובות הוא לוקח סיכונים, מבצע הימורים גדולים ויכול לשבור בנק עצום או להפסיד לרעה.

אותו דבר קורה בפורקס, וכן הלאה - יש המון דוגמאות.

יתרה מכך, בכל המקרים אין זה משנה אם המשחק משוחק בפרוטות או אלפי דולרים. לכל רמה יש את השחקנים שלה בפיזור נמוך וגבוה. ובכן, כזכור, הזכייה הממוצעת היא "אחראית" ערך צפוי.

בטח שמתם לב שמציאת שונות הוא תהליך ארוך וקפדני. אבל המתמטיקה נדיבה:

נוסחה למציאת שונות

נוסחה זו נגזרת ישירות מהגדרת השונות, ומיד הכנסנו אותה לשימוש. אני אעתיק את השלט עם המשחק שלנו למעלה:

והציפייה המתמטית שנמצאה.

בוא נחשב את השונות בדרך השנייה. ראשית, בואו נמצא את התוחלת המתמטית - ריבוע המשתנה האקראי. על ידי קביעת תוחלת מתמטית:

IN במקרה הזה:

לפיכך, לפי הנוסחה:

כמו שאומרים, הרגישו את ההבדל. ובפועל, כמובן, עדיף להשתמש בנוסחה (אלא אם התנאי מחייב אחרת).

אנו שולטים בטכניקת פתרון ועיצוב:

דוגמה 6

מצא את התוחלת המתמטית, השונות וסטיית התקן שלה.

משימה זו נמצאת בכל מקום, וככלל, חסרת משמעות משמעותית.
אתה יכול לדמיין כמה נורות עם מספרים שנדלקות בבית משוגעים בהסתברויות מסוימות :)

פִּתָרוֹן: נוח לסכם את החישובים הבסיסיים בטבלה. ראשית, נכתוב את הנתונים הראשוניים בשתי השורות העליונות. לאחר מכן אנו מחשבים את המוצרים, ולאחר מכן ולבסוף את הסכומים בעמודה הימנית:

למעשה, כמעט הכל מוכן. השורה השלישית מציגה ציפייה מתמטית מוכנה: .

אנו מחשבים את השונות באמצעות הנוסחה:

ולבסוף, סטיית התקן:
– באופן אישי, אני בדרך כלל מעגל ל-2 מקומות עשרוניים.

כל החישובים יכולים להתבצע על מחשבון, או אפילו טוב יותר - באקסל:

קשה לטעות כאן :)

תשובה:

מי שרוצה יכול לפשט את חייו עוד יותר ולנצל את שלי מַחשְׁבוֹן (הַדגָמָה), אשר לא רק יפתור את הבעיה הזו באופן מיידי, אלא גם יבנה גרפיקה נושאית (נגיע לשם בקרוב). התוכנית יכולה להיות להוריד מהספרייה- אם הורדתם לפחות אחד חומר חינוכי, או לקבל דרך נוספת. תודה על התמיכה בפרויקט!

כמה משימות לפתור בעצמך:

דוגמה 7

חשב את השונות של המשתנה האקראי בדוגמה הקודמת לפי הגדרה.

ודוגמה דומה:

דוגמה 8

משתנה אקראי בדיד מוגדר בחוק ההפצה שלו:

כן, ערכי משתנים אקראיים יכולים להיות גדולים למדי (דוגמה מעבודה אמיתית), וכאן, אם אפשר, השתמש באקסל. כמו, אגב, בדוגמה 7 - זה מהיר יותר, אמין יותר ומהנה יותר.

פתרונות ותשובות בתחתית העמוד.

לסיום החלק השני של השיעור, נבחן בעיה טיפוסית נוספת, אפשר אפילו לומר חידה קטנה:

דוגמה 9

משתנה אקראי בדיד יכול לקחת רק שני ערכים: ו, ו. ההסתברות, הציפייה המתמטית והשונות ידועים.

פִּתָרוֹן: נתחיל בהסתברות לא ידועה. מכיוון שמשתנה אקראי יכול לקחת רק שני ערכים, סכום ההסתברויות של האירועים המתאימים הוא:

ומאז .

כל מה שנותר הוא למצוא..., קל להגיד :) אבל נו, הנה. לפי הגדרת ציפייה מתמטית:
- להחליף כמויות ידועות:

– ואי אפשר לסחוט יותר מהמשוואה הזו, חוץ מזה שאתה יכול לכתוב אותה מחדש בכיוון הרגיל:

אוֹ:

אני חושב שאתה יכול לנחש את השלבים הבאים. בואו נרכיב ונפתור את המערכת:

עשרוניות- זו, כמובן, בושה גמורה; הכפל את שתי המשוואות ב-10:

ומחלקים ב-2:

זה יותר טוב. מהמשוואה הראשונה אנו מבטאים:
(זו הדרך הקלה יותר)- החלף לתוך המשוואה השנייה:


אנחנו בונים בריבועולעשות הפשטות:

הכפל ב:

התוצאה הייתה משוואה ריבועית, אנו מוצאים את ההבחנה שלו:
- גדול!

ונקבל שני פתרונות:

1) אם , זה ;

2) אם , זה .

התנאי מתקיים על ידי צמד הערכים הראשון. עם סבירות גבוהההכל נכון, אבל, בכל זאת, בואו נרשום את חוק ההפצה:

ולבצע בדיקה, כלומר למצוא את הציפייה:

אם האוכלוסייה מחולקת לקבוצות לפי המאפיין הנחקר, אז ניתן לחשב את סוגי השונות הבאים עבור אוכלוסייה זו: סך, קבוצה (בתוך קבוצה), ממוצע של קבוצה (ממוצע של בתוך קבוצה), בין קבוצה.

בתחילה, הוא מחשב את מקדם הקביעה, המראה איזה חלק מהווריאציה הכוללת של התכונה הנחקרת הוא שונות בין קבוצות, כלומר. בשל מאפיין הקיבוץ:

קשר המתאם האמפירי מאפיין את סמיכות הקשר בין מאפייני קיבוץ (פקטוריאלי) וביצועים.

יחס המתאם האמפירי יכול לקחת ערכים מ-0 ל-1.

כדי להעריך את קרבת הקשר בהתבסס על יחס המתאם האמפירי, אתה יכול להשתמש ביחסי צ'דוק:

דוגמה 4.הנתונים הבאים זמינים על ביצוע העבודה על ידי ארגוני עיצוב וסקרים צורות שונותתכונה:

לְהַגדִיר:

1) שונות מוחלטת;

2) שונות קבוצתית;

3) ממוצע השונות הקבוצתיות;

4) שונות בין קבוצות;

5) השונות הכוללת המבוססת על הכלל להוספת שונות;


6) מקדם קביעה ויחס מתאם אמפירי.

לְהַסִיק.

פִּתָרוֹן:

1. בואו נגדיר נפח ממוצעביצוע עבודה על ידי מפעלים בשתי צורות בעלות:

בוא נחשב את השונות הכוללת:

2. קבע ממוצעים של קבוצות:

מיליון רובל;

מיליון רובל

שונות קבוצתית:

;

3. חשב את הממוצע של השונות הקבוצתיות:

4. בואו נקבע את השונות בין הקבוצות:

5. חשב את השונות הכוללת בהתבסס על הכלל להוספת שונות:

6. בואו נקבע את מקדם הקביעה:

.

לפיכך, היקף העבודה שמבצעים ארגוני עיצוב וסקרים תלוי ב-22% בצורת הבעלות על ארגונים.

יחס המתאם האמפירי מחושב באמצעות הנוסחה

.

ערכו של המדד המחושב מצביע על כך שהתלות של נפח העבודה בצורת הבעלות על המיזם קטנה.

דוגמה 5.כתוצאה מסקר של הדיסציפלינה הטכנולוגית של אזורי הייצור, התקבלו הנתונים הבאים:

קבע את מקדם הקביעה

שונות היא מדד לפיזור המתאר את הסטייה ההשוואתית בין ערכי הנתונים והממוצע. זהו המדד הנפוץ ביותר לפיזור בסטטיסטיקה, המחושב על ידי סיכום וריבוע של הסטייה של כל ערך נתונים מהממוצע. הנוסחה לחישוב השונות ניתנת להלן:

s 2 - שונות מדגם;

x av—ממוצע מדגם;

נגודל מדגם (מספר ערכי נתונים),

(x i – x avg) היא הסטייה מהערך הממוצע עבור כל ערך של מערך הנתונים.

כדי להבין טוב יותר את הנוסחה, בואו נסתכל על דוגמה. אני לא ממש אוהב לבשל, ​​אז אני עושה את זה לעתים רחוקות. עם זאת, כדי לא לגווע ברעב, מדי פעם אני צריך ללכת לכיריים כדי ליישם את תוכנית הרוויה של הגוף שלי בחלבונים, שומנים ופחמימות. מערך הנתונים שלהלן מראה כמה פעמים רנט מבשלת מדי חודש:

השלב הראשון בחישוב השונות הוא קביעת ממוצע המדגם, שבדוגמה שלנו הוא 7.8 פעמים בחודש. ניתן להקל על שאר החישובים באמצעות הטבלה הבאה.

השלב האחרון של חישוב השונות נראה כך:

למי שאוהב לעשות את כל החישובים במכה אחת, המשוואה תיראה כך:

שימוש בשיטת הספירה הגולמית (דוגמה לבישול)

יש עוד שיטה יעילהחישוב השונות, המכונה שיטת "ספירה גולמית". למרות שהמשוואה עשויה להיראות די מסורבלת במבט ראשון, היא למעשה לא כל כך מפחידה. אתה יכול לוודא זאת, ולאחר מכן להחליט איזו שיטה אתה הכי אוהב.

הוא הסכום של כל ערך נתונים לאחר ריבוע,

הוא הריבוע של סכום כל ערכי הנתונים.

אל תאבד את דעתך עכשיו. בוא נשים את כל זה לטבלה ותראה שיש כאן פחות חישובים מאשר בדוגמה הקודמת.

כפי שאתה יכול לראות, התוצאה הייתה זהה לשיטה הקודמת. יתרונות השיטה הזאתמתברר ככל שגודל המדגם (n) גדל.

חישוב שונות באקסל

כפי שבטח כבר ניחשתם, לאקסל יש נוסחה המאפשרת לכם לחשב שונות. יתרה מכך, החל מ-Excel 2010, אתה יכול למצוא 4 סוגים של נוסחת שונות:

1) VARIANCE.V - מחזירה את השונות של המדגם. מתעלמים מערכים בוליאניים ומטקסט.

2) DISP.G - מחזירה את השונות של האוכלוסייה. מתעלמים מערכים בוליאניים ומטקסט.

3) VARIANCE - מחזירה את השונות של המדגם, תוך התחשבות בערכי בוליאניים וטקסט.

4) VARIANCE - מחזירה את השונות של האוכלוסייה, תוך התחשבות בערכים לוגיים וטקסטים.

ראשית, בואו נבין את ההבדל בין מדגם לאוכלוסייה. מטרת הסטטיסטיקה התיאורית היא לסכם או להציג נתונים באופן המספק מידע מהיר. תמונה גדולהכביכול, סקירה. הסקה סטטיסטית מאפשרת להסיק מסקנות לגבי אוכלוסייה על סמך מדגם של נתונים מאותה אוכלוסייה. האוכלוסייה מייצגת את כל התוצאות או המדידות האפשריות שמעניינים אותנו. מדגם הוא תת-קבוצה של אוכלוסייה.

לדוגמה, אנו מעוניינים בקבוצת סטודנטים מאחת האוניברסיטאות הרוסיות ועלינו לקבוע את הציון הממוצע של הקבוצה. נוכל לחשב את הביצועים הממוצעים של התלמידים, ואז הנתון שיתקבל יהיה פרמטר, שכן כל האוכלוסייה תהיה מעורבת בחישובים שלנו. עם זאת, אם ברצוננו לחשב את ה-GPA של כל התלמידים בארצנו, אז קבוצה זו תהיה המדגם שלנו.

ההבדל בנוסחה לחישוב השונות בין מדגם לאוכלוסייה הוא המכנה. איפה עבור המדגם הוא יהיה שווה ל-(n-1), ולאוכלוסיה הכללית רק n.

כעת נסתכל על הפונקציות לחישוב שונות עם סיומות א,התיאור שלו קובע כי טקסט וערכים לוגיים נלקחים בחשבון בחישוב. במקרה זה, בעת חישוב השונות של מערך נתונים מסוים, היכן שאין ערכים מספריים Excel יפרש טקסט וערכים בוליאניים כוזבים כשווים ל-0, וערכים בוליאניים אמיתיים כשווים ל-1.

לכן, אם יש לך מערך נתונים, חישוב השונות שלו לא יהיה קשה באמצעות אחת מהפונקציות של Excel המפורטות לעיל.

תורת ההסתברות היא ענף מיוחד במתמטיקה הנלמד רק על ידי תלמידי מוסדות להשכלה גבוהה. האם אתה אוהב חישובים ונוסחאות? האם אינך חושש מהסיכוי להכיר את ההתפלגות הנורמלית, האנטרופיה של האנסמבל, הציפייה המתמטית והפיזור של משתנה אקראי בדיד? אז הנושא הזה יהיה מאוד מעניין אותך. בואו נכיר כמה מהמושגים הבסיסיים החשובים ביותר של ענף מדע זה.

בואו נזכור את היסודות

גם אם אתה זוכר הכי הרבה מושגים פשוטיםתורת ההסתברות, אל תזניח את הפסקאות הראשונות של המאמר. הנקודה היא שללא הבנה ברורה של היסודות, לא תוכל לעבוד עם הנוסחאות שנדונו להלן.

אז מתרחש איזה אירוע אקראי, איזה ניסוי. כתוצאה מהפעולות שאנו נוקטים, אנו יכולים לקבל מספר תוצאות – חלקן מתרחשות בתדירות גבוהה יותר, אחרות בתדירות נמוכה יותר. ההסתברות לאירוע היא היחס בין מספר התוצאות שהושגו בפועל מסוג אחד ל מספר כוללאפשרי. רק אם תכירו את ההגדרה הקלאסית של מושג זה תוכלו להתחיל ללמוד את הציפייה המתמטית והפיזור של משתנים אקראיים רציפים.

מְמוּצָע

עוד בבית הספר, במהלך שיעורי מתמטיקה, התחלת לעבוד עם הממוצע החשבוני. מושג זה נמצא בשימוש נרחב בתורת ההסתברות, ולכן לא ניתן להתעלם ממנו. העיקר מבחינתנו הוא הרגע הזההוא שנפגוש אותו בנוסחאות לציפיות מתמטיות ופיזור של משתנה מקרי.

יש לנו רצף של מספרים ורוצים למצוא את הממוצע האריתמטי. כל מה שנדרש מאיתנו הוא לסכם את כל הקיים ולחלק במספר האלמנטים ברצף. תנו לנו מספרים מ-1 עד 9. סכום היסודות יהיה שווה ל-45, ונחלק את הערך הזה ב-9. תשובה: - 5.

פְּזִירָה

במונחים מדעיים, פיזור הוא הריבוע הממוצע של הסטיות של הערכים המתקבלים של מאפיין מהממוצע האריתמטי. הוא מסומן באות לטינית גדולה אחת D. מה צריך כדי לחשב אותו? עבור כל רכיב ברצף, אנו מחשבים את ההפרש בין המספר הקיים לבין הממוצע האריתמטי ומריבוע אותו. יהיו בדיוק כמה ערכים שיכולים להיות תוצאות לאירוע שאנו שוקלים. לאחר מכן, נסכם את כל מה שהתקבל ונחלק במספר האלמנטים ברצף. אם יש לנו חמש תוצאות אפשריות, חלק בחמש.

לפיזור יש גם תכונות שצריך לזכור כדי לשמש בפתרון בעיות. לדוגמה, כאשר מגדילים משתנה אקראי ב-X פעמים, השונות גדלה ב-X פעמים בריבוע (כלומר X*X). היא אף פעם לא קורית פחות מאפסואינו תלוי בהסטת ערכים בערך שווה למעלה או למטה. בנוסף, עבור ניסויים עצמאיים, השונות של הסכום שווה לסכום השונות.

כעת אנו בהחלט צריכים לשקול דוגמאות לשונות של משתנה אקראי בדיד והתוחלת המתמטית.

נניח שהרצנו 21 ניסויים והגענו ל-7 תוצאות שונות. צפינו בכל אחד מהם 1, 2, 2, 3, 4, 4 ו-5 פעמים, בהתאמה. למה תהיה השונות שווה?

ראשית, בוא נחשב את הממוצע האריתמטי: סכום היסודות, כמובן, הוא 21. נחלק אותו ב-7, ונקבל 3. כעת נחסר 3 מכל מספר ברצף המקורי, ריבוע כל ערך, ונחבר את התוצאות יחד. התוצאה היא 12. כעת כל שעלינו לעשות הוא לחלק את המספר במספר האלמנטים, ונראה שזה הכל. אבל יש מלכוד! בואו נדון בזה.

תלוי במספר הניסויים

מסתבר שבחישוב השונות, המכנה יכול להכיל אחד משני מספרים: או N או N-1. כאן N הוא מספר הניסויים שבוצעו או מספר האלמנטים ברצף (שזה בעצם אותו דבר). במה זה תלוי?

אם מספר הבדיקות נמדד במאות אז עלינו לשים במכנה N. אם ביחידות אז N-1. מדענים החליטו לצייר את הגבול באופן סמלי למדי: היום הוא עובר דרך המספר 30. אם ערכנו פחות מ-30 ניסויים, נחלק את הכמות ב-N-1, ואם יותר, אז ב-N.

מְשִׁימָה

נחזור לדוגמה שלנו לפתרון בעיית השונות והתוחלת המתמטית. קיבלנו מספר ביניים 12, שהיה צריך להיות מחולק ב-N או N-1. מכיוון שערכנו 21 ניסויים שהם פחות מ-30, נבחר באפשרות השנייה. אז התשובה היא: השונות היא 12/2 = 2.

ערך צפוי

הבה נעבור למושג השני, שעלינו לשקול במאמר זה. התוחלת המתמטית היא תוצאה של הוספת כל התוצאות האפשריות כפול ההסתברויות המתאימות. חשוב להבין שהערך המתקבל, כמו גם תוצאת חישוב השונות, מתקבל פעם אחת בלבד עבור כל הבעיה, לא משנה כמה תוצאות נחשבות בה.

הנוסחה לתוחלת מתמטית היא די פשוטה: אנחנו לוקחים את התוצאה, מכפילים אותה בהסתברות שלה, מוסיפים אותו הדבר עבור התוצאה השנייה, השלישית וכו'. כל מה שקשור למושג זה לא קשה לחישוב. לדוגמה, סכום הערכים הצפויים שווה לערך הצפוי של הסכום. הדבר נכון גם לגבי העבודה. כגון פעולות פשוטותלא כל כמות בתורת ההסתברות מאפשרת לך לעשות זאת. ניקח את הבעיה ונחשב את המשמעות של שני מושגים שלמדנו בבת אחת. חוץ מזה, דעתנו הוסחה על ידי תיאוריה - הגיע הזמן לתרגל.

עוד דוגמה אחת

הרצנו 50 ניסויים וקיבלנו 10 סוגים של תוצאות - מספרים מ-0 עד 9 - המופיעים באחוזים שונים. אלה הם, בהתאמה: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. נזכיר שכדי לקבל הסתברויות, עליך לחלק את ערכי האחוזים ב-100. לפיכך, אנו מקבלים 0.02; 0.1 וכו' הבה נציג דוגמה לפתרון הבעיה עבור השונות של משתנה מקרי והתוחלת המתמטית.

אנו מחשבים את הממוצע האריתמטי באמצעות הנוסחה הזכורה לנו מבית הספר היסודי: 50/10 = 5.

עכשיו בואו נמיר את ההסתברויות למספר התוצאות "בחתיכות" כדי להקל על הספירה. נקבל 1, 5, 2, 7, 1, 9, 3, 8, 5 ו-9. מכל ערך שהתקבל, נחסר את הממוצע האריתמטי, ולאחר מכן נריבוע כל אחת מהתוצאות שהתקבלו. ראה כיצד לעשות זאת באמצעות האלמנט הראשון כדוגמה: 1 - 5 = (-4). הבא: (-4) * (-4) = 16. עבור ערכים אחרים, בצע את הפעולות הללו בעצמך. אם עשית הכל נכון, לאחר הוספת כולם תקבל 90.

נמשיך בחישוב השונות והערך הצפוי על ידי חלוקת 90 ב-N. מדוע אנו בוחרים ב-N ולא ב-N-1? נכון, כי מספר הניסויים שבוצעו עולה על 30. אז: 90/10 = 9. קיבלנו את השונות. אם אתה מקבל מספר אחר, אל ייאוש. סביר להניח שעשית טעות פשוטה בחישובים. תבדוק שוב את מה שכתבת, וכנראה שהכל יסתדר.

לבסוף, זכור את הנוסחה לציפיות מתמטיות. לא ניתן את כל החישובים, נכתוב רק תשובה שתוכל לבדוק איתה לאחר סיום כל ההליכים הנדרשים. הערך הצפוי יהיה 5.48. הבה נזכור רק כיצד לבצע פעולות, תוך שימוש באלמנטים הראשונים כדוגמה: 0*0.02 + 1*0.1... וכן הלאה. כפי שאתה יכול לראות, אנו פשוט מכפילים את ערך התוצאה בהסתברות שלו.

חֲרִיגָה

מושג נוסף הקשור קשר הדוק לפיזור וציפייה מתמטית הוא סטיית תקן. זה מסומן באותיות הלטיניות sd, או באותיות קטנות יוונית "סיגמה". המושג הזהמראה עד כמה בממוצע הערכים חורגים מהתכונה המרכזית. כדי למצוא את ערכו, עליך לחשב את השורש הריבועי של השונות.

אם אתה משרטט גרף התפלגות נורמלי ומעוניין לראות את הסטייה בריבוע ישירות עליו, ניתן לעשות זאת בכמה שלבים. קח חצי מהתמונה משמאל או מימין למצב (ערך מרכזי), צייר מאונך לציר האופקי כך ששטחי הדמויות המתקבלות יהיו שווים. גודל הקטע בין אמצע ההתפלגות לבין ההשלכה המתקבלת על גבי ציר אופקיוייצג את סטיית התקן.

תוֹכנָה

כפי שניתן לראות מתיאורי הנוסחאות והדוגמאות שהוצגו, חישוב השונות והתוחלת המתמטית אינו ההליך הפשוט ביותר מבחינה אריתמטית. כדי לא לבזבז זמן, הגיוני להשתמש בתוכנית המשמשת בהשכלה גבוהה מוסדות חינוך- זה נקרא "R". יש לו פונקציות המאפשרות לך לחשב ערכים עבור מושגים רבים מסטטיסטיקה ותורת ההסתברות.

לדוגמה, אתה מציין וקטור של ערכים. זה נעשה באופן הבא: וקטור<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

סוף כל סוף

פיזור וציפייה מתמטית הם שבלעדיהם קשה לחשב שום דבר בעתיד. בקורס העיקרי של הרצאות באוניברסיטאות הם נדונים כבר בחודשים הראשונים ללימוד הנושא. דווקא בגלל חוסר ההבנה של המושגים הפשוטים הללו וחוסר היכולת לחשב אותם, מתחילים מיד סטודנטים רבים לפגר בתכנית ובהמשך מקבלים בתום המפגש ציונים גרועים, מה שמונע מהם מלגות.

תרגל לפחות שבוע, חצי שעה ביום, פתרון משימות דומות לאלו המוצגות במאמר זה. לאחר מכן, בכל מבחן בתורת ההסתברות, תוכל להתמודד עם הדוגמאות ללא טיפים מיותרים ודפי הונאה.