» »

Varianta unei formule variabile aleatoare. Varianta si abaterea standard

19.10.2019

.

În schimb, dacă este un a.e. nenegativ. functioneaza astfel incat , atunci există o măsură de probabilitate absolut continuă pe astfel încât aceasta este densitatea sa.

    Înlocuirea măsurii în integrala Lebesgue:

,

unde este orice funcție Borel care este integrabilă în raport cu măsura probabilității.

Dispersia, tipurile și proprietățile dispersiei Conceptul de dispersie

Dispersia în statistică este la fel de medie deviație standard valorile individuale ale caracteristicii la pătrat din media aritmetică. În funcție de datele inițiale, se determină folosind formulele de varianță simple și ponderate:

1. Varianta simpla(pentru date negrupate) se calculează folosind formula:

2. Varianta ponderată (pentru seriile de variații):

unde n este frecvența (repetabilitatea factorului X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți, de asemenea, să vă uitați la alte probleme pentru a o găsi

Exemplul 1. Determinarea grupului, mediei grupului, intergrupurilor și varianței totale

Exemplul 2. Găsirea varianței și coeficientului de variație într-un tabel de grupare

Exemplul 3. Găsirea varianței într-o serie discretă

Exemplul 4. Următoarele date sunt disponibile pentru un grup de 20 de studenți prin corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicii, să se calculeze valoarea medie a caracteristicii și să se studieze dispersia acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului folosind formula:

unde X max este valoarea maximă a caracteristicii de grupare; X min – valoarea minimă a caracteristicii de grupare; n – numărul de intervale:

Acceptăm n=5. Pasul este: h = (192 - 159)/ 5 = 6,6

Să creăm o grupare de intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X"i – mijlocul intervalului. (de exemplu, mijlocul intervalului 159 – 165,6 = 162,3)

Determinăm înălțimea medie a elevilor folosind formula medie aritmetică ponderată:

Să determinăm varianța folosind formula:

Formula poate fi transformată astfel:

Din această formulă rezultă că varianța este egală cu diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersie în serie de variații cu intervale egale folosind metoda momentelor se poate calcula în felul următor folosind a doua proprietate a dispersiei (împărțirea tuturor opțiunilor la valoarea intervalului). Determinarea varianței, calculat folosind metoda momentelor, folosind următoarea formulă este mai puțin laborioasă:

unde i este valoarea intervalului; A este un zero convențional, pentru care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență; m1 este pătratul momentului de ordinul întâi; m2 - moment de ordinul doi

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:

Tipuri de variație

Varianta totala măsoară variația unei caracteristici la nivelul întregii populații în ansamblu sub influența tuturor factorilor care provoacă această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale unei caracteristici x de la valoarea medie globală a lui x și poate fi definită ca varianță simplă sau varianță ponderată.

Varianta în cadrul grupului caracterizează variația aleatoare, adică parte a variației care se datorează influenței factorilor necontabiliați și nu depinde de atributul-factorial care formează baza grupului. O astfel de dispersie este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X de la media aritmetică a grupului și poate fi calculată ca dispersie simplă sau ca dispersie ponderată.

Prin urmare, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi este media grupului; ni este numărul de unități din grup.

De exemplu, variațiile intragrup care trebuie determinate în sarcina de a studia influența calificărilor lucrătorilor asupra nivelului productivității muncii într-un atelier arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea instrumente și materiale, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul unui grup toți lucrătorii au aceleași calificări).

Media variațiilor în interiorul grupului reflectă variația aleatorie, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează folosind formula:

Varianta intergrup caracterizează variaţia sistematică a caracteristicii rezultate, care se datorează influenţei factorului-atribut care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată folosind formula:

Cu toate acestea, această caracteristică în sine nu este suficientă pentru cercetare. variabilă aleatorie. Să ne imaginăm doi trăgători trăgând la o țintă. Unul trage cu precizie și lovește aproape de centru, în timp ce celălalt... se distrează și nici măcar nu țintește. Dar ce e amuzant este că el in medie rezultatul va fi exact același cu primul shooter! Această situație este ilustrată în mod convențional de următoarele variabile aleatoare:

Așteptarea matematică „lunetist” este egală cu , însă, pentru „persoana interesantă”: - este și zero!

Prin urmare, este necesar să se cuantifice cât de departe risipite gloanțe (valori ale variabilelor aleatoare) raportate la centrul țintei (așteptări matematice). bine si împrăștiere tradus din latină nu este altfel decât dispersie .

Să vedem cum se determină această caracteristică numerică folosind unul dintre exemplele din prima parte a lecției:

Acolo am găsit o așteptare matematică dezamăgitoare a acestui joc, iar acum trebuie să calculăm varianța acestuia, care notat cu prin .

Să aflăm cât de mult sunt „împrăștiate” câștigurile/pierderile față de valoarea medie. Evident, pentru asta trebuie să calculăm diferențeîntre valori ale variabilelor aleatorii si ea așteptări matematice:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Acum se pare că trebuie să rezumați rezultatele, dar această cale nu este potrivită - din motivul că fluctuațiile la stânga se vor anula reciproc cu fluctuații la dreapta. Deci, de exemplu, un trăgător „amator”. (exemplu de mai sus) diferențele vor fi , iar atunci când sunt adăugate vor da zero, așa că nu vom obține nicio estimare a dispersiei împușcării sale.

Pentru a ocoli această problemă, puteți lua în considerare module diferențe, dar din motive tehnice abordarea a prins rădăcini atunci când sunt pătrate. Este mai convenabil să formulați soluția într-un tabel:

Și aici se cere să calculeze medie ponderată valoarea abaterilor pătrate. Ce este? Este a lor valorea estimata, care este o măsură a împrăștierii:

definiție variaţiile. Din definiție reiese imediat că varianța nu poate fi negativă– ia notă pentru practică!

Să ne amintim cum să găsim valoarea așteptată. Înmulțiți diferențele la pătrat cu probabilitățile corespunzătoare (continuare tabel):
– la sens figurat, aceasta este „forța de tracțiune”,
și rezumați rezultatele:

Nu crezi că, în comparație cu câștigurile, rezultatul s-a dovedit a fi prea mare? Așa este - l-am pătrat și pentru a reveni la dimensiunea jocului nostru, trebuie să extragem Rădăcină pătrată. Această cantitate se numește deviație standard și este notat cu litera greacă „sigma”:

Această valoare este uneori numită deviație standard .

Care este sensul lui? Dacă ne abatem de la așteptarea matematică la stânga și la dreapta prin abaterea standard:

– atunci cele mai probabile valori ale variabilei aleatoare vor fi „concentrate” pe acest interval. Ce observăm de fapt:

Cu toate acestea, se întâmplă că atunci când se analizează împrăștierea se operează aproape întotdeauna cu conceptul de dispersie. Să ne dăm seama ce înseamnă în legătură cu jocuri. Dacă în cazul săgeților vorbim despre „precizia” lovirilor în raport cu centrul țintei, atunci dispersia caracterizează două lucruri:

În primul rând, este evident că pe măsură ce pariurile cresc, și dispersia crește. Deci, de exemplu, dacă creștem de 10 ori, atunci așteptarea matematică va crește de 10 ori, iar varianța va crește de 100 de ori (deoarece aceasta este o cantitate pătratică). Dar rețineți că regulile jocului în sine nu s-au schimbat! Doar ratele s-au schimbat, aproximativ vorbind, înainte de a paria 10 ruble, acum sunt 100.

Al doilea punct, mai interesant, este că variația caracterizează stilul de joc. Fixați mental pariurile jocului la un anumit nivel, și să vedem ce este:

Un joc cu variație scăzută este un joc precaut. Jucătorul tinde să aleagă cele mai de încredere scheme, unde nu pierde/câștigă prea mult la un moment dat. De exemplu, sistemul roșu/negru la ruletă (vezi exemplul 4 al articolului Variabile aleatoare) .

Joc cu variație mare. Ea este numită des dispersiv joc. Acesta este un stil de joc aventuros sau agresiv, în care jucătorul alege scheme de „adrenalină”. Să ne amintim măcar "Martingala", în care sumele puse în joc sunt ordine de mărime mai mari decât jocul „liniștit” de la punctul precedent.

Situația în poker este orientativă: există așa-zise strâmt jucători care au tendința de a fi precauți și „tremurați” cu privire la fondurile lor de jocuri (rulaj bancar). Nu este surprinzător, bankroll-ul lor nu fluctuează semnificativ (varianță scăzută). Dimpotrivă, dacă un jucător are o variație mare, atunci el este un agresor. Adesea își asumă riscuri, face pariuri mari și poate fie să spargă o bancă uriașă, fie să piardă în frânturi.

Același lucru se întâmplă în Forex și așa mai departe - există o mulțime de exemple.

Mai mult, în toate cazurile, nu contează dacă jocul este jucat pentru bani sau mii de dolari. Fiecare nivel are jucătorii săi cu dispersie scăzută și mare. Ei bine, după cum ne amintim, câștigul mediu este „responsabil” valorea estimata.

Probabil ați observat că găsirea variației este un proces lung și minuțios. Dar matematica este generoasă:

Formula pentru găsirea varianței

Această formulă este derivată direct din definiția varianței și o punem imediat în uz. Voi copia semnul cu jocul nostru de mai sus:

și așteptarea matematică găsită.

Să calculăm varianța în al doilea mod. Mai întâi, să găsim așteptarea matematică - pătratul variabilei aleatoare. De determinarea așteptărilor matematice:

ÎN în acest caz,:

Astfel, conform formulei:

După cum se spune, simți diferența. Și în practică, desigur, este mai bine să utilizați formula (cu excepția cazului în care condiția cere altfel).

Stăpânim tehnica de rezolvare și proiectare:

Exemplul 6

Găsiți așteptările sale matematice, varianța și abaterea standard.

Această sarcină se găsește peste tot și, de regulă, nu are sens semnificativ.
Vă puteți imagina mai multe becuri cu cifre care se aprind într-un cămin de nebuni cu anumite probabilități :)

Soluţie: Este convenabil să rezumați calculele de bază într-un tabel. Mai întâi, scriem datele inițiale în primele două rânduri. Apoi calculăm produsele, apoi și în final sumele din coloana din dreapta:

De fapt, aproape totul este gata. A treia linie arată o așteptare matematică gata făcută: .

Calculăm varianța folosind formula:

Și în sfârșit, abaterea standard:
– Personal, de obicei rotunjesc la 2 zecimale.

Toate calculele pot fi efectuate pe un calculator, sau chiar mai bine – în Excel:

E greu să greșești aici :)

Răspuns:

Cei care doresc își pot simplifica și mai mult viața și pot profita de mine calculator (demo), care nu numai că va rezolva instantaneu această problemă, ci și va construi grafică tematică (o sa ajungem acolo in curand). Programul poate fi descărcați din bibliotecă– dacă ați descărcat cel puțin unul material educațional, sau obține altă cale. Vă mulțumim pentru susținerea proiectului!

Câteva sarcini de rezolvat singur:

Exemplul 7

Calculați varianța variabilei aleatoare din exemplul anterior prin definiție.

Si un exemplu asemanator:

Exemplul 8

O variabilă aleatorie discretă este specificată de legea sa de distribuție:

Da, valorile variabilelor aleatoare pot fi destul de mari (exemplu din munca reală), și aici, dacă este posibil, folosiți Excel. Așa cum, apropo, în Exemplul 7 - este mai rapid, mai fiabil și mai plăcut.

Soluții și răspunsuri în partea de jos a paginii.

Pentru a încheia partea a 2-a a lecției, ne vom uita la o altă problemă tipică, s-ar putea spune chiar un mic puzzle:

Exemplul 9

O variabilă aleatoare discretă poate lua doar două valori: și , și . Probabilitatea, așteptările matematice și varianța sunt cunoscute.

Soluţie: Să începem cu o probabilitate necunoscută. Deoarece o variabilă aleatoare poate lua doar două valori, suma probabilităților evenimentelor corespunzătoare este:

si de cand , atunci .

Rămâne doar să găsești..., e ușor de spus :) Dar ei bine, iată. Prin definiția așteptărilor matematice:
– înlocuirea cantităților cunoscute:

– și nimic mai mult nu poate fi stors din această ecuație, cu excepția faptului că o puteți rescrie în direcția obișnuită:

sau:

Cred că poți ghici următorii pași. Să compunem și să rezolvăm sistemul:

zecimale- aceasta, desigur, este o rușine totală; înmulțiți ambele ecuații cu 10:

si imparti la 2:

Asa e mai bine. Din prima ecuație exprimăm:
(acesta este calea mai ușoară)– înlocuiți în a 2-a ecuație:


Construim pătratși faceți simplificări:

Înmulțit cu:

Rezultatul a fost ecuație pătratică, găsim că este discriminant:
- Grozav!

și obținem două soluții:

1) dacă , Acea ;

2) dacă , Acea .

Condiția este îndeplinită de prima pereche de valori. CU probabilitate mare totul este corect, dar, cu toate acestea, să notăm legea distribuției:

și efectuați o verificare, și anume, găsiți așteptarea:

Dacă populația este împărțită în grupuri în funcție de caracteristica studiată, atunci pentru această populație se pot calcula următoarele tipuri de varianță: total, grup (în cadrul grupului), media grupului (media din cadrul grupului), intergrup.

Inițial, calculează coeficientul de determinare, care arată ce parte din variația totală a trăsăturii studiate este variația intergrup, i.e. datorită caracteristicii de grupare:

Relația de corelație empirică caracterizează strânsoarea legăturii dintre gruparea (factorială) și caracteristicile de performanță.

Raportul de corelație empirică poate lua valori de la 0 la 1.

Pentru a evalua apropierea conexiunii pe baza raportului de corelație empirică, puteți utiliza relațiile Chaddock:

Exemplul 4. Următoarele date sunt disponibile cu privire la performanța muncii de către organizațiile de proiectare și sondaj forme diferite proprietate:

Defini:

1) varianța totală;

2) variațiile de grup;

3) media varianţelor grupului;

4) varianta intergrup;

5) variația totală pe baza regulii de adunare a variațiilor;


6) coeficientul de determinare și raportul de corelație empirică.

A trage concluzii.

Soluţie:

1. Să definim volum mediu efectuarea muncii de către întreprinderi cu două forme de proprietate:

Să calculăm varianța totală:

2. Determinați mediile grupului:

milioane de ruble;

milioane de ruble

Variante de grup:

;

3. Calculați media variațiilor grupului:

4. Să determinăm varianța intergrup:

5. Calculați variația totală pe baza regulii de adăugare a variațiilor:

6. Să determinăm coeficientul de determinare:

.

Astfel, volumul muncii prestate de organizațiile de proiectare și sondaj depinde cu 22% de forma de proprietate a întreprinderilor.

Raportul de corelație empirică se calculează folosind formula

.

Valoarea indicatorului calculat indică faptul că dependența volumului de muncă de forma de proprietate a întreprinderii este mică.

Exemplul 5.În urma unui studiu asupra disciplinei tehnologice a zonelor de producție, s-au obținut următoarele date:

Determinați coeficientul de determinare

Varianta este o măsură a dispersiei care descrie abaterea comparativă între valorile datelor și medie. Este cea mai utilizată măsură a dispersiei în statistică, calculată prin însumarea și pătrarea abaterii fiecărei valori de date de la medie. Formula de calcul a varianței este prezentată mai jos:

s 2 – varianța eșantionului;

x av — medie eșantionului;

n dimensiunea eșantionului (numărul de valori ale datelor),

(x i – x avg) este abaterea de la valoarea medie pentru fiecare valoare a setului de date.

Pentru a înțelege mai bine formula, să ne uităm la un exemplu. Nu prea îmi place să gătesc, așa că o fac rar. Totuși, pentru a nu muri de foame, din când în când trebuie să merg la aragaz să pun în aplicare planul de a-mi satura corpul cu proteine, grăsimi și carbohidrați. Setul de date de mai jos arată de câte ori gătește Renat în fiecare lună:

Primul pas în calcularea varianței este determinarea mediei eșantionului, care în exemplul nostru este de 7,8 ori pe lună. Restul calculelor pot fi simplificate folosind următorul tabel.

Faza finală de calcul a varianței arată astfel:

Pentru cei cărora le place să facă toate calculele dintr-o singură mișcare, ecuația ar arăta astfel:

Folosind metoda numărării crude (exemplu de gătit)

Mai sunt metoda eficienta calculul varianței, cunoscut sub numele de metoda „numărării brute”. Deși ecuația poate părea destul de greoaie la prima vedere, de fapt nu este chiar atât de înfricoșătoare. Puteți să vă asigurați de acest lucru și apoi să decideți ce metodă vă place cel mai mult.

este suma fiecărei valori de date după pătrat,

este pătratul sumei tuturor valorilor datelor.

Nu-ți pierde mințile chiar acum. Să punem toate acestea într-un tabel și veți vedea că aici sunt mai puține calcule decât în ​​exemplul anterior.

După cum puteți vedea, rezultatul a fost același ca atunci când ați folosit metoda anterioară. Avantaje aceasta metoda devin evidente pe măsură ce dimensiunea eșantionului (n) crește.

Calculul variației în Excel

După cum probabil ați ghicit deja, Excel are o formulă care vă permite să calculați varianța. Mai mult, începând cu Excel 2010, puteți găsi 4 tipuri de formule de variație:

1) VARIANCE.V – Returnează varianța eșantionului. Valorile booleene și textul sunt ignorate.

2) DISP.G - Returnează varianța populației. Valorile booleene și textul sunt ignorate.

3) VARIANCE - Returnează varianța eșantionului, luând în considerare valorile booleene și text.

4) VARIANCE - Returnează varianța populației, ținând cont de valorile logice și de text.

În primul rând, să înțelegem diferența dintre un eșantion și o populație. Scopul statisticilor descriptive este de a rezuma sau de a afișa datele într-un mod care oferă informații rapide. imagine de ansamblu, ca să zic așa, o recenzie. Inferența statistică vă permite să faceți inferențe despre o populație pe baza unui eșantion de date din acea populație. Populația reprezintă toate rezultatele sau măsurătorile posibile care ne interesează. Un eșantion este un subset al unei populații.

De exemplu, suntem interesați de un grup de studenți de la una dintre universitățile ruse și trebuie să stabilim scorul mediu al grupului. Putem calcula performanța medie a elevilor, iar apoi cifra rezultată va fi un parametru, deoarece întreaga populație va fi implicată în calculele noastre. Totuși, dacă dorim să calculăm GPA-ul tuturor studenților din țara noastră, atunci acest grup va fi eșantionul nostru.

Diferența în formula de calcul a varianței dintre un eșantion și o populație este numitorul. Unde pentru eșantion va fi egal cu (n-1), iar pentru populația generală doar n.

Acum să ne uităm la funcțiile pentru calcularea varianței cu terminații A, a cărui descriere afirmă că textul și valorile logice sunt luate în considerare în calcul. În acest caz, atunci când se calculează varianța unei anumite matrice de date, acolo unde nu există valori numerice Excel va interpreta textul și valorile booleene false ca fiind egale cu 0, iar valorile booleene adevărate ca fiind egale cu 1.

Deci, dacă aveți o matrice de date, calcularea varianței acesteia nu va fi dificilă folosind una dintre funcțiile Excel enumerate mai sus.

Teoria probabilității este o ramură specială a matematicii care este studiată numai de studenții instituțiilor de învățământ superior. Îți plac calculele și formulele? Nu ești speriat de perspectivele de a te familiariza cu distribuția normală, entropia ansamblului, așteptările matematice și dispersia unei variabile aleatoare discrete? Atunci acest subiect va fi foarte interesant pentru tine. Să facem cunoștință cu câteva dintre cele mai importante concepte de bază ale acestei ramuri a științei.

Să ne amintim elementele de bază

Chiar dacă îți amintești cel mai mult concepte simple teoria probabilității, nu neglijați primele paragrafe ale articolului. Ideea este că, fără o înțelegere clară a elementelor de bază, nu veți putea lucra cu formulele discutate mai jos.

Deci, are loc un eveniment aleatoriu, un experiment. Ca urmare a acțiunilor pe care le întreprindem, putem obține mai multe rezultate - unele dintre ele apar mai des, altele mai rar. Probabilitatea unui eveniment este raportul dintre numărul de rezultate efectiv obținute de un tip la numărul total posibil. Numai cunoscând definiția clasică a acestui concept puteți începe să studiați așteptările matematice și dispersia variabilelor aleatoare continue.

In medie

Înapoi la școală, în timpul orelor de matematică, ai început să lucrezi cu media aritmetică. Acest concept este utilizat pe scară largă în teoria probabilității și, prin urmare, nu poate fi ignorat. Principalul lucru pentru noi este acest moment este că o vom întâlni în formulele pentru așteptarea și dispersia matematică a unei variabile aleatoare.

Avem o succesiune de numere și vrem să aflăm media aritmetică. Tot ceea ce ni se cere este să însumăm tot ce este disponibil și să împărțim la numărul de elemente din secvență. Să avem numere de la 1 la 9. Suma elementelor va fi egală cu 45, iar această valoare o vom împărți la 9. Răspuns: - 5.

Dispersia

În termeni științifici, dispersia este pătratul mediu al abaterilor valorilor caracteristice obținute de la media aritmetică. Este desemnată printr-o literă latină majusculă D. Ce este necesar pentru a o calcula? Pentru fiecare element al șirului, calculăm diferența dintre numărul existent și media aritmetică și o pătratăm. Vor exista exact atâtea valori câte rezultate pot exista pentru evenimentul pe care îl luăm în considerare. În continuare, însumăm tot ceea ce a primit și împărțim la numărul de elemente din secvență. Dacă avem cinci rezultate posibile, atunci împărțiți la cinci.

Dispersia are, de asemenea, proprietăți care trebuie reținute pentru a fi utilizate la rezolvarea problemelor. De exemplu, când o variabilă aleatoare crește de X ori, varianța crește de X ori la pătrat (adică X*X). Ea nu se întâmplă niciodată mai putin de zeroși nu depinde de deplasarea valorilor cu o valoare egală în sus sau în jos. În plus, pentru încercările independente, varianța sumei este egală cu suma variațiilor.

Acum trebuie neapărat să luăm în considerare exemple de varianță a unei variabile aleatoare discrete și așteptările matematice.

Să presupunem că am efectuat 21 de experimente și am obținut 7 rezultate diferite. Am observat fiecare dintre ele de 1, 2, 2, 3, 4, 4 și, respectiv, de 5 ori. Cu ce ​​va fi egală varianța?

Mai întâi, să calculăm media aritmetică: suma elementelor, desigur, este 21. Împărțiți-o la 7, obținând 3. Acum scădeți 3 din fiecare număr din succesiunea originală, pătrați fiecare valoare și adăugați rezultatele împreună. Rezultatul este 12. Acum tot ce trebuie să facem este să împărțim numărul la numărul de elemente și, s-ar părea, atât. Dar există o captură! Să discutăm.

Dependența de numărul de experimente

Se pare că atunci când se calculează varianța, numitorul poate conține unul dintre cele două numere: fie N, fie N-1. Aici N este numărul de experimente efectuate sau numărul de elemente din secvență (care este în esență același lucru). De ce depinde asta?

Dacă numărul de teste este măsurat în sute, atunci trebuie să punem N la numitor Dacă este în unități, atunci N-1. Oamenii de știință au decis să deseneze granița în mod destul de simbolic: astăzi trece prin numărul 30. Dacă am efectuat mai puțin de 30 de experimente, atunci vom împărți cantitatea cu N-1, iar dacă mai mult, atunci cu N.

Sarcină

Să revenim la exemplul nostru de rezolvare a problemei varianței și așteptărilor matematice. Am primit un număr intermediar 12, care trebuia împărțit la N sau N-1. Deoarece am efectuat 21 de experimente, adică mai puțin de 30, vom alege a doua opțiune. Deci răspunsul este: varianța este 12 / 2 = 2.

Valorea estimata

Să trecem la al doilea concept, pe care trebuie să îl luăm în considerare în acest articol. Așteptarea matematică este rezultatul adunării tuturor rezultatelor posibile înmulțite cu probabilitățile corespunzătoare. Este important de înțeles că valoarea obținută, precum și rezultatul calculării varianței, se obține o singură dată pentru întreaga problemă, indiferent de câte rezultate sunt luate în considerare în ea.

Formula pentru așteptarea matematică este destul de simplă: luăm rezultatul, îl înmulțim cu probabilitatea lui, adăugăm același lucru pentru al doilea, al treilea rezultat etc. Tot ce este legat de acest concept nu este greu de calculat. De exemplu, suma valorilor așteptate este egală cu valoarea așteptată a sumei. Același lucru este valabil și pentru lucrare. Astfel de operatii simple Nu orice cantitate din teoria probabilității vă permite să faceți acest lucru. Să luăm problema și să calculăm semnificația a două concepte pe care le-am studiat deodată. În plus, am fost distrași de teorie – este timpul să exersăm.

Încă un exemplu

Am efectuat 50 de studii și am obținut 10 tipuri de rezultate - numere de la 0 la 9 - care apar în procente diferite. Acestea sunt, respectiv: 2%, 10%, 4%, 14%, 2%,18%, 6%, 16%, 10%, 18%. Amintiți-vă că pentru a obține probabilități, trebuie să împărțiți valorile procentuale la 100. Astfel, obținem 0,02; 0,1 etc. Să prezentăm un exemplu de rezolvare a problemei pentru varianța unei variabile aleatoare și așteptarea matematică.

Calculăm media aritmetică folosind formula pe care o amintim din școala elementară: 50/10 = 5.

Acum să convertim probabilitățile în numărul de rezultate „pe bucăți” pentru a fi mai ușor de numărat. Se obține 1, 5, 2, 7, 1, 9, 3, 8, 5 și 9. Din fiecare valoare obținută scădem media aritmetică, după care punem la pătrat fiecare dintre rezultatele obținute. Vedeți cum să faceți acest lucru folosind primul element ca exemplu: 1 - 5 = (-4). În continuare: (-4) * (-4) = 16. Pentru alte valori, faceți singur aceste operații. Dacă ați făcut totul corect, atunci după ce le-ați adunat pe toate, veți obține 90.

Să continuăm să calculăm varianța și valoarea așteptată împărțind 90 la N. De ce alegem N mai degrabă decât N-1? Corect, deoarece numărul de experimente efectuate depășește 30. Deci: 90/10 = 9. Am obținut varianța. Dacă primești un alt număr, nu dispera. Cel mai probabil, ai făcut o greșeală simplă în calcule. Verificați din nou ceea ce ați scris și probabil totul va fi la locul său.

În cele din urmă, amintiți-vă formula pentru așteptarea matematică. Nu vom da toate calculele, vom scrie doar un răspuns pe care îl puteți verifica după finalizarea tuturor procedurilor necesare. Valoarea așteptată va fi 5,48. Să ne amintim doar cum să efectuăm operațiuni, folosind primele elemente ca exemplu: 0*0,02 + 1*0,1... și așa mai departe. După cum puteți vedea, pur și simplu înmulțim valoarea rezultatului cu probabilitatea acestuia.

Deviere

Un alt concept strâns legat de dispersie și așteptările matematice este deviația standard. Se notează fie prin literele latine sd, fie prin literele grecești „sigma”. Acest concept arată cât de mult se abate, în medie, valorile de la caracteristica centrală. Pentru a-i găsi valoarea, trebuie să calculați rădăcina pătrată a varianței.

Dacă trasați un grafic de distribuție normală și doriți să vedeți abaterea pătratului direct pe acesta, acest lucru se poate face în mai multe etape. Luați jumătate din imagine la stânga sau la dreapta modului (valoarea centrală), trageți o perpendiculară pe axa orizontală, astfel încât zonele figurilor rezultate să fie egale. Dimensiunea segmentului dintre mijlocul distribuției și proiecția rezultată pe axă orizontalăși va reprezenta abaterea standard.

Software

După cum se poate observa din descrierile formulelor și exemplele prezentate, calcularea varianței și a așteptărilor matematice nu este cea mai simplă procedură din punct de vedere aritmetic. Pentru a nu pierde timpul, are sens să folosești programul folosit în învățământul superior institutii de invatamant- se numește „R”. Are funcții care vă permit să calculați valori pentru multe concepte din statistică și teoria probabilității.

De exemplu, specificați un vector de valori. Aceasta se face astfel: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

In cele din urma

Dispersia și așteptările matematice sunt fără de care este dificil să calculezi ceva în viitor. În cursul principal al prelegerilor la universități, acestea sunt discutate deja în primele luni de studiu a subiectului. Tocmai din cauza lipsei de înțelegere a acestor concepte simple și a incapacității de a le calcula, mulți studenți încep imediat să rămână în urmă în program și ulterior primesc note proaste la sfârșitul sesiunii, ceea ce îi privează de o bursă.

Exersează cel puțin o săptămână, o jumătate de oră pe zi, rezolvând probleme similare cu cele prezentate în acest articol. Apoi, la orice test de teoria probabilității, veți putea face față exemplelor fără sfaturi străine și cheat sheets.