» »

1 abatere standard. Procent de abatere standard

19.10.2019

La testarea statistică a ipotezelor, la măsurarea unei relații liniare între variabile aleatoare.

Deviație standard:

Deviație standard (estimarea abaterii standard a variabilei aleatoare Floor, pereții din jurul nostru și tavanul, X raportat la așteptările sale matematice bazate pe o estimare imparțială a varianței sale):

unde este dispersia; - Podeaua, pereții din jurul nostru și tavanul, i al-lea element al selecției; - marime de mostra; - media aritmetică a eșantionului:

Trebuie remarcat faptul că ambele estimări sunt părtinitoare. În cazul general, este imposibil să se construiască o estimare imparțială. Cu toate acestea, estimarea bazată pe estimarea variației imparțiale este consecventă.

Regula trei sigma

Regula trei sigma() - aproape toate valorile unei variabile aleatoare distribuite normal se află în interval. Mai strict - cu o încredere nu mai puțin de 99,7%, valoarea unei variabile aleatoare distribuite normal se află în intervalul specificat (cu condiția ca valoarea să fie adevărată și să nu fie obținută ca urmare a procesării eșantionului).

Dacă valoarea adevărată este necunoscută, atunci ar trebui să folosim nu, ci podeaua, pereții din jurul nostru și tavanul, s. Astfel, regula de trei sigma se transformă în regula de trei etaj, pereții din jurul nostru și tavan, s .

Interpretarea valorii abaterii standard

O valoare mare a abaterii standard arată o răspândire mare a valorilor în setul prezentat cu valoarea medie a setului; o valoare mică, în consecință, arată că valorile din set sunt grupate în jurul valorii de mijloc.

De exemplu, avem trei seturi de numere: (0, 0, 14, 14), (0, 6, 8, 14) și (6, 6, 8, 8). Toate cele trei seturi au valori medii egale cu 7 și, respectiv, abateri standard egale cu 7, 5 și 1. Ultimul set are o abatere standard mică, deoarece valorile din set sunt grupate în jurul valorii medii; primul set are cel mai mult mare importanță abaterea standard - valorile din cadrul setului diferă foarte mult de valoarea medie.

Într-un sens general, abaterea standard poate fi considerată o măsură a incertitudinii. De exemplu, în fizică, abaterea standard este utilizată pentru a determina eroarea unei serii de măsurători succesive a unei cantități. Această valoare este foarte importantă pentru determinarea plauzibilității fenomenului studiat în comparație cu valoarea prezisă de teorie: dacă valoarea medie a măsurătorilor diferă mult de valorile prezise de teorie (deviație standard mare), atunci valorile obținute sau metoda de obținere a acestora trebuie reverificate.

Uz practic

În practică, abaterea standard vă permite să determinați cât de mult pot diferi valorile dintr-un set față de valoarea medie.

Climat

Să presupunem că există două orașe cu aceeași temperatură medie zilnică maximă, dar unul este situat pe coastă, iar celălalt este în interior. Se știe că orașele situate pe coastă au multe temperaturi maxime diurne diferite, care sunt mai scăzute decât orașele situate în interior. Prin urmare, abaterea standard a temperaturilor maxime zilnice pentru un oraș de coastă va fi mai mică decât pentru al doilea oraș, în ciuda faptului că valoarea medie a acestei valori este aceeași, ceea ce înseamnă, în practică, că probabilitatea ca temperatura maximă a aerului pe orice zi a anului va fi mai mare, diferită de valoarea medie, mai mare pentru un oraș situat în interior.

Sport

Să presupunem că există mai multe echipe de fotbal care sunt evaluate în funcție de un set de parametri, de exemplu, numărul de goluri marcate și primite, șanse de gol etc. Cel mai probabil, cea mai bună echipă din această grupă va avea cele mai bune valori De Mai mult parametrii. Cu cât abaterea standard a echipei pentru fiecare dintre parametrii prezentați este mai mică, cu atât rezultatul echipei este mai previzibil; astfel de echipe sunt echilibrate. Pe de altă parte, pentru o echipă cu o abatere standard mare, este dificil de prezis rezultatul, care la rândul său se explică prin dezechilibru, de ex. apărare puternică, dar cu un atac slab.

Utilizarea abaterii standard a parametrilor echipei face posibilă, într-o măsură sau alta, să se prezică rezultatul unui meci între două echipe, evaluând punctele forte și părțile slabe comenzile și deci metodele alese de luptă.

Analiza tehnica

Vezi si

Literatură

* Borovikov, V. STATISTICI. Arta analizei datelor pe computer: Pentru profesioniști / V. Borovikov. - St.Petersburg. : Peter, 2003. - 688 p. - ISBN 5-272-00078-1.

Definit ca o caracteristică generalizantă a mărimii variației unei trăsături în agregat. Este egal cu rădăcina pătrată a abaterii pătrate medii a valorilor individuale ale atributului de la media aritmetică, adică Rădăcina lui și poate fi găsită astfel:

1. Pentru rândul principal:

2. Pentru seria de variații:

Transformarea formulei deviației standard o aduce într-o formă mai convenabilă pentru calcule practice:

Deviație standard determină cât de mult se abate în medie opțiunile specifice de la valoarea lor medie și este, de asemenea, o măsură absolută a variabilității unei caracteristici și este exprimată în aceleași unități ca și opțiunile și, prin urmare, este bine interpretată.

Exemple de găsire a abaterii standard: ,

Pentru caracteristici alternative, formula abaterii standard arată astfel:

unde p este proporția unităților din populație care au o anumită caracteristică;

q este proporția unităților care nu au această caracteristică.

Conceptul de abatere liniară medie

Abaterea liniară medie este definită ca media aritmetică a valorilor absolute ale abaterilor opțiunilor individuale de la .

1. Pentru rândul principal:

2. Pentru seria de variații:

unde suma n este suma frecvențelor serii de variație.

Un exemplu de găsire a abaterii liniare medii:

Avantajul abaterii medii absolute ca măsură a dispersiei în intervalul de variație este evident, deoarece această măsură se bazează pe luarea în considerare a tuturor posibile abateri. Dar acest indicator are dezavantaje semnificative. Respingerea arbitrară a semnelor algebrice de abateri poate duce la faptul că proprietățile matematice ale acestui indicator sunt departe de a fi elementare. Acest lucru face foarte dificilă utilizarea abaterii medii absolute atunci când se rezolvă probleme care implică calcule probabilistice.

Prin urmare, abaterea liniară medie ca măsură a variației unei caracteristici este rar utilizată în practica statistică, și anume atunci când însumarea indicatorilor fără a lua în considerare semne are sens economic. Cu ajutorul lui, de exemplu, se analizează cifra de afaceri a comerțului exterior, compoziția muncitorilor, ritmul producției etc.

Medie pătrată

Patrat mediu aplicat, de exemplu, pentru a calcula dimensiunea medie a laturilor n secțiuni pătrate, diametrele medii ale trunchiurilor, țevilor etc. Este împărțit în două tipuri.

Pătrat mediu simplu. Dacă, la înlocuirea valorilor individuale ale unei caracteristici cu o valoare medie, este necesar să se mențină neschimbată suma pătratelor valorilor inițiale, atunci media va fi o valoare medie pătratică.

Este rădăcina pătrată a coeficientului de împărțire a sumei pătratelor valorilor atributelor individuale la numărul lor:

Pătratul mediu ponderat se calculează folosind formula:

unde f este semnul greutății.

Cubic mediu

Se aplică cubici medii, de exemplu, atunci când se determină lungimea medie a unei laturi și a cuburilor. Este împărțit în două tipuri.
Cubic mediu simplu:

La calcularea valorilor medii și a dispersiei în serii de intervale de distribuții valori adevărate caracteristicile sunt înlocuite cu valorile centrale ale intervalelor, care sunt diferite de media aritmetică a valorilor incluse în interval. Acest lucru duce la o eroare sistematică la calcularea varianței. V.F. Sheppard a hotărât că eroare în calculul varianței, cauzată de utilizarea datelor grupate, este 1/12 din pătratul intervalului atât în ​​direcția ascendentă, cât și în sens descendent a varianței.

Amendamentul Sheppard trebuie utilizat dacă distribuția este apropiată de normal, se referă la o caracteristică cu caracter continuu de variație, este construită conform un număr semnificativ date originale (n > 500). Cu toate acestea, pe baza faptului că, în unele cazuri, ambele erori, acționând în direcții diferite, se compensează reciproc, uneori este posibil să refuzi introducerea de corecții.

Cu cât varianța și abaterea standard sunt mai mici, cu atât populația este mai omogenă și media va fi mai tipică.
În practica statisticii, este adesea nevoie de a compara variațiile diverse semne. De exemplu, este de mare interes să se compare variațiile de vârstă a lucrătorilor și calificările acestora, vechimea în muncă și dimensiunea acestora salariile, costul și profitul, vechimea în muncă și productivitatea muncii etc. Pentru astfel de comparații, indicatorii variabilității absolute a caracteristicilor sunt nepotriviți: este imposibil să se compare variabilitatea experienței de muncă, exprimată în ani, cu variația salariilor, exprimată în ruble.

Pentru a efectua astfel de comparații, precum și comparații ale variabilității aceleiași caracteristici în mai multe populații cu medii aritmetice diferite, se utilizează un indicator relativ de variație - coeficientul de variație.

Medii structurale

Pentru a caracteriza tendinţa centrală în distribuţiile statistice, este adesea raţional să se folosească, împreună cu media aritmetică, o anumită valoare a caracteristicii X, care, datorită anumitor trăsături ale amplasării sale în seria de distribuţie, poate caracteriza nivelul acesteia.

Acest lucru este deosebit de important atunci când într-o serie de distribuție valorile extreme ale unei caracteristici au limite neclare. Din cauza asta definiție precisă Media aritmetică este de obicei imposibilă sau foarte dificilă. În astfel de cazuri, nivelul mediu poate fi determinat luând, de exemplu, valoarea caracteristicii care se află la mijlocul seriei de frecvență sau care apare cel mai des în seria curentă.

Astfel de valori depind numai de natura frecvențelor, adică de structura distribuției. Ele sunt tipice într-o serie de frecvențe, prin urmare, astfel de valori sunt considerate caracteristici ale centrului distribuției și, prin urmare, au primit definiția mediilor structurale. Sunt folosite pentru a studia structura internași structura seriei de distribuție a valorilor atributelor. Astfel de indicatori includ:

O metodă aproximativă de evaluare a variabilității unei serii de variații este de a determina limita și amplitudinea, dar valorile variantei din cadrul seriei nu sunt luate în considerare. Principala măsură general acceptată a variabilității unei caracteristici cantitative într-o serie de variații este abatere standard (σ - sigma). Cu cât abaterea standard este mai mare, cu atât gradul de fluctuație al acestei serii este mai mare.

Metoda de calcul a abaterii standard include următorii pași:

1. Aflați media aritmetică (M).

2. Determinați abaterile opțiunilor individuale de la media aritmetică (d=V-M). În statisticile medicale, abaterile de la medie sunt desemnate ca d (abatere). Suma tuturor abaterilor este zero.

3. Patratează fiecare abatere d 2.

4. Înmulțiți pătratele abaterilor cu frecvențele corespunzătoare d 2 *p.

5. Aflați suma produselor å(d 2 *p)

6. Calculați abaterea standard folosind formula:

Când n este mai mare de 30 sau când n este mai mic sau egal cu 30, unde n este numărul tuturor opțiunilor.

Valoarea abaterii standard:

1. Abaterea standard caracterizează răspândirea variantei în raport cu valoarea medie (adică, variabilitatea seriei de variații). Cu cât sigma este mai mare, cu atât gradul de diversitate al acestei serii este mai mare.

2. Abaterea standard este utilizată pentru o evaluare comparativă a gradului de corespondență a mediei aritmetice cu seria de variații pentru care a fost calculată.

Variațiile fenomenelor de masă respectă legea distribuției normale. Curba care reprezintă această distribuție arată ca o curbă simetrică netedă în formă de clopot (curbă Gauss). Conform teoriei probabilității, în fenomenele care se supun legii distribuției normale, există o relație matematică strictă între valorile mediei aritmetice și abaterea standard. Distribuția teoretică a unei variante într-o serie de variații omogene se supune regulii trei sigma.

Dacă într-un sistem de coordonate dreptunghiulare, valorile unei caracteristici cantitative (variante) sunt reprezentate pe axa absciselor, iar frecvența de apariție a unei variante într-o serie de variații este reprezentată pe axa ordonatelor, atunci variantele cu mai mari și mai mici valorile sunt situate uniform pe părțile laterale ale mediei aritmetice.



S-a stabilit că, cu o distribuție normală a trăsăturii:

68,3% din valorile variantei sunt în M±1s

95,5% din valorile variantei sunt în M±2s

99,7% din valorile variantei sunt în M±3s

3. Abaterea standard vă permite să stabiliți valori normale pentru parametrii clinici și biologici. În medicină, intervalul M±1s este de obicei luat ca interval normal pentru fenomenul studiat. Abaterea valorii estimate de la media aritmetică cu mai mult de 1s indică o abatere a parametrului studiat de la normă.

4. În medicină, regula trei sigma este folosită în pediatrie pentru a evalua individual nivelul de dezvoltarea fizică copii (metoda deviației sigma), pentru a dezvolta standarde pentru îmbrăcămintea copiilor

5. Abaterea standard este necesară pentru a caracteriza gradul de diversitate al caracteristicii studiate și pentru a calcula eroarea mediei aritmetice.

Valoarea abaterii standard este de obicei folosită pentru a compara variabilitatea serii de același tip. Dacă se compară două serii cu semne diferite(inaltimea si greutatea, durata medie tratamentul spitalicesc și mortalitatea spitalicească etc.), atunci o comparație directă a dimensiunilor sigma este imposibilă , deoarece abaterea standard este o valoare numită exprimată în numere absolute. În aceste cazuri, utilizați coeficient de variație (Cv), care este o valoare relativă: raportul procentual dintre abaterea standard și media aritmetică.

Coeficientul de variație se calculează folosind formula:

Cu cât coeficientul de variație este mai mare , cu atât variabilitatea acestei serii este mai mare. Se crede că un coeficient de variație de peste 30% indică eterogenitatea calitativă a populației.

Deviație standard

Cea mai perfectă caracteristică a variației este deviația pătrată medie, care se numește standard (sau abatere standard). Deviație standard() este egal cu rădăcina pătrată a abaterii pătrate medii a valorilor individuale ale atributului de la media aritmetică:

Abaterea standard este simplă:

Abaterea standard ponderată se aplică datelor grupate:

Următorul raport are loc între pătratul mediu și abaterile liniare medii în condiții normale de distribuție: ~ 1,25.

Abaterea standard, fiind principala măsură absolută a variației, este utilizată la determinarea valorilor ordonate ale unei curbe de distribuție normală, în calculele legate de organizarea observării eșantionului și stabilirea acurateței caracteristicilor eșantionului, precum și la evaluarea limitele de variație ale unei caracteristici într-o populație omogenă.

18. Varianta, tipurile sale, abaterea standard.

Varianta unei variabile aleatoare- o măsură a răspândirii unei variabile aleatoare date, adică abaterea acesteia de la așteptările matematice. În statistică, notația sau este adesea folosită. Rădăcină pătrată din varianță se numește de obicei deviație standard, deviație standard sau spread standard.

Varianta totala (σ 2) măsoară variația unei trăsături în întregime sub influența tuturor factorilor care au determinat această variație. În același timp, datorită metodei de grupare, este posibilă identificarea și măsurarea variației datorate caracteristicii de grupare și a variației apărute sub influența factorilor necontabilizați.

Varianta intergrup (σ 2 m.gr) caracterizează variația sistematică, adică diferențele de valoare a trăsăturii studiate care apar sub influența trăsăturii - factorul care formează baza grupului.

Deviație standard(sinonime: deviație standard, deviație standard, abatere pătrată; termeni conexe: deviație standard, spread standard) - în teoria probabilităților și statistică, cel mai comun indicator al dispersării valorilor unei variabile aleatoare în raport cu așteptarea sa matematică. Cu matrice limitate de mostre de valori, în loc de așteptarea matematică, se utilizează media aritmetică a setului de eșantioane.

Abaterea standard se măsoară în unități de măsură ale variabilei aleatoare în sine și este utilizată la calcularea erorii standard a mediei aritmetice, la construirea intervalelor de încredere, la testarea statistică a ipotezelor, la măsurarea relației liniare dintre variabilele aleatoare. Definit ca rădăcina pătrată a varianței unei variabile aleatoare.

Deviație standard:

Deviație standard(estimarea abaterii standard a unei variabile aleatoare X raportat la așteptările sale matematice bazate pe o estimare imparțială a varianței sale):

unde este dispersia; - i al-lea element al selecției; - marime de mostra; - media aritmetică a eșantionului:

Trebuie remarcat faptul că ambele estimări sunt părtinitoare. În cazul general, este imposibil să se construiască o estimare imparțială. În acest caz, estimarea bazată pe estimarea variației nepărtinitoare este consecventă.

19. Esența, domeniul de aplicare și procedura de determinare a modului și a mediei.

Pe lângă mediile de putere din statistică, pentru caracterizarea relativă a valorii unei caracteristici variabile și a structurii interne a seriei de distribuție, se folosesc medii structurale, care sunt reprezentate în principal de moda si mediana.

Modă- Aceasta este cea mai comună variantă a seriei. Moda este folosită, de exemplu, în determinarea mărimii hainelor și pantofilor care sunt cele mai solicitate în rândul clienților. Modul pentru o serie discretă este varianta cu cea mai mare frecvență. Când se calculează modul pentru o serie de variații de interval, este extrem de important să se determine mai întâi intervalul modal (prin frecvența maximă), apoi - valoarea valorii modale a atributului folosind formula:

§ - sensul modei

§ - limita inferioară a intervalului modal

§ - valoarea intervalului

§ - frecventa intervalului modal

§ - frecvenţa intervalului premergător modalului

§ - frecvenţa intervalului după modal

Mediana - această valoare a atributului, ĸᴏᴛᴏᴩᴏᴇ se află în baza seriei clasate și împarte această serie în două părți egale ca număr.

Pentru a determina mediana într-o serie discretă dacă frecvențele sunt disponibile, calculați mai întâi jumătatea sumei frecvențelor și apoi determinați ce valoare a variantei se încadrează pe aceasta. (Dacă seria sortată conține un număr impar de caracteristici, atunci numărul median este calculat folosind formula:

M e = (n (număr de caracteristici în total) + 1)/2,

în cazul unui număr par de caracteristici, mediana va fi egală cu media celor două caracteristici din mijlocul rândului).

La calcularea medianei pentru serii de variație de interval Mai întâi, determinați intervalul median în care se află mediana, apoi determinați valoarea mediei folosind formula:

§ - mediana cerută

§ - limita inferioara a intervalului care contine mediana

§ - valoarea intervalului

§ - suma frecventelor sau numarul termenilor seriei

§ - suma frecventelor acumulate ale intervalelor care preced mediana

§ - frecventa intervalului median

Exemplu. Găsiți modul și mediana.

Soluţie: În acest exemplu, intervalul modal este în cadrul grupului de vârstă 25-30 de ani, deoarece acest interval are cea mai mare frecvență (1054).

Să calculăm mărimea modului:

Aceasta înseamnă că vârsta modală a studenților este de 27 de ani.

Să calculăm mediana. Intervalul median este în grupă de vârstă 25-30 de ani, deoarece în acest interval există o opțiune͵ care împarte populația în două părți egale (Σf i /2 = 3462/2 = 1731). Apoi, înlocuim datele numerice necesare în formulă și obținem valoarea mediană:

Aceasta înseamnă că jumătate dintre studenți au sub 27,4 ani, iar cealaltă jumătate au peste 27,4 ani.

Pe lângă mod și mediană, sunt utilizați indicatori precum quartilele, împărțind seria clasată în 4 părți egale, decile - 10 părți și percentile - în 100 de părți.

20. Conceptul de observare a eșantionului și domeniul său de aplicare.

Observație selectivă se aplică atunci când se utilizează supravegherea continuă imposibil fizic datorită cantităţii mari de date sau nu este fezabil din punct de vedere economic. Imposibilitatea fizică apare, de exemplu, atunci când se studiază fluxurile de pasageri, prețurile pieței și bugetele familiei. Inutilitatea economică apare atunci când se evaluează calitatea mărfurilor asociate cu distrugerea lor, de exemplu, degustarea, testarea cărămizilor pentru rezistență etc.

Unitățile statistice selectate pentru observare sunt populația eșantionului sau probă, și întreaga lor matrice - populatie generala(GS). în care numărul de unități din eșantion denota n, și în întregul GS - N. Atitudine n/N numit de obicei mărime relativă sau cota de eșantion.

Calitatea rezultatelor observării eșantionului depinde de reprezentativitatea probei, adică despre cât de reprezentativ este în SG. Pentru a asigura reprezentativitatea probei, este extrem de important să se respecte principiul selecției aleatorii a unităților, care presupune că includerea unei unități HS în eșantion nu poate fi influențată de niciun alt factor decât hazardul.

Există 4 moduri de selecție aleatorie a eșantiona:

  1. De fapt aleatoriu selecția sau „metoda loto”, atunci când valorilor statistice li se atribuie numere de serie, înregistrate pe anumite obiecte (de exemplu, butoaie), care sunt apoi amestecate într-un recipient (de exemplu, într-o pungă) și selectate la întâmplare. La practică aceasta metoda efectuate folosind un generator de numere aleatoare sau tabele matematice de numere aleatoare.
  2. Mecanic selecție în funcție de care fiecare ( N/n)-a valoare a populației generale. De exemplu, dacă conține 100.000 de valori și trebuie să selectați 1.000, atunci fiecare 100.000 / 1000 = a 100-a valoare va fi inclusă în eșantion. Mai mult, dacă nu sunt clasați, atunci primul este selectat la întâmplare din prima sută, iar numărul celorlalți va fi cu o sută mai mare. De exemplu, dacă prima unitate a fost nr. 19, atunci următoarea ar trebui să fie nr. 119, apoi nr. 219, apoi nr. 319 etc. Dacă unitățile de populație sunt clasate, atunci este selectat primul nr. 50, apoi nr. 150, apoi nr. 250 și așa mai departe.
  3. Se efectuează selecția valorilor dintr-o matrice de date eterogenă stratificat metoda (stratificată), atunci când populația este mai întâi împărțită în grupuri omogene cărora li se aplică selecția aleatorie sau mecanică.
  4. Mod special eșantionarea este serial selecție, în care selectează aleatoriu sau mecanic nu valori individuale, ci seriile lor (secvențe de la un număr la un număr pe rând), în cadrul cărora se efectuează observarea continuă.

Calitatea observațiilor eșantionului depinde și de tipul de probă: repetate sau irepetabil. La re-selectare Valorile statistice sau seriile acestora incluse în eșantion sunt returnate populației generale după utilizare, având șansa de a fi incluse într-un eșantion nou. Mai mult, toate valorile din populația generală au aceeași probabilitate de includere în eșantion. Selecție nerepetatăînseamnă că valorile statistice sau seriile lor incluse în eșantion nu revin în populația generală după utilizare și, prin urmare, pentru valorile rămase ale acesteia din urmă probabilitatea de a fi incluse în următorul eșantion crește.

Eșantionarea nerepetitivă oferă rezultate mai precise și, prin urmare, este utilizată mai des. Există însă situații în care nu poate fi aplicată (studiul fluxurilor de pasageri, a cererii consumatorilor etc.) și apoi se efectuează o selecție repetată.

21. Eroarea maximă de eșantionare a observației, eroarea medie de eșantionare, procedura de calcul a acestora.

Să luăm în considerare în detaliu metodele enumerate mai sus pentru formarea unei populații eșantion și erorile de reprezentativitate care apar. În mod corespunzător aleatoriu eșantionarea se bazează pe selectarea aleatorie a unităților din populație, fără elemente sistematice. Din punct de vedere tehnic, selecția reală aleatorie se realizează prin tragere la sorți (de exemplu, loterie) sau folosind un tabel de numere aleatorii.

Selectare aleatorie corectă ʼv formă purăʼʼ este rar folosit în practica observației selective, dar este originalul printre alte tipuri de selecție; implementează principiile de bază ale observației selective. Să luăm în considerare câteva întrebări din teoria metodei de eșantionare și formula de eroare pentru un eșantion aleator simplu.

Prejudecata de eșantionare- ϶ᴛᴏ diferența dintre valoarea parametrului în populația generală și valoarea acestuia calculată din rezultatele observării eșantionului. Este important de menționat că pentru caracteristica cantitativă medie eroarea de eșantionare este determinată de

Indicatorul este de obicei numit eroare maximă de eșantionare. Media eșantionului este o variabilă aleatorie care poate lua diferite valori în funcție de unitățile incluse în eșantion. Prin urmare, erorile de eșantionare sunt, de asemenea, variabile aleatoare și pot lua valori diferite. Din acest motiv, determinați media de posibile erorieroare medie de eșantionare, care depinde de:

· dimensiunea eșantionului: cu cât numărul este mai mare, cu atât eroarea medie este mai mică;

· gradul de modificare a caracteristicii studiate: cu cât variația caracteristicii este mai mică și, în consecință, dispersia, cu atât eroarea medie de eșantionare este mai mică.

La reselectare aleatorie se calculează eroarea medie. În practică, varianța generală nu este cunoscută cu exactitate, dar în teoria probabilității s-a dovedit că . Deoarece valoarea pentru n suficient de mare este aproape de 1, putem presupune că . Apoi se calculează eroarea medie de eșantionare: . Dar în cazul unui eșantion mic (cu n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

La eșantionare aleatorie nerepetitivă formulele date sunt ajustate cu valoarea . Atunci eroarea medie de eșantionare nerepetitivă este: Și . Deoarece este întotdeauna mai mic decât , atunci multiplicatorul () este întotdeauna mai mic decât 1. Aceasta înseamnă că eroarea medie cu selecția repetată este întotdeauna mai mică decât cu selecția repetată. Prelevare mecanică de probe este utilizat atunci când populația generală este ordonată într-un fel (de exemplu, listele alegătorilor în ordine alfabetică, numerele de telefon, numerele casei și apartamentelor). Selectarea unităților se efectuează la un anumit interval, care este egal cu valoarea inversă a procentului de eșantionare. Deci, cu un eșantion de 2%, se selectează fiecare 50 de unități = 1/0,02, cu un eșantion de 5%, fiecare 1/0,05 = 20 de unități din populația generală.

Punctul de referință este selectat în diferite moduri: aleatoriu, de la mijlocul intervalului, cu modificarea punctului de referință. Principalul lucru este de a evita erorile sistematice. De exemplu, cu un eșantion de 5%, dacă prima unitate este a 13-a, atunci următoarele sunt 33, 53, 73 etc.

În ceea ce privește acuratețea, selecția mecanică este aproape de eșantionarea aleatorie reală. Din acest motiv, pentru a determina eroarea medie a eșantionării mecanice, se folosesc formule adecvate de selecție aleatorie.

La selecție tipică populația chestionată este împărțită preliminar în grupuri omogene, similare. De exemplu, atunci când cercetăm întreprinderi, acestea sunt industrii, subsectoare; când studiem populația, acestea sunt regiuni, grupuri sociale sau de vârstă. În continuare, o selecție independentă din fiecare grup se face mecanic sau pur aleatoriu.

Eșantionarea tipică produce rezultate mai precise decât alte metode. Tipizarea populației generale asigură că fiecare grup tipologic este reprezentat în eșantion, ceea ce face posibilă eliminarea influenței varianței intergrupurilor asupra erorii medii de eșantionare. Prin urmare, atunci când se află eroarea unui eșantion tipic conform regulii de adunare a variațiilor (), este extrem de important să se ia în considerare doar media variațiilor de grup. Apoi eroarea medie de eșantionare: cu eșantionare repetată, cu eșantionare nerepetitivă , Unde – media variațiilor în interiorul grupului din eșantion.

Serial (sau cuib) selecție utilizat atunci când populația este împărțită în serii sau grupuri înainte de începerea anchetei prin sondaj. Aceste serii includ ambalarea produselor finite, grupuri de studenți și brigăzi. Serii pentru examinare sunt selectate mecanic sau pur aleatoriu, iar în cadrul seriei se efectuează o examinare continuă a unităților. Din acest motiv, eroarea medie de eșantionare depinde numai de varianța intergrup (între serii), care se calculează folosind formula: unde r este numărul de serii selectate; – media seriei i-a. Se calculează eroarea medie a eșantionării în serie: cu eșantionare repetată, cu eșantionare nerepetitivă , unde R este numărul total de serii. Combinate selecția este o combinație a metodelor de selecție luate în considerare.

Eroarea medie de eșantionare pentru orice metodă de eșantionare depinde în principal de mărimea absolută a eșantionului și, într-o măsură mai mică, de procentul eșantionului. Să presupunem că se fac 225 de observații în primul caz de la o populație de 4.500 de unități și în al doilea de la o populație de 225.000 de unități. Varianțele în ambele cazuri sunt egale cu 25. Apoi, în primul caz, cu o selecție de 5%, eroarea de eșantionare va fi: În al doilea caz, cu o selecție de 0,1%, va fi egal cu:

Cu toate acestea, atunci când procentul de eșantionare a fost redus de 50 de ori, eroarea de eșantionare a crescut ușor, deoarece dimensiunea eșantionului nu s-a modificat. Să presupunem că dimensiunea eșantionului este mărită la 625 de observații. În acest caz, eroarea de eșantionare este: Mărirea eșantionului de 2,8 ori cu aceeași dimensiune a populației reduce dimensiunea erorii de eșantionare de mai mult de 1,6 ori.

22.Metode și metode de formare a unei populații eșantion.

În statistică, se folosesc diverse metode de formare a populațiilor de eșantion, care este determinată de obiectivele studiului și depinde de specificul obiectului de studiu.

Condiția principală pentru efectuarea unei anchete prin sondaj este prevenirea apariției erorilor sistematice care decurg din încălcarea principiului egalității de șanse pentru fiecare unitate a populației generale care urmează să fie inclusă în eșantion. Prevenirea erorilor sistematice se realizează prin utilizarea metodelor bazate științific pentru formarea unei populații eșantion.

Există următoarele metode de selectare a unităților din populația generală: 1) selecție individuală - sunt selectate unități individuale pentru eșantion; 2) selecția grupului - eșantionul include grupuri sau serii de unități în studiu calitativ omogene; 3) selecția combinată este o combinație de selecție individuală și de grup. Metodele de selecție sunt determinate de regulile de formare a unei populații eșantion.

Eșantionul ar trebui să fie:

  • de fapt aleatoriu constă în faptul că populaţia eşantion se formează ca urmare a selecţiei aleatorii (neintenţionate) a unităţilor individuale din populaţia generală. În acest caz, numărul de unități selectate în populația eșantionului este de obicei determinat pe baza proporției de eșantion acceptate. Proporția eșantionului este raportul dintre numărul de unități din populația eșantion n și numărul de unități din populația generală N, ᴛ.ᴇ.
  • mecanic constă în faptul că selecţia unităţilor din populaţia eşantion se face din populaţia generală, împărţită în intervale (grupe) egale. În acest caz, dimensiunea intervalului în populație este egală cu reciproca cotei eșantionului. Deci, cu o probă de 2%, se selectează fiecare a 50-a unitate (1:0,02), cu o probă de 5%, fiecare a 20-a unitate (1:0,05), etc. Cu toate acestea, în conformitate cu proporția acceptată de selecție, populația generală este, parcă, împărțită mecanic în grupuri egale. Din fiecare grup, este selectată o singură unitate pentru eșantion.
  • tipic -în care populaţia generală este mai întâi împărţită în grupuri tipice omogene. Apoi, din fiecare grup tipic, un eșantion pur aleatoriu sau mecanic este utilizat pentru a selecta individual unitățile din populația eșantionului. O caracteristică importantă a unui eșantion tipic este că oferă rezultate mai precise în comparație cu alte metode de selectare a unităților din populația eșantionului;
  • serial- în care populația generală este împărțită în grupuri de dimensiuni egale - serie. Serii sunt selectate în populația eșantionului. În cadrul seriei se efectuează observarea continuă a unităților incluse în serie;
  • combinate- eșantionarea trebuie să fie în două etape. În acest caz, populația este mai întâi împărțită în grupuri. În continuare, sunt selectate grupuri, iar în cadrul acestora din urmă sunt selectate unități individuale.

În statistică, se disting următoarele metode pentru selectarea unităților dintr-o populație eșantion:

  • o singură etapă eșantionare - fiecare unitate selectată este supusă imediat studiului după un criteriu dat (prelevare aleatorie și în serie corespunzătoare);
  • în mai multe etape eșantionare - se face o selecție din populația generală a grupurilor individuale, iar unitățile individuale sunt selectate din grupuri (eșantionare tipică cu o metodă mecanică de selectare a unităților în populația eșantion).

În plus, există:

  • re-selectare- conform schemei mingii returnate. În acest caz, fiecare unitate sau serie inclusă în eșantion este returnată populației generale și, prin urmare, are șansa de a fi inclusă din nou în eșantion;
  • repeta selectia- conform schemei mingii nereturnate. Are rezultate mai precise cu aceeași dimensiune a eșantionului.

23. Determinarea dimensiunii eșantionului extrem de important (folosind tabelul t al lui Student).

Unul dintre principiile științifice în teoria eșantionării este acela de a se asigura că sunt selectate un număr suficient de unități. Teoretic, importanța extremă a respectării acestui principiu este prezentată în dovezile teoremelor limită în teoria probabilităților, care permit stabilirea ce volum de unități trebuie selectat din populație astfel încât să fie suficient și să asigure reprezentativitatea eșantionului.

O scădere a erorii standard de eșantionare și, prin urmare, o creștere a preciziei estimării, este întotdeauna asociată cu o creștere a dimensiunii eșantionului; prin urmare, deja în etapa de organizare a unei observări a eșantionului, este necesar să se decidă care este dimensiunea a populaţiei eşantionului ar trebui să fie pentru a asigura acurateţea necesară a rezultatelor observaţiei . Calculul volumului eșantionului extrem de important este construit folosind formule derivate din formulele pentru erorile maxime de eșantionare (A), corespunzătoare unui anumit tip și metodei de selecție. Deci, pentru o dimensiune ale eșantionului repetat aleatoriu (n) avem:

Esența acestei formule este că, în cazul eșantionării aleatorii repetate a numerelor extrem de importante, dimensiunea eșantionului este direct proporțională cu pătratul coeficientului de încredere. (t2)și varianța caracteristicii variaționale (?2) și este invers proporțională cu pătratul erorii maxime de eșantionare (?2). În special, cu o creștere a erorii maxime cu un factor de doi, dimensiunea necesară a eșantionului ar trebui redusă cu un factor de patru. Dintre cei trei parametri, doi (t și?) sunt stabiliți de cercetător. În același timp, cercetătorul, pe baza scopului

iar problemele unui sondaj prin sondaj trebuie să rezolve întrebarea: în ce combinație cantitativă este mai bine să includeți acești parametri pentru a asigura opțiunea optimă? Într-un caz, el poate fi mai mulțumit de fiabilitatea rezultatelor obținute (t) decât de măsura acurateței (?), în altul - invers. Este mai dificil de rezolvat problema cu privire la valoarea erorii maxime de eșantionare, deoarece cercetătorul nu are acest indicator în etapa de proiectare a observației eșantionului; prin urmare, în practică se obișnuiește să se stabilească valoarea erorii maxime de eșantionare. , de obicei în 10% din nivelul mediu așteptat al atributului . Stabilirea mediei estimate poate fi abordată în diferite moduri: folosind date din anchete similare anterioare sau folosind date din cadrul de eșantionare și efectuarea unui eșantion pilot mic.

Cel mai dificil lucru de stabilit atunci când se proiectează o observație eșantion este al treilea parametru din formula (5.2) - varianța populației eșantionului. În acest caz, este extrem de important să se folosească toate informațiile disponibile cercetătorului, obținute în sondajele similare și pilot anterioare.

Problema determinării dimensiunii eșantionului extrem de importantă devine mai complicată dacă ancheta prin sondaj presupune studiul mai multor caracteristici ale unităților de eșantionare. În acest caz, nivelurile medii ale fiecăreia dintre caracteristici și variația lor, de regulă, sunt diferite și, în acest sens, deciderea cărei variații a căror caracteristici să se acorde preferință este posibilă doar luând în considerare scopul și obiectivele. a sondajului.

Atunci când se proiectează o observație prin eșantion, se presupune o valoare predeterminată a erorii de eșantionare admisibile în conformitate cu obiectivele unui anumit studiu și cu probabilitatea concluziilor pe baza rezultatelor observației.

În general, formula pentru eroarea maximă a mediei eșantionului ne permite să determinăm:

‣‣‣ amploarea posibilelor abateri ale indicatorilor populației generale de la indicatorii populației eșantionului;

‣‣‣ dimensiunea eșantionului necesară pentru a asigura acuratețea necesară, la care limitele posibilei erori să nu depășească o anumită valoare specificată;

‣‣‣ probabilitatea ca eroarea din eșantion să aibă o limită specificată.

Repartizarea elevilorîn teoria probabilității, este o familie cu un singur parametru de distribuții absolut continue.

24. Serii dinamice (interval, moment), serie dinamică de închidere.

Seria dinamică- acestea sunt valorile indicatorilor statistici care sunt prezentați într-o anumită secvență cronologică.

Fiecare serie temporală conține două componente:

1) indicatori ai perioadelor de timp(ani, trimestre, luni, zile sau date);

2) indicatori care caracterizează obiectul studiat pentru perioade de timp sau la date corespunzătoare, care sunt numite niveluri de serie.

Nivelurile seriei sunt exprimate atât în ​​valori absolute, cât și medii sau relative. Ținând cont de dependența de natura indicatorilor, se construiesc serii dinamice de valori absolute, relative și medii. Serii dinamice de valori relative și medii sunt construite pe baza unor serii derivate de valori absolute. Există intervale și serii de momente de dinamică.

Serii de intervale dinamice conține valorile indicatorilor pentru anumite perioade de timp. Într-o serie de intervale, nivelurile pot fi însumate pentru a obține volumul fenomenului pe o perioadă mai lungă, sau așa-numitele totaluri acumulate.

Serii de momente dinamice reflectă valorile indicatorilor la un anumit moment în timp (data de timp). În seria de momente, cercetătorul poate fi interesat doar de diferența de fenomene care reflectă schimbarea nivelului seriei între anumite date, deoarece suma nivelurilor de aici nu are un conținut real. Totalurile cumulate nu sunt calculate aici.

Cea mai importantă condiție pentru construirea corectă a seriilor de timp este comparabilitatea nivelurilor seriei aparținând unor perioade diferite. Nivelurile trebuie să fie prezentate în cantități omogene și trebuie să existe o acoperire egală a diferitelor părți ale fenomenului.

Pentru a evita denaturarea dinamicii reale, în cercetarea statistică se efectuează calcule preliminare (închiderea seriei de dinamică), care preced analiza statistică a seriei temporale. Sub închiderea seriei dinamiciiÎn general, se acceptă înțelegerea combinației într-o serie de două sau mai multe serii, ale căror niveluri sunt calculate folosind o metodologie diferită sau nu corespund limitelor teritoriale etc. Închiderea seriei de dinamică poate implica, de asemenea, aducerea nivelurilor absolute ale seriei de dinamică la o bază comună, ceea ce neutralizează incomparabilitatea nivelurilor seriei de dinamică.

25. Conceptul de comparabilitate a seriilor de dinamică, coeficienților, creșterii și ratelor de creștere.

Seria dinamică- este vorba de o serie de indicatori statistici care caracterizează evoluţia fenomenelor naturale şi sociale în timp. Colecțiile statistice publicate de Comitetul de Stat de Statistică al Rusiei conțin un număr mare de serii dinamice în formă tabelară. Serii dinamice permit identificarea tiparelor de dezvoltare a fenomenelor studiate.

Serii de dinamică conțin două tipuri de indicatori. Indicatori de timp(ani, trimestre, luni etc.) sau momente în timp (la începutul anului, la începutul fiecărei luni etc.). Indicatori de nivel de rând. Indicatorii nivelurilor seriei de dinamică pot fi exprimați în valori absolute (producția de produse în tone sau ruble), valori relative (ponderea populației urbane în %) și valori medii (salariul mediu al lucrătorilor din industrie pe an). , etc.). În formă tabelară, o serie de timp conține două coloane sau două rânduri.

Construirea corectă a seriilor temporale necesită îndeplinirea unui număr de cerințe:

  1. toți indicatorii unui număr de dinamici trebuie să fie fundamentați științific și fiabili;
  2. indicatorii unei serii de dinamici trebuie să fie comparabili în timp, ᴛ.ᴇ. trebuie calculate pentru aceleași perioade de timp sau la aceleași date;
  3. indicatorii unui număr de dinamici trebuie să fie comparabili pe întreg teritoriul;
  4. indicatorii unei serii de dinamici trebuie să fie comparabili în conținut, ᴛ.ᴇ. calculate după o singură metodologie, în același mod;
  5. indicatorii unui număr de dinamici ar trebui să fie comparabili în gama de ferme luate în considerare. Toți indicatorii unei serii de dinamică trebuie să fie dați în aceleași unități de măsură.

Indicatorii statistici pot caracteriza fie rezultatele procesului studiat pe o perioadă de timp, fie starea fenomenului studiat la un anumit moment în timp, ᴛ.ᴇ. indicatorii pot fi interval (periodici) și momentani. În consecință, inițial seriile de dinamică sunt fie interval, fie moment. Serii de dinamică a momentelor, la rândul lor, vin cu intervale de timp egale și inegale.

Seria dinamică originală poate fi transformată într-o serie de valori medii și o serie de valori relative (lanț și de bază). Astfel de serii temporale sunt numite serii temporale derivate.

Metodologia de calcul al nivelului mediu în seria de dinamică este diferită, în funcție de tipul seriei de dinamică. Folosind exemple, vom lua în considerare tipurile de serii dinamice și formule pentru calcularea nivelului mediu.

Creșteri absolute (Δy) arată câte unități s-a modificat nivelul următor al seriei față de cel anterior (gr. 3. - creșteri absolute în lanț) sau față de nivelul inițial (gr. 4. - creșteri absolute de bază). Formulele de calcul pot fi scrise după cum urmează:

Când valorile absolute ale seriei scad, va exista o „scădere” sau, respectiv, o „scădere”.

Indicatorii de creștere absolută indică faptul că, de exemplu, în 1998. producția produsului „A” a crescut față de 1997. cu 4 mii de tone, iar comparativ cu 1994 ᴦ. - cu 34 mii tone; pentru alti ani, vezi tabel. 11,5 gr.
Postat pe ref.rf
3 și 4.

Rata de crestere arată de câte ori s-a modificat nivelul seriei față de cel precedent (gr. 5 - coeficienți de creștere sau declin în lanț) sau față de nivelul inițial (gr. 6 - coeficienți de bază de creștere sau declin). Formulele de calcul pot fi scrise după cum urmează:

Ratele de creștere arata in ce procent este urmatorul nivel al seriei fata de cel anterior (gr. 7 - rate de crestere in lant) sau fata de nivelul initial (gr. 8 - rate de crestere de baza). Formulele de calcul pot fi scrise după cum urmează:

Deci, de exemplu, în 1997. volumul de producție al produsului „A” față de anul 1996 ᴦ. s-a ridicat la 105,5% (

Rata de crestere arata cu ce procent a crescut nivelul perioadei de raportare fata de cel precedent (coloana 9 - rate de crestere in lantul) sau fata de nivelul initial (coloana 10 - rate de crestere de baza). Formulele de calcul pot fi scrise după cum urmează:

T pr = T r - 100% sau T pr = creștere absolută / nivelul perioadei precedente * 100%

Deci, de exemplu, în 1996. comparativ cu 1995 ᴦ. Produsul „A” a fost produs mai mult cu 3,8% (103,8% - 100%) sau (8:210) x 100% și în comparație cu 1994 ᴦ. - cu 9% (109% - 100%).

Dacă nivelurile absolute din serie scad, atunci rata va fi mai mică de 100% și, în consecință, va exista o rată de scădere (rata de creștere cu semnul minus).

Valoarea absolută a creșterii cu 1%.(gr.
Postat pe ref.rf
11) arată câte unități trebuie produse într-o anumită perioadă, astfel încât nivelul perioadei precedente să crească cu 1%. În exemplul nostru, în 1995 ᴦ. a fost necesar să se producă 2,0 mii tone, iar în 1998 ᴦ. - 2,3 mii tone, ᴛ.ᴇ. mult mai mare.

Valoarea absolută a creșterii de 1% poate fi determinată în două moduri:

§ nivelul perioadei precedente împărțit la 100;

§ creșterile absolute în lanț sunt împărțite la ratele de creștere a lanțului corespunzătoare.

Valoarea absolută a creșterii cu 1% =

În dinamică, mai ales pe o perioadă lungă, este importantă o analiză comună a ratei de creștere cu conținutul fiecărei creșteri sau scăderi procentuale.

Rețineți că metodologia avută în vedere pentru analiza seriilor de timp este aplicabilă atât pentru seriile de timp, ale căror niveluri sunt exprimate în valori absolute (t, mii de ruble, număr de angajați etc.), cât și pentru seriile de timp, ale căror niveluri sunt exprimate în indicatori relativi (% de defecte, % conținut de cenușă de cărbune etc.) sau valori medii (randament mediu în c/ha, salariu mediu etc.).

Alături de indicatorii analitici considerați, calculați pentru fiecare an în comparație cu nivelul anterior sau inițial, la analiza serii de dinamică, este extrem de important să se calculeze indicatorii analitici medii pentru perioada: nivelul mediu al seriei, valoarea medie anuală absolută. creștere (scădere) și rata medie anuală de creștere și rata de creștere .

Metodele de calcul al nivelului mediu al unei serii de dinamici au fost discutate mai sus. În seria de dinamică a intervalului pe care o luăm în considerare, nivelul mediu al seriei este calculat folosind formula medie aritmetică simplă:

Volumul mediu anual de producție al produsului pentru 1994-1998. a însumat 218,4 mii tone.

Creșterea medie anuală absolută este de asemenea calculată folosind formula mediei aritmetice

Abaterea standard - concept și tipuri. Clasificarea și caracteristicile categoriei „Abaterea medie pătratică” 2017, 2018.

Conform sondajului prin sondaj, deponenții au fost grupați în funcție de mărimea depozitului lor în Sberbank a orașului:

Defini:

1) domeniul de aplicare;

2) mărimea medie a depozitului;

3) abaterea liniară medie;

4) dispersie;

5) abaterea standard;

6) coeficientul de variație al contribuțiilor.

Soluţie:

Această serie de distribuție conține intervale deschise. Într-o astfel de serie, valoarea intervalului primului grup se presupune în mod convențional a fi egală cu valoarea intervalului următorului, iar valoarea intervalului ultimului grup este egală cu valoarea intervalului precedentul.

Valoarea intervalului celui de-al doilea grup este egală cu 200, prin urmare, valoarea primului grup este, de asemenea, egală cu 200. Valoarea intervalului penultimului grup este egală cu 200, ceea ce înseamnă că și ultimul interval va au o valoare de 200.

1) Să definim intervalul de variație ca diferența dintre valoarea cea mai mare și cea mai mică a atributului:

Gama de variație a mărimii depozitului este de 1000 de ruble.

2) Mărimea medie a contribuției se va determina folosind formula medie aritmetică ponderată.

Să determinăm mai întâi valoarea discretă a atributului în fiecare interval. Pentru a face acest lucru, folosind formula medie aritmetică simplă, găsim punctele medii ale intervalelor.

Valoarea medie a primului interval va fi:

al doilea - 500 etc.

Să introducem rezultatele calculului în tabel:

Suma depozitului, frecați.Numărul deponenților, fMijlocul intervalului, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Depozitul mediu în Sberbank a orașului va fi de 780 de ruble:

3) Abaterea liniară medie este media aritmetică a abaterilor absolute ale valorilor individuale ale unei caracteristici față de media generală:

Procedura de calcul a abaterii liniare medii în seria de distribuție a intervalului este următoarea:

1. Se calculează media aritmetică ponderată, conform paragrafului 2).

2. Se determină abaterile absolute de la medie:

3. Abaterile rezultate se înmulțesc cu frecvențele:

4. Aflați suma abaterilor ponderate fără a ține cont de semnul:

5. Suma abaterilor ponderate este împărțită la suma frecvențelor:

Este convenabil să utilizați tabelul de date de calcul:

Suma depozitului, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Abaterea liniară medie a mărimii depozitului clienților Sberbank este de 203,2 ruble.

4) Dispersia este media aritmetică a abaterilor pătrate ale fiecărui atribut de la media aritmetică.

Calculul varianței în seria de distribuție a intervalelor se realizează folosind formula:

Procedura de calcul a variației în acest caz este următoarea:

1. Determinați media aritmetică ponderată, așa cum se arată în paragraful 2).

2. Găsiți abateri de la medie:

3. Pătrat abaterea fiecărei opțiuni de la medie:

4. Înmulțiți pătratele abaterilor cu ponderile (frecvențele):

5. Însumați produsele rezultate:

6. Suma rezultată se împarte la suma greutăților (frecvențelor):

Să punem calculele într-un tabel:

Suma depozitului, frecați.Numărul deponenților, fMijlocul intervalului, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000