Test asupra mediei unui esantion de volum mare - Test asupra dispersiei unui esantion dintr-o populatie normala



Test asupra mediei unui esantion de volum mare - Test asupra dispersiei unui esantion dintr-o populatie normala



In cazul in care volumul esantionului este suficient de mare, din teorema limita centrala se stie ca media de sondaj converge in lege catre o variabila gaussiana, deci ipoteza normalitatii nu mai este necesara. In acest caz, plecand de la cele doua ipoteze alternative:




H0 m m0


H1 m m0


se poate arata ca, daca esantionul este suficient de mare, statistica test:


T


unde poate fi ales fie estimatorul nedeplasat fie cel asimptotic nedeplasat (esantionul de volum mare le ‚egalizeaza’), urmeaza o lege normala standard. Vom calcula deci valoarea:


T0


si vom considera valoarea lui P corespunzatoare unei legi normale standard. Rationamentul este analog celor anterioare.


Exemplu.

(Jaffard, 1990) Se face un experiment al carui rezultat este stabilirea daca un zar este 'trucat ' sau nu. Se considera evenimentul aparitiei fetelor 5 sau 6, eveniment care are teoretic o probabilitate de 1/3. Se executa un numar de
n = 315.672 aruncari ale zarului si se observa ca
ntr-un numar de 106.602 aruncari a aparut una din fetele 5 sau 6 (experimentul lui Weldon), ceea ce ar corespunde unei probabilitati experimentale de 0,3377. In cazul nostru, rezulta ca pentru un esantion de volum mare n = 315.672, am obtinut
= 0,3377. Plecand de la variabila X corespunzatoare evenimentului aparitiei fetelor 5 sau 6, putem calcula pe ca fiind egal cu (vezi Jaffard, 1990). Prin inlocuire, obtinem:


T0 = 5,227


Din tabelul corespunzator, se observa ca p < 10-7, deci putem respinge ipoteza nula care afirma ca nu exista diferenta semnificativa ntre 1/3 si 0,3377 sau, cu alte cuvinte, respingem ipoteza ca zarul considerat este echilibrat.


Test asupra dispersiei unui esantion dintr-o populatie normala.

Trecem acum la testarea ipotezei ca dispersia unei populatii normale are o anumita valoare data, pe baza observatiilor esantionate. Sa consideram ca variabila X corespunde unei populatii originare normal repartizate N(m,) si fie ipotezele alternative:


H0 : ,


H1 : ,


Construim statistica test:


,


care se supune unei legi cu (n – 1) grade de libertate. Se calculeaza valoarea:



pentru care se obtine valoarea corespunzatoare a nivelului P.


Exemplu.

Se doreste cu ajutorul unui esantion de volum n = 20 verificarea ipotezei ca dispersia populatiei originare este 4,5. Dupa efectuarea calculelor, se obtine valoarea = 27,5 care corespunde, pentru 19 grade de libertate, la un nivel de semnificatie P = 0,093 ducand la respingerea ipotezei nule.


In paragraful anterior am testat egalitatea parametrilor unei variabile aleatoare cu anumite valori date. In cele ce urmeaza vom prezenta teste de comparatie intre parametrii a doua sau mai multe variabile aleatoare. In principiu, este vorba de doua esantioane provenind de la doua variabile aleatoare, privite in doua ipostaze distincte: esantioane independente si esantioane dependente. In cazul esantioanelor independente, observatiile esantionate corespund la indivizi diferiti (e.g. compararea reactiei la un tratament medical in lotul initial si lotul martor) in timp ce in cazul esantioanelor dependente acestea sunt masuratori asupra aceluiasi grup de indivizi (e.g. analize medicale inainte si dupa un tratament).


Test de comparatie a mediilor (esantioane independente).

Sa consideram doua esantioane, unul de volum m asupra variabilei X si altul de volum n asupra variabilei Y, n ipoteza ca atat X cat si Y sunt normale, avand aceeasi dispersie , necunoscuta. Se considera ca esantioanele sunt independente, iar ipotezele de lucru sunt:


H0 :, ,


H1 : , .


Sub auspiciile ipotezei nule rezulta ca statistica:


T = ,


se supune unei Student cu m + n - 2 grade de libertate, deci vom compara valoarea:


T0 = ,


cu valoarea tabelata corespunzatoare.


Exemplu.

1. (Jaffard, 1990). Se considera valoarea continutului n hemoglobina din sange pe un lot de m = 20 de barbati si un lot alternativ de n = 12 femei, obtinandu-se urmatoarele valori tabelate :


Barbati

Femei

1

14.00

12.12

2

14.30

13.40

3

16.20

12.10

4

16.10

14.80

5

14.71

11.90

6

14.70

13.50

7

15.40

13.20

8

16.70

13.88

9

14.02

13.10

10

15.10

14.00

11

16.40

13.50

12

17.17

14.60

13

14.20


14

15.00


15

15.52


16

16.41


17

14.50


18

15.60


19

16.50


20

15.75



Consideram ipoteza nula ca nu exista nici o diferenta semnificativa ntre mediile continutului n hemoglobina pentru barbati si femei (sub auspiciile presupunerii ca valorile continutului de hemoglobina se supun unei legi normale si au aproximativ aceeasi dispersie atat pentru femei cat si pentru barbati). In aceste conditii, avem T0 = 5.68, rezultand ca pentru o lege Student cu 20 + 12 - 2 = 30 grade de libertate, valoarea nivelului P este egal cu 0,000003 deci vom respinge ipoteza nula de similaritate a mediilor continutului de hemoglobina in sange pentru barbati si femei.

2. (Mihoc et al, 1977) Se considera un strung automat ce prelucreaza un anumit tip de piese. Se fac doua reglari diferite ale strungului, dupa care acesta se foloseste. Se extrage cate un esantion aleator de cate 15 piese, dupa fiecare reglare. Ipoteza nula pentru acest caz afirma ca cele doua reglaje au fost identice, deci nu va exista o diferenta semnificativa ntre diametrele pieselor executate dupa cele doua reglaje. Prezentam mai jos valorile esantionate, pentru a verifica o asemenea ipoteza:


Lotul I

Lotul II

10.12

10.14

10.10

10.18

10.15

10.20

10.18

10.16

10.10

10.14

10.16

10.11

10.16

10.17

10.10

10.17

10.11

10.15

10.12

10.21

10.18

10.15

10.17

10.18

10.14

10.20

10.10

10.16

10.16

10.19


Se obtine T0 = 0.31901, de unde rezulta valoarea lui P = 0.75, corespunzatoare repartitiei Student cu 28 grade de libertate, adica ipoteza nula se accepta, ne-existand diferente semnificative dupa cele doua reglaje.


Test de comparatie a mediilor (esantioane dependente).

Sa consideram acum doua variabile aleatoare X si Y, corespunzand aceluiasi lot de n indivizi, obtinand astfel un cuplu de observatii dependente. A compara mediile celor doua variabile revine la a considera variabila Z = X – Y si a compara media acesteia cu zero. Consideram, in consecinta, ipotezele:


H0 : E[Z] = 0,


H1 : E[Z] 0.


In aceste conditii se observa ca am redus problema la testul de comparatie al unei medii cu o valoare data in cazul dispersiei necunoscute, caz tratat in paragraful precedent, facandu-se apel la o statistica Student cu (n – 1) grade de libertate.