COMPARATIA
Cand avem probe de comparatie intre 2 esantioane, folosim metode statistice oferite in functie de forma distributiei, care poate fi:
distributie simetrica: metode parametrice
distributie asimetrica: metode neparametrice (in general pentru multimi reduse de date - grupe mici)
Metodele neparametrice se folosesc pentru esantioane de 2 tipuri:
esantioane independente
esantioane perechi
si metodele difera in functie de aceasta
Putem avea:
design intersubiect: esantioane independente (proba medianei, test U - Mann-Whitney)
design intrasubiect: esantioane perechi (proba semnelor, proba Wilcoxon)
METODE DE COMPARATIE NEPARAMETRICE PENTRU 2 EŞ ;ANTIOANE
Comparatia - o folosim cand vrem sa apreciem:
efectul unei experiente
influenta unui factor
METODE DE COMPARATIE PENTRU EŞ ;ANTIOANE INDEPENDENTE
PROBA MEDIANEI
Se utilizeaza cand:
distributia nu respecta criteriile de normalitate
cand avem un numar mare de note (ranguri) egale
Exista 2 cazuri:
a) Mediana teoretica este o valoare din ansamblul de date
Condensam datele:
|
inferior medianei |
egal |
superior medianei |
A |
|
|
|
B |
|
|
|
|
inferior si egal |
Superior |
|
|
inferior |
superior si egal |
A |
|
|
|
A |
|
|
B |
|
|
|
B |
|
|
c c
Conditie:
min (c c ) semnificativ
b) Mediana teoretica NU este o valoare din ansamblul de date ; nu exista in sir
|
inferior medianei |
superior medianei |
A |
frecvente observate |
fo |
B |
Fo |
fo |
frecve-e observate - nr. cazuri constatate
c = semnificativ
Corectia lui Yates - se aplica la efective mici in unele casute din tabel:
a. Se aplica daca efectivele sunt mai mici decat 5, si atunci avem:
c =
b. Nu se aplica daca efectivele sunt mai mari decat 5, si atunci avem:
Calculam numai pe baza frecventelor observate:
c =
Gradul de libertate:
df = (c-1)(d-1) - c- coloane, d - randuri
PROBLEMA 1 - proba medianei - cand nu este o valoare a sirului
Doua clase de elevi cu profile diferite, teoretic si uman, au fost evaluate in ceea ce priveste coordonarea manuala.
Se studiaza sa se vada daca elevii proveniti din clasele cu profil real au mai dezvoltate abilitati de coordonare manuala, comparativ cu cei proveniti de la profilurile umaniste.
Rezultate obtinute la cele doua clase:
C.A |
x |
|
|
|
|
|
|
|
|
|
|
cotele |
f |
|
|
|
|
|
|
|
|
|
|
nr. subiecti |
N = 20 (efectiv)
C.B |
x |
|
|
|
|
|
|
|
|
|
|
cotele |
f |
|
|
|
|
|
|
|
|
|
|
nr. subiecti |
N = 16
Coordonarea manuala a fost stabilita cu ajutorul unei probe numite sinusoida cu arc, care a masurat numarul de erori (evaluarea poate fi facuta prin: timpul de parcurgere sau prin numarul de erori).
Variabile independente:
VI: A - profilul elevilor
a1 - real
a2 - uman
VD: X - performanta la coordonare in procesul de coordonare (operationalizata prin nr. de erori)
Design experimental: de baza
A |
a1 |
a2 |
VD |
|
|
Ipoteza de cercetare (ipoteza specifica) Hs:
Elevii proveniti de la profilul uman au o performanta mai ridicata in procesul de coordonare in comparatie cu elevii proveniti de la profilul real.
Ipoteza nula (atribuita hazardului):
Diferentele intre performantele elevilor proveniti de profilurile real si uman, in ceea ce priveste coordonarea manuala se datoreaza hazardului.
Avem doua esantioane independente - este o problema de comparatie:
daca distributiile sunt simetrice, atunci folosim metode parametrice: (grad mare de acuratete)
daca nu tinem cont de forma distributiei, atunci folosim metode neparametrice (evaluari mai de ansamblu)
Metode neparametrice:
proba medianei
testul U: mai putem tine cont de rang, dar nu-l putem utiliza atunci cand avem un numar mare de ranguri cu rezultate aproximativ egale (multi subiecti cu rezultate egale)
Avem: 6 subiecti cu cota 1 din totalul de 20
(f - frecventa - ne spune cati sunt)
6 din 20 reprezinta mai mult de 25% din valoarea esantionului - consideram ca avem multe ranguri egale
T folosim proba medianei
Daca esantioanele sunt extrase din aceeasi populatie, atunci media fiecarui esantion trebuie sa fie egala cu media populatiei.
Pasi:
I. Trebuie sa le punem impreuna esantioanele (condensam datele) si calculam ansamblul reunit de date
C.A+C.B |
x |
|
|
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
|
|
|
|
fc |
|
|
|
|
|
|
|
|
|
|
N = 36
|
|
|
|
|
|
|
|
|
|
|
|
II. Calculam mediana teoretica a ansamblului de date
locul med. =
loc.med. = = 18,5: poz. 18 med. =
poz. 19
med. = media valorilor care ocupa pozitiile 18 si 19
pozitiile 17, 18: ocupate de valoarea 3
pozitiile 19, 20 , 21: ocupate de valoarea 4 (apare de 3 ori)
valoarea care ocupa pozitia 18 este 3
valoarea care ocupa pozitia 19 este 4
mediana teoretica: = 3,5 (pentru Ho admisa)
III. Asezam datele in tabel
ne aflam in situatia in care mediana nu este o valoare a sirului
numaram numarul de subiecti care este:
|
inferior medianei |
superior medianei |
|
||
cls. A |
|
a |
|
b |
a+b=20 |
cls. B |
|
c |
|
d |
c+d=16 |
|
a+c=18 |
b+d=28 |
|
(produsul diagonalei principale - produsul diagonalei secundare)
IV. Calculam c
Suntem in situatia in care avem mai mult de 5 cazuri (numai patru casute in tabel)
Calculam numai pe baza frecventelor observate (13, 5, 7, 11 - frecvente observate)
c =
c = = 4,0 5
Trebuie sa raportam valoarea obtinuta la tabelul lui c referitor la numarul de grade de libertate
V. Calculam gradul de libertate
df = (c-1)(d-1), unde
df = gradul de libertate
c = coloane
r = randuri
df = (2-1) (2-1) = 1
Ne raportam la valorile critice la pragul de risc de:
p df |
|
|
|
|
|
c
Interpretare:
Intrucat valoarea calculata a lui c
= 4,0 5 este mai mare decat valoarea critica la pragul de
0 ,0 5 = 3,84, sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite
sa respingem ipoteza nula H0 si sa dam
credit ipotezei specifice Hs.
Putem concluziona ca performantele elevilor din clasele cu profil real difera semnificativ fata de performantele elevilor din clasele cu profil uman, dar nu putem spune cum difera.
Daca valoarea lui c ar fi fost de ex. 2,0 5, atunci ea ar fi fost mai mica decat valoarea critica la pragul de 0 ,0 5, iar sansele ipotezei nule H0 ar fi fost mai mari de 5% si atunci nu ne-am fi putut asuma riscul si am fi suspendat decizia.
PROBLEMA 2 - proba medianei - cand este o valoare a sirului
Grup C |
x |
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
N = 14 (efectiv)
Grup E |
x |
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
N = 13
I. Condensam datele
C.A+C.B |
x |
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
|
|
fc |
|
|
|
|
|
|
|
|
N = 27
|
|
|
|
|
|
|
|
|
|
II. Calculam mediana teoretica a ansamblului de date
locul med. =
loc.med. = = 14:
mediana ocupa pozitia 14; valoarea care ocupa pozitia 14 este 7 T mediana = 7
III. Condensam datele (asezam datele in tabel)
Ne aflam in situatia in care mediana este o valoare a sirului
|
inferior medianei |
egal |
superior medianei |
Grup C |
|
|
|
Grup E |
|
|
|
|
inferior si egal |
superior |
|
|
inferior |
superior si egal |
||||
Grup C |
|
a |
|
B |
|
Grup C |
|
a |
|
b |
Grup E |
|
c |
|
D |
|
Grup E |
|
c |
|
d |
IV. Calculam c
Cu ajutorul corectiei lui Yates (suntem in situatia in care avem mai putin de 5 cazuri) - efective mici
c = CORECTIA DE CONTINUITATE
c = = 1,48
c = = 0 ,90 7
Calculam: min (c c
Trebuie sa raportam valoarea obtinuta la tabelul lui c referitor la numarul de grade de libertate
V. Calculam gradul de libertate
df = (c-1)(d-1)
df = (2-1) (2-1) = 1
Ne raportam la valorile critice la pragul de risc de:
df p |
|
|
|
|
|
c
Interpretare:
Intrucat valoarea calculata a lui c2
= 0 ,90 7 este mai mica decat valoarea critica la pragul de
0 ,0 5 = 3,84, sansele ipotezei nule sunt mai mari de 5%, nu ne putem asuma
riscul si suspendam decizia.
TESTUL U - MANN-WHITNEY
Se utilizeaza cand:
datele sunt sub forma de ranguri, clasificari
NU tine cont de forma distributiei
se prefera probei medianei pentru ca tine cont de pozitia datelor din clasificare
(tine cont de rangul fiecarui rezultat din clasificare)
Exista 2 cazuri:
a) N1, N2 < 8
R1, R2 se raporteaza la un tabel special intocmit de Mann si Whitney
b) N1, N2 > 8
Se calculeaza variabila normala redusa Z
Z = , unde:
R1(2) - suma rangurilor grupului 1 (2)
N1(2) - efectivele grupului 1,2
Z variabila normala redusa - se raporteaza la valorile distributiei normale
PROBLEMA 3 - testul U pentru efective mai mari de 8
Trebuiesc evaluate efectele pe care le are instruirea programata asupra instruirii elevilor.
Am luat in studiu 2 clase, la care s-au folosit la una metodele traditionale de instruire si la cealalta metode de instruire programata.
CE (experimentala) |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N = 27
CE (control) |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N = 27
Cea mai mare frecventa a o are scorul 5, si este sub 20 % T folosim testul U
I. Combinam rezultatele celor 2 grupe intr-un ansamblu si le clasificam in ordine crescatoare sau descrescatoare
CC + CE |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
rang |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
N = 54
II. Admitem ipoteza nula H0 : cele 2 esantioane sunt selectii intamplatoare din aceeasi colectivitate
a R.gr.exp. = a R.gr. c - suma rangurilor grupului experimental = suma rangurilor grupului de control
(pentru a se confirma Ho Rc=Re - sub Ho)
III. a R.gr.exp. = a rangul cotei (notei)
valorile nule se elimina
x= efectiv (frecventa) cu care apare) in grupa 1
Grupa 1 |
|
Grupa 2 |
||||||
x |
f |
R (rang) |
fR |
|
x |
f |
R |
fR |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a Rexp = 60 5 a R c = 880
Efectivele sunt 27 > 8 (N 27>8)
Pentru verificare: Rexp + Rc = N (N+1)/2, unde N = N1 + N2
Re + Rc = 60 5 + 880 = 1.485
N(N+1)/2 = (54×55)/2= 1.485
IV. Se aflam in situatia in care: N1, N2 > 8
Se calculeaza variabila normala redusa Z
Z =
Z =
Z = - 2,38
IzI = 2,38 (valori absolute)
Cota Z se raporteaza la valorile distributiei normale
p Z |
|
|
|
|
|
Z = 2,38
Interpretare:
Intrucat valoarea calculata a lui Z este 2,38 , este
mai mare decat valoarea critica la pragul de
0 ,0 5 = 1,96, sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite
sa respingem ipoteza nula H0 si sa dam
credit ipotezei specifice Hs, ceea ce inseamna ca performantele
elevilor difera in functie de metoda de instruire utilizata.
Calcularea testului U Mann - Whitney in SPSS se realizeaza in felul urmator.
Modalitatile variabilei independente se introduc pe aceeasi coloana iar scorurile, adica operationalizarea variabilei dependente, se va introduce pe alta coloana.
Pentru calcularea coeficientului testului U Mann - Whitney se vor parcurge urmatorii pasi (prezentate in ecranele de mai jos).
Astfel obtinem o analiza descriptiva a datelor, precum valoarea testului U Mann-Whitney Z = 227.0 0 la un p = .0 17 mai mic decat pragul critic de .0 5 prin urmare sansele ipotezei nule sunt mai mici de 5%, ceea ce ne permite sa respingem ipoteza nula H0 si sa dam credit ipotezei specifice Hs, ceea ce inseamna ca performantele elevilor difera in functie de metoda de instruire utilizata.