Problema pàgina 10 “Diapositives de classe” Tema 1 La marca A és sobretot consumida pel segment X i la B pel segment Y. Esperem que la primera marca serà comprada pel segment que més gasta. Però per respondre la pregunta amb precisió hem de fer una taula de freqüències. Si es vol fer freqüències relatives per columnes hem de dividir el 48 per 81, si es vol fer per fileres el 48 per 60. A la pàgina 12 ho hem fet per columnes. També es fa sobre la columna “total”. Les dades les acabem comparant respecte el total, així: el segment X es caracteritza per la marca A, C, i D mentre que el segment Y solament per la marca B. Fet per fileres hem d’arribar a les mateixes conclusions. Hem de comparar la marca del seu total, per tant: la Marca A del segment X està associada amb aquest segment (comparem el 0,8 amb 0,46). No es tracta d’una relació perfecta, si es donés el cas, solament saben la marca podríem determinar el segment al que pertany el cas. Tot el contrari a una relació perfecta seria quan sempre es consumeixi amb la mateixa relació qualsevol marca, és a dir, independentment de la marca que consumeixis tens les mateixes probabilitats de pertànyer a un o altre segment. X A 0,8 B 0,222 C 0,6 D 0,555 Total 0,46 (Taula de freqüències relatives per columna) A B C D Total (Relació perfecta) A B C D Total Y 0,2 0,777 04 0,444 0,54 X 1 1 0 0 1 Y 0 0 1 1 0 X 0,8 0,8 0,8 0,8 0,8 Y 0,2 0,2 0,2 0,2 0,2 L’estadístic V de Cramér és una mesura d’associació, ens diu com de relacionades estan les variables. Per poder interpretar aquest estadístic és requereix una condició (també per saber si és correcte), hem de calcular les freqüències esperades sota independència: Com haguessin estat les freqüències calculades més a dalt si fossin independents. Si hi hagués independència la columna total s’hagués vist repetida en les altres columnes. A B X 81*0,337 = 27,303 81*0,556 = 45,051 Y 97*0,337 = 32,697 97*0,556 = 53,949 C 81*0,056 = 4,551 97*0,056 = 5,449 D 81*0,062 = 4,096 97*0,041 = 4,904 Un cop fet això la solució és agrupar columnes o files. Com són solament dos columnes en aquest cas no les podem agrupar (ho hem de fer solament amb les que donen problemes i que s’assemblin entre elles). La marca C i D, que són de preu mitjà i per tant s’assemblen entre elles, les podem agrupar. X 27,303 45,051 8,646 A B CiD Y 32,697 53,949 10,354 (Observada-esperada)^2 /esperada X Y A (48-27,303)^2/27,303=15,689 (12-32,697)^2/32,697=13,101 B (22-45,051)^2/45,051=11,794 (77-53,949)^2/53,949=9,849 C (11-8,646)^2/8,646=0,641 (8-10,354)^2/10,354=0,535 Si sumem els 6 valors obtinguts obtenim l’estadístic khi-quadrat (En aquest cas és 51,608) V de Cramér = sqrt(khiQuadrat/n*(dimesióMínimaTaula-1)) ---- sqrt(51,608/178*(2-1)) = 0,538 Aquest resultat, per ell sol, té poc a dir. L’haurem de comparar amb altres estadístics V de Cramér, com els ingressos, el lloc de residència, etc. Tot i així, el màxim -1- indica dependència total i 0 independència total, així que podem concloure que existeix cert grau de dependència entre els dos segments. MIRAR: Reforç -Problema resolt 6 pàgina 150 -Problema proposat 5 pàgina 158 -Llegir pàgines 138-144 -Pel lliurament del dia 28: p28-45 del dossier “Material R Studio 1r Semestre” -Pel lliurament del dia 5/10: p47-51 Problema proposat 5 p.158 Útil Completa 603 Regular 113 Baixa 37 Total 753 Poc Útil Inútil Total 316 104 1023 189 67 369 125 46 208 630 217 1600 Regular 0.15 0.3 0.309 0.231 Baixa 0.049 0.198 0.212 0.13 Total 1 1 1 1 Taula de freqüències Útil Poc Útil Inútil Total Completa 0.8 0.5 0.479 0.639 Freqüències esperades Útil Poc Útil Inútil Completa 0.639*753=481.167 0.639*630=402.57 0.639*217=138.663 Regular 0.231*753=173.943 0.231*630=145.53 0.231*217=50.127 Baixa 0.13*753=97.89 0.13*630=81.9 0.13*217=28.21 Diferències entre freqüències Completa Regular Útil (603-481.167)^2/481.167 = (113-173.943)^2/173.949 30.85 = 21.355 Poc Útil (316-402.57)^2/402.57 = (189-145.53)^2/145.53 = 18.616 12.98 Inútil (104-138.663)^2/138.663 = (67-50.127)^2/50.127 = 8.66 5.679 Khi quadrat = 162.98 V = sqrt(162.98/(1600*3-1)) = 0.226 Baixa (37-97.89)^2/97.89 37.89 (46-81.9)^2/81.9 15.736 (46-28.21)^2/28.21 11.22 = = =