Com llegir una enquesta

Estudiarem el següent cas: ESTUDIO CIS Nº 2.778. BARÓMETRE DE NOVEMBRE DEL 2008. 

FITCHA TÈCNICA. Univers: Població espanyola d’ambdós sexes de 18 anys i més.

Grandària de la mostra: Dissenyada: 2.500 entrevistes. Realitzada: 2.484 entrevistas.

Afixació: Proporcional.

Ponderació: No procedeix.Punts de mostreig: 238 municipis i 48 províncies

Error del mostreig: Per un nivell de confiança del 95,5% (dos sigmes), y p’ = p, l’error real es de ± 2,0% per al conjunt de la mostra i en el supòsit de mostreig aleatori simple. 

PREGUNTES SOBRE LA FITXA TÈCNICA. 

Que tenim de saber sobre l’univers o la població? 

Que vol dir nivell de confiança?

Com es fixa la grandària de la mostra (quantitat d’observacions de la mostra) i perquè?

Que és l’error real de la mostra i perquè ens diuen pel conjunt de la mostra?També veiem que ens diuen p’=p. Que volen dir?

Que significa un nivell de confiança?

Com interpretarem els resultat? 

ANÀLISI DE L’ENQUESTA Per analitzar la mesura d’una variable tenim que conèixer la seva definició:

Definició de mesura. Una mesura real, és una dada que es desconeix, però que el valor real té una probabilitat d’un percentatge (normalment 95,5% o 99,5%) de trobar-se en l’interval de confiança que està entre dos valors determinats. Seguirem l’ordre que s’utilitza per desenvolupar una enquesta:      

1. Definir l’univers o població real.      

2. Estimació del tipus de la distribució de probabilitats dels valors de la població que analitzem.

3. Nivell de confiança i fixació de l’error màxim acceptable.      

4. Hipòtesi de que la proporció resultant de la mostra sigui igual a la de la població real.

5. Elecció de  la grandària de la mostra. 

1. UNIVERS O POBLACIÓ REAL. A partir d’ara ens referirem a població real, com a un conjunt d’elements dels qual volem conèixer alguna característica, per les de distintes categories o classes. 

 2. DISTRIBUCIÓ DE PROBABILITATS. Les distribucions més freqüents són: Probabilitat discreta (binomial, de Poisson)Probabilitat continua (Normal, log-normal)I les mesures de les variables són:Mesures de tendència central (mitjana, moda, mediana)Mesura de dispersió (interval interquartil, variància i desviació estàndard)

Moda: és el valor amb major nombre d’observacions.

Mediana: és el valor que té un 50% d’observacions tant pel damunt com per sota.  

Depèn del tipus de distribució es pot pressuposar quina llei seguirà. Així si s’estudia la distribució de freqüències de l’hora d’entrada d’uns treballadors a la feina, veurem que la majoria  arribarà poc abans de l’hora, i els demés uns minuts tard formant una cua que anirà disminuint. La forma de la corba estarà descentrada amb un valor de la moda propera a uns minuts de l’hora d’entrada. Aquesta distribució segueix la llei de Poisson.  imatge-1-copy.jpg

En aquesta enquesta s’ha pressuposat que en aquest tipus de població (Q) la distribució compleix la llei Normal, que gràficament té forma de campana de Gauss.Prendrem una mostra (n’). Per comprovar-ho hem dibuixat una gràfica en què a l’eix de les ordenades hem col·locat uns intervals (classes o graus de llibertat) de valors (0-2; 2,1-4;…..) i a les abscisses el nombre de vegades que hem observat, un valor comprés entre cada interval.  

imatge-2.jpg Una manera de verificar si la distribució compleix la llei Normal, és comprovar-la amb el test de Chi al quadrat. Percentatge de compliment = m’/(G’-3) per una llei normal m’  

– Mitjana de la mostra (m): és la suma dels valors centrals de cada classe (x’), ponderades per la freqüència corresponentG’  

– Graus de llibertat (nombre d’intervals) de la mostra. Elegim el nombre de graus de llibertat d’una taula que el relaciona amb el nivell de probabilitat.Per  exemple si escollim un nivell del 5%, veurem que el valor de chi al quadrat és 15,51 que solament tindrà aquest 5 % de ser sobrepassat i correspondrà a 8 graus de llibertat.

Si la mitjana de la mostra és (m’)=43,5      43,5/(8-3) = 8,7<15,51 que demostra que la corba segueix la llei Normal. 

3. NIVELL DE CONFIANÇA I FIXACIÓ DE L’ERROR MÀXIM ACCEPTABLE. A la llei Normal es compleix que una variable aleatòria, té prop del 95% de possibilitats d’agafar un valor que no es desvií de la mitjana més de dues vegades la desviació estàndard.

La Desviació estàndard o típica (Desv. Std): És l’arrel quadrada de la variància, i Variància (V): És la suma ponderada dels quadrats de les desviacions amb respecta a la mitjana,La forma de càlcul de la desviació estàndard és:                   V= (Suma de n’*x’2/Suma de n’) – m’2                  

Desv. Std.=V1/2Així si la mitjana és de 43,5

i la Desv.St. de 0,5

direm que la mitjana de la població real (m) tindrà una probabilitat del 95,5% de estar compresa entre 43,5+2*0,5= 44,5 i 43,5-2*0,5= 42,5. 

Nivell de confiança més-menys  2 (1*100/43,5)= 4,58% Aquesta variable la fixarem en un valor que ens doni un valor significatiu. En el cas d’intenció de vot els dos grans partits es previsible que les diferències siguin petites, per tant l’error admissible significatiu té que ser petit. Però tindrem de tenir en compte que la grandària de la mostra no sigui excessivament gran, per motius econòmics.S’ha escollit un error màxim acceptable del 2%, ara comprovarem la grandària de la mostra. 

4. HIPÒTESI DE QUE LA PROPORCIÓ RESULTANT DE LA MOSTRA SIGUI IGUAL A LA DE LA POBLACIÓ REAL. Estimarem un resultat en forma de proporció (p’) de la població que compleix els requisits (N’) entre la quantitat d’elements observat  (p’) =N’/n’. n’  

– Població observada, escollida a l’atzar (mostra).

N’  – Població que compleix els requisits.p’  

– Proporció estimada.p    – Proporció real.   Si la proporció  estimada  (p’) es igual a 0,5 ens dóna l’error màxim de l’enquesta. 

5. ELECCIÓ DE LA GRANDÀRIA DE LA MOSTRA. 

Interval de confiança. (error de la mostra total). Podem calcular l’interval de confiança 2*(2*(p*((1-p)/n’))^1/2), sumant-lo i restant-lo a la mitjana (m’=m). Q  

– Població real (univers).p    – Proporció real que compleix els requisitsp´  

– Proporció de la mostra que compleix els requisits (p’=N’/n’)    

 imatge-3.jpg

 imatge-4.jpg

 Amb aquest càlcul hem comprovat que la grandària de la mostra (n’) per un error del 2% té de ser de 2500.     

imatge-5.jpg

          Resultats de l’enquesta. Les mitjanes obtingudes en aquesta enquesta tenen poca fiabilitat ja que si les persones que diuen van votar al PSOE tenen una amplitud de valoració entre (1,3 i 6,06), es declaren d’esquerres amb un valor de (1,3) però amb la mateixa probabilitat es declaren de centre dreta pel valor de (6,06)  

imatge-6.jpg Aquest altre resultat és més fiable, ja que l’error és l’espera’t.