Hace referencia a las variables que se han medido a nivel nominal. Es decir, que sus valores representan categorías o grupos en una variable. Puede ser el caso de cuántas personas están a favor o en contra de una decisión. En este caso tenemos dos categorías o grupos: los que van por el sí y los que van por el no. Puede tratarse de otra variable como nivel
de satisfacción respecto al sabor de la comida. En este caso las personas contestan según tres categorías
1. Si satisfecho
2.No satisfecho
3. Indeciso.
Otras variable semejantes son el género o sexo de la persona, el partido político de preferencia, etc. Una pregunta que puede surgir ante estas variables es, si las frecuencias o número de casos observados en cada categoría de la variable, a partir de una muestra, difieren de manera significativa respecto a una población esperada de respuestas o frecuencias.
Ejemplo:
Digamos que 900 estudiantes expresan su voluntad por celebrar el aniversario de la institución organizando uno de dos
Eventos: una acto solemne en el templo universitario o una actividad deportiva en el estadio de fútbol. Una vez hecha la
Encuesta se tiene que 495 alumnos prefieren la actividad deportiva y 405 se inclinan por el acto solemne. ¿Existe una diferencia significativa entre los estudiantes en su preferencia por la actividad deportiva? La prueba estadística para determinar la significativita de la diferencia en las frecuencias observadas es la prueba llamada Chi Cuadrada. Para el caso que nos ocupa, se supone que si no hay diferencia en la preferencia de los alumnos de una manera perfecta, tendríamos 450 alumnos eligiendo el acto solemne y otros 450 eligiendo las actividades deportivas. Esa es la frecuencia de respuestas esperadas en el caso de una igualdad absoluta. Pero tenemos frecuencias observadas un poco diferentes en un caso son 495 y en el otro 405, lo que deseamos saber es si esa diferencia observada es significativa.
Lo que se hace al aplicar la fórmula de chi cuadrada es restar al número de frecuencias observadas, el número de frecuencias esperadas; elevar esta diferencia al cuadrado, lo que hace que todos los valores asuman un valor positivo, y luego se divide el cuadrado obtenido entre el las frecuencias esperadas. Esto se hace de manera independiente para cada una de las categorías. Una vez terminado este paso, se suman los resultados obtenidos en cada categoría y ese valor resultante de la suma es el valor Chi cuadrada observado, el cual deberá ser comparado con el valor Chi cuadrada crítico según el nivel alpha de significatividad escogido y los grados de libertad correspondientes. En el caso de nuestro ejemplo se trata de dos categorías, lo que conduce a un grado de libertad. A continuación el proceso ara calcular el valor Chi cuadrada.
1. A favor del acto solemne:
Frecuencias observadas = 405
Frecuencias esperadas = 450
(frecuencias observadas – frecuencias esperadas )2 |
( 405 – 450)/ 450 = (-45)2 /450 = 2025/450= 4.5 |
2. A favor del acto deportivo:
Frecuencias observadas = 495
Frecuencias esperadas = 450
(frecuencias observadas – frecuencias esperadas )2 |
( 495 – 450)/ 450 = (45)2 /450 = 2025/450= 4.5 |
3. Se suman los valores obtenidos en cada grupo para obtener el valor de chi cuadrada.
4.5 + 4.5 = 9.00
4. Se compara este valor con el valor correspondiente a un grado de libertan en la tabla de Chi cuadrado y se encuentra que el valor crítico de χ2 para un grado de libertad a un nivel alpha = .05 a dos colas es = 3.8941 Siendo que el valor Chi cuadrada (χ 2) obtenido es mayor que el valor crítico, se desacredita la hipótesis nula que afirma que no existe diferencia significativa entre las frecuencias observadas y se concluye que la diferencia es significativa. Esto
quiere decir que en menos de 5 casos de cada cien, una diferencia como la del valor igual o mayor al observado de Chi cuadrado en este caso (χ 2 =9), puede ser atribuida a la selección de la muestra (azar).
1. Cuando los datos puntualizan a las escalas nominal u ordinal.
2. Se utiliza solo la frecuencia.
3. Poblaciones pequeñas.
4. Cuando se desconocen los parámetros media, moda, etc.
5. Cuando se quiere contrastar o comparar hipótesis
6. Investigaciones de tipo social - muestras pequeñas no representativas >5.
6. Investigaciones de tipo social - muestras pequeñas no representativas >5.
7. Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias
8. Cuando la muestra es seleccionada no probabilísticamente.
9. X2 permite establecer diferencias entre f y se utiliza solo en escala nominal.
Población > a 5 y < a 20.
Pasos.
1. Arreglar las categorías y las frecuencias observadas.
2. Calcular los valores teóricos esperados para el modelo experimental o tipo de distribución muestral: normal, binomial y de Poisson.
3. Calcular las diferencias de las frecuencias observadas en el experimento con respecto a las frecuencias esperadas.
4. Elevar al cuadrado las diferencias y dividirlas entre los valores esperados de cada categoría.
5. Efectuar la sumatoria de los valores calculados.
6. Calcular los grados de libertad (gl) en función de número de categorías [K]: gl = K - 1.
7. Comparar el estadístico X2 con los valores de la distribución de ji cuadrada en la tabla.
8. Decidir si se acepta o rechaza la hipótesis X2c ³ X2t se rechaza Ho.
Ejemplo:
Un investigador quiere comparar si hay diferencias en la cantidad de cigarros fumados por causa del estrés en personas que trabajan.
Elección de la prueba.
· Hipótesis alterna (Ha). Habrá diferencia significativa entre la cantidad de cigarros fumados por causa del estrés en personas que trabajan.
· Hipótesis nula (Ho). No Habrá diferencia significativa entre la cantidad de cigarros fumados por causa del estrés en personas que trabajan.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
.
Aplicación de la prueba estadística.
El cálculo de la frecuencia esperada se efectúa en virtud de que para una hipótesis nula, a todas las casillas corresponde un valor igual, por lo tanto
fo = 18
fe = 6
fe = 6
gl = 3 + 1 = 2
a = 0.05
a = 0.05
El valor calculado de X2 se compara con los valores críticos de la tabla de valores críticos de X2. Se puede observar que para una probabilidad de 0.05 corresponde la cifra de 5.99; por lo tanto, el estadístico ji cuadrada de 4.3 tiene una probabilidad mayor que 0.05.
Decisión.
En virtud de que la probabilidad obtenida al calcular el valor de X2 está dentro de la región de rechazo, se acepta Ho y se rechaza Ha. X2c ³ X2t se rechaza Ho
Entonces tenemos que:
4.3 < 5.99 se acepta Ho \ No hay diferencias significativas entre el consumo de cigarros por causa del estrés.
Interpretación.
El consumo de cigarros por causa del estrés se puede considerar como efecto del azar.