Ir al contenido principal

PRUEBAS

Prueba t de Student para muestras independientes

Supongamos que tenemos dos muestras aleatorias e independientes con medias de x1¯ y x2¯ y que queremos saber si estas dos medias son signifacativamente distintas a un nivel de p0,05. Esto es lo mismo que decir que si afirmamos que hay una diferencia entre las muestras tenemos un 95% de probabilidad de tener razón. Lo que tenemos que calcular, entonces, es la probabilidad de que las dos muestras pueder provenir de la misma distribución y que la diferencia que vemos es por varianza en esa población. En otras palabras: queremos saber si dos muestras con la diferencia observada (x1¯x2¯) podrían tener provenir de la misma población.

Si sacamos un número significativo de muestras de una misma población la media de estas muestra va a tener una diferencia con la media de la población, en algunos casos más altos y en otros más bajos. Usamos este conocimiento para calcular el error estándar:

SE=σN.

De la misma manera existe un error estándar de diferencias entre medias (SED por sus siglas en ingles).

Definición 7.1 (Error estándar de diferencia entre medias)SED=σ12/N1+σ12/N2

donde:

  • σ12 y σ22: las varianzas de las poblaciones 1 y 2
  • N1 y N2: es el número de observaciones en cada muestra.

Al igual que con el error estándar, a menudo desconocemos la varianza de la población, por lo cual lo estimamos de la muestra y la formula es la que vemos en la definición 7.2.

Definición 7.2 (Error estándar de diferencia entre medias estimado de muestras)SED=s12/N1+s12/N2

donde:

  • s12 y s22: las varianzas de las muestras 1 y 2
  • N1 y N2: es el número de observaciones en cada muestra.

Vimos en la sección 5.3 que para muestras relativamente pequeñas (N<30) la distribución de la muestra tiende a la distribución t de Student. Podemos valernos de esto para calcular la probabilidad de que nuestro SED esté en el rango requerido aplicando la formula de la definición

Definición 7.3 (Prueba de t)t=(x1¯x2¯)SED.

Si aplicamos la fórmula de la definición 7.3 nos sale un valor que podemos comparar con los valores críticos de la tabla del apendice A para determinar si rechazamos H0 o no.

Ejemplo 7.1 (Prueba t)

Volvemos ahora a nuestros datos de notas de dos grupos de estudiantes con diferentes metodologías pedagígicos. Queremos saber con un nivel de significanza de 0,05 si existe diferencia entre la media de los dos grupos. Nuestras hipótesis nula y alternativa son entonces:

H0:μA=μB,

H1:μAμB.

Los datos son:

Grupo A: {15, 12, 11, 18, 15, 15, 9, 19, 14, 13, 11, 12, 18, 15, 16, 14, 16, 17, 15, 17, 13, 14, 13, 15, 17, 19, 17, 18, 16, 14} y

Grupo B: {11, 16, 14, 18, 6, 8, 9, 14, 12, 12, 10, 15, 12, 9, 13, 16, 17, 12, 8, 7, 15, 5, 14, 13, 13, 12, 11, 13, 11, 7}.

La media y desviación estándar:

   Grupo A:
       xA¯=14,933
       s=2,490
       N=30
   Grupo B:
      x¯=11,77
      s=3,308
      N=30.

Aplicando la fórmula de la definición 7.2 obtenemos:

SED=s12/N1+s12/N2=2,4902/30+3,3082/N2=0,756

y podemos calcular el valor de t aplicando la fórmula de la definición 7.3

t=x1¯x2¯SED=14.93311,7660,756=4,188.

Si buscamos este valor en el Apendix A para 29 grados de libertad (N-1), vemos que debemos rechazar H0 y concluir que existe una diferencia estadísticamente significativa entre las dos muestras. Tenemos razón de creer que el método pedagógico influye en los resultados finales de los estudiantes.


Prueba de z

Existe también una prueba, llamada de z, que se puede usar para muestras más grandes. Se basa en el hecho de que cuando las muestras son más grandes tienden a una distribución normal y no una distribución t. Aparte de eso su concepto y mecánica es similar a la de la prueba t. Puede aplicarse cuando las muestras tienen más de 30 (N>30) observaciones y la principal diferencia de que es capaz de detectar diferencias más pequeñas en los datos lo que reduce el riesgo de un error tipo II.


Prueba de Shapiro-Wilks

En la sección 4.3 mencionamos que existen algunas maneras de estimar si una variable tiene una distribución normal o no. Nos basamos sobre todo en la forma de los polígonos de frecuencias (2.1). Ahora vamos a introducir un test más formal de normalidad.

El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una distribución normal. Eligimos un nivel de significanza, por ejemplo 0,05, y tenemos una hipótesis alternativa que sostiene que la distribución no es normal.

Tenemos:

H0: La distribución es normal

H1: La distribución no es normal,

o más formalmente aún:

H0:XN(μ,σ2)

H1:XN(μ,σ2).


Prueba de Fisher

Al inicio del capítulo también vimos que uno de los requisitos para que una prueba estadística paramétrica sea válida es que las varianzas sean de similar magnitud. Para ello también existe un test, el test de Fisher18 que plantea las hipótesis:

H0:σ12=σ22,

H0:σ12σ22





Resumen de procedimiento

La figura 7.1 despliega un diagrama de flujo para eligir un test estadístico inferencial.

Diagrama de flujo para selección de estadística inferencial

Figura 7.1: Diagrama de flujo para selección de estadística inferencial

Comentarios

Entradas populares de este blog

EJERCICIO: Diferencia entre dos medias de poblaciones independientes

Una operación de ensamblaje de una planta industrial requiere que un empleado nuevo se someta a un período de entrenamiento para alcanzar su máxima eficacia. Se sugirió un nuevo método de entrenamiento y se llevó a cabo de una prueba para comparar los métodos. Dos grupos de nueve empleados nuevos se entrenaron durante un período de tres semanas, un grupo usando el nuevo método y el otro siguiendo el procedimiento de entrenamiento estándar. Al final del período de tres semanas se observó el tiempo en minutos que le tomó a cada empleado ensamblar el dispositivo. ¿Presentan los datos suficiente evidencia que indique que el tiempo medio de ensamblaje al final del período de entrenamiento de tres semanas es menor para el nuevo método? Procedimiento estándar Procedimiento nuevo 32 35 37 31 35 29 28 25 41 34 44 40 35 27 31 32 34 31 Dentro de Excel los datos para su análisis han sido ordenados en columnas, como se muestra a continuación. El procedimiento para solicitar en Excel la prueba de me...

- EJERCICIO: Diferencia entre dos medias de poblaciones dependientes

Un fabricante deseaba comparar la resistencia al desgaste de dos tipos distintos de neumáticos A y B. Para hacer la comparación, se asignó al azar un neumático del tipo A y uno del tipo B a las ruedas posteriores de 20 automóviles. Los coches recorrieron un número específico de kilómetros y se observó el desgaste de cada neumático. Automóvil 1 2 3 4 5 6 7 8 9 10 Neumático A 10.6 9.8 12.3 9.7 8.8 10 9.9 9 12.1 8.9 Neumático B 10.2 9.4 11.8 9.1 8.3 10.1 9.2 11.2 11 8.2 Automóvil 11 12 13 14 15 16 17 18 19 20 Neumático A 10.1 11 11.8 9.9 12.2 12.3 10.5 8.8 8.6 9.2 Neumático B 10.1 10 10.3 10.4 11.1 11.3 9.3 8.5 10.3 11 ¿ Presentan los datos suficiente evidencia para concluir que hay diferencia en el desgaste promedio de los dos tipos de neumáticos? Dentro de Excel los datos para su análisis han sido ordenados en columnas, como se muestra a continuación.. El procedimiento para solicitar en Excel la prueba de medias para este caso es el siguiente: Seleccione del menú principal Herramientas/...

Tipos de error

  Error tipo I:  rechazar H o  siendo verdadera. Error tipo II:  rechazar H 1  siendo verdadera.   H o  es cierta H o  es falsa Aceptamos H o Decisión correcta Probabilidad = 1 - α Eror tipo II Probabilidad = β Rechazamos H o Eror tipo I Probabilidad = α Decisión correcta Probabilidad = 1 - β Ejemplo : Se ha comprobado que el tiempo de espera ( en minutos ) hasta ser atendido, en cierto servicio de urgencias, sigue un modelo normal de probabilidad. A partir de una muestra de  100  personas que fueron atendidas en dicho servicio, se ha calculado un tiempo medio de espera de  14,25 minutos y una desviación típica de  2,5  minutos. ¿Podríamos afirmar, con un nivel de significación del  5 %  que el tiempo medio de espera, en este servicio de urgencias, no es de  15 minutos? 1.  Se formula la hipótesis nula H 0  y la hipótesis alternativa H 1 . Hipótesis nula :        ...