¿Qué es una prueba de hipótesis?

Una prueba de hipótesis es un método que nos ayuda a tomar decisiones y conclusiones sobre la población general utilizando datos de muestra. Por ejemplo, los médicos pueden realizar un estudio con 1,000 pacientes seleccionados al azar (una muestra) para comprender cómo puede funcionar un tratamiento en particular en todo el mundo (la población).

A veces hablamos de los resultados de una prueba de hipótesis como Estadísticamente significante… lo que significa que es poco probable que el resultado haya ocurrido solo por casualidad.

importancia de las pruebas de hipotesis

Imaginemos que trabajamos en una fábrica de fabricación de galletas y se nos ha encomendado la tarea de verificar si las cookies en la línea de producción 2 están en el objetivo con respecto a su peso. Específicamente, se supone que estas cookies en particular pesan, en promedio, 15 onzas.

Una vez que recolectamos una muestra aleatoria de alrededor de 50 cookies y las pesamos, podríamos usar un tipo específico de prueba de hipótesis llamada Prueba t de 1 muestra para ayudarnos a determinar si nuestro proceso está en el objetivo o no.

Y no se preocupe si no está familiarizado con una prueba t de 1 muestra. Simplemente queremos que comprenda cómo se puede aprovechar una prueba de hipótesis.

Dicho esto, no importa con qué tipo de prueba estamos trabajando, hay ciertas características que nunca cambian. Una de estas características es que cada prueba tendrá una hipótesis nula (Ho) y una hipótesis alternativa (Ha). Exploremos estos términos.

Hipótesis nulas y alternativas

Primero el hipótesis nula, a menudo referido como Ho, es la declaración de igualdad o ningún cambio. La hipótesis nula siempre se supone verdadera hasta que se demuestre lo contrario, al igual que un acusado en el sistema legal de los Estados Unidos se presume inocente hasta que se demuestre su culpabilidad. En nuestro ejemplo de cookie de prueba t de 1 muestra, la hipótesis nula (Ho) sería el peso de la cookie es igual 15 onzas

A continuación, el hipótesis alternativa (Ha) es la declaración de desigualdad o cambio. Dicho de otra manera, la hipótesis alternativa (Ha) es lo que estamos tratando de probar. En nuestro ejemplo de cookie de prueba t de 1 muestra, nuestra hipótesis alternativa (Ha) sería que el peso de la cookie no igual a 15 onzas.

Rechazar y no rechazar conceptos

Como intentamos caracterizar a toda una población utilizando estadísticas de muestra, siempre existe la posibilidad de que se puedan cometer errores. Veamos cómo se ven estos errores usando el siguiente diagrama.

En la parte superior vemos la condición «verdadera o real». En una situación, Ho es verdadero y en otro, Ho es falso. Luego, a un lado, observamos las decisiones que podemos tomar una vez que se completa la prueba de hipótesis. Podemos rechazar la hipótesis nula o no podemos rechazar la hipótesis nula.

Si Ho es de hecho cierto y no lo rechazamos, tomamos la decisión correcta. Y si Ho es realmente falso y lo rechazamos, también tomamos la decisión correcta. Pero, si Ho es cierto y lo rechazamos, cometemos lo que se conoce como Error tipo I. Y si Ho es falso y no lo rechazamos, hacemos un Error tipo II.

Desde una perspectiva estadística, la probabilidad de rechazar una hipótesis nula que es verdadera se denota como Alfa y la probabilidad de cometer un error de Tipo II se denota como Beta. Alfa, también conocido como el nivel de significancia, lo establecemos nosotros.

El valor alfa más común es 0.05, lo que significa que estamos dispuestos a aceptar un 5% de posibilidades de que podamos rechazar incorrectamente la hipótesis nula. Por supuesto, si se trata de procesos extremadamente críticos, puede decidir reducir alfa a algo así como 0.01, lo que significaría que solo está dispuesto a aceptar una probabilidad del 1% de rechazar incorrectamente la hipótesis nula.

Nunca «aceptamos» nada

Por otro lado, uno de los errores más comunes que cometen las personas al trabajar con pruebas de hipótesis ocurre cuando hablan de «aceptar» la hipótesis nula. Y la razón por la que esto es un error es que nunca aceptamos una hipótesis cuando trabajamos con estadísticas de muestra ya que siempre existe la posibilidad de que se pruebe que estamos equivocados una vez que se recopilan más datos.

Esto es similar al sistema de justicia de EE. UU., Ya que un acusado nunca se demuestra inocente. En cambio, un acusado se prueba culpable o no más allá de una duda razonable. En lugar de aceptar la hipótesis nula, la rechazamos o no la rechazamos.

Aumentando el poder estadístico de una prueba

Obviamente, nuestro objetivo al trabajar con pruebas de hipótesis es rechazar correctamente, o no rechazar, la hipótesis nula. La forma en que mejoramos nuestras posibilidades de éxito es aumentando el poder de la prueba. Definido poder es la probabilidad de que identifiquemos un efecto significativo cuando uno realmente existe.

Hay varios factores que influyen en el poder de una prueba. El primer factor, y el que tenemos más control, es el tamaño de la muestra. A medida que aumenta el tamaño de nuestra muestra, también lo hace el poder de la prueba. Esto significa que nuestra posibilidad de rechazar correctamente la hipótesis nula también aumenta.

Luego, con las pruebas de hipótesis, a menudo intentamos determinar si existen diferencias entre dos poblaciones. Por ejemplo, podemos querer comparar cómo la velocidad de corte impacta el diámetro de un agujero perforado. Si la diferencia entre los diámetros reales es grande, el poder de nuestra prueba aumenta. Pero, si las diferencias entre los diámetros reales son pequeñas, nuestro poder disminuye.

Finalmente, la variabilidad en la población general también afecta el poder de nuestra prueba de hipótesis. Específicamente, a medida que la variabilidad en nuestro proceso aumenta, la potencia disminuye, pero a medida que la variabilidad en nuestro proceso disminuye, nuestra potencia aumenta.

El valor p

Cuando ejecutamos una prueba de hipótesis, los resultados contendrán una estadística extremadamente importante llamada valor P, que significa valor de probabilidad. Usamos el valor P para ayudarnos a determinar si debemos rechazar o no rechazar la hipótesis nula basada en el valor alfa que establecemos.

Para explicar esto más detalladamente, volvamos a nuestro ejemplo de peso de cookies. Supongamos que establecemos nuestro valor alfa en 0.05, lo que significa que estamos dispuestos a asumir un 5% de posibilidades de que podamos rechazar Ho cuando, en realidad, deberíamos haber fallado en rechazarlo.

Como recordatorio para esta prueba de hipótesis, nuestra hipótesis nula, o Ho, es que la media del peso de la galleta es igual a 15 onzas y la hipótesis alternativa, o Ha, es que la media del peso total de la galleta de la población no es igual a 15 onzas. Luego, utilizamos software estadístico como Minitab o SigmaXL para analizar los resultados de la Prueba t de 1 muestra. Y cuando lo hacemos, aprendemos que el valor P es 0.01, que obviamente es menor que nuestro valor alfa de 0.05.

Cuando nuestro valor P es menor que nuestro valor alfa, rechazamos la hipótesis nula. Permítanme decirlo nuevamente porque esto es extremadamente importante. Cuando nuestro valor P es menor que nuestro valor alfa, rechazamos la hipótesis nula. Y cuando nuestro valor P es mayor que nuestro valor alfa, no podemos rechazar la hipótesis nula.

Nuevamente, en este ejemplo, nuestro valor P terminó siendo menor a 0.05, lo que significa que rechazamos la hipótesis nula y declaramos que hay evidencia de que la hipótesis alternativa es verdadera al nivel de confianza observado (1% en nuestro ejemplo de cookie).

Ahora, si esta es la primera vez que ha estado expuesto a este tema, esto puede ser un poco confuso. La razón por la cual este concepto puede ser desafiante es por todos los dobles negativos.

Me refiero a quién no puede rechazar algo, ¿verdad? Bueno, permítanme compartir una pequeña rima que he usado personalmente durante al menos 20 años de mi vida profesional para ayudarme a recordar cómo tratar los valores P.

“Si P es bajo, Ho debe irse. Si P es alta, Ho es el tipo «.

En otras palabras, si nuestro valor P es bajo, lo que significa menos que nuestro valor alfa, rechazamos Ho, lo que significa que debe irse. Si P es alto, no podemos rechazar a Ho ya que Ho es el tipo con el que todos quieren pasar el rato, así que ¿por qué lo rechazaríamos alguna vez? Anímate y escribe esta pequeña rima, te prometo que la encontrarás útil más adelante.

Conclusión

Ahora, si las estadísticas no son lo tuyo, tu cabeza puede doler un poco ahora. No te estreses. Al final, lo más importante para recordar es que las pruebas de hipótesis ayudan a estudiar un subgrupo (muestra) de un grupo completo (población) para ver si algo es estadísticamente significativo.

Entonces, cuando lees sobre cosas como el estudio remdesivir más reciente, solo sabes que probaron a un pequeño grupo de personas (muestra) para comprender mejor cómo el medicamento puede impactar (o no impactar) en todo el mundo (población). Y cuando hacen la prueba, utilizarán cosas como los valores P para determinar si deben rechazar o no rechazar la hipótesis nula.