- ¿Qué es la prueba de hipótesis?
- Paso 1: define la hipótesis
- Paso 2: establece los criterios
- Paso 3: calcula la estadística
- Paso 4: llegar a una conclusión
- tipos de errores
- Ejemplo 1
- ejemplo 2
- la línea de fondo
su asesor de inversiones le propone un plan de inversión de ingresos mensual que promete un rendimiento variable cada mes. invertirá en él solo si tiene asegurado un ingreso mensual promedio de $ 180. su asesor también le dice que durante los últimos 300 meses, el esquema tuvo retornos de inversión con un valor promedio de $ 190 y una desviación estándar de $ 75. deberías invertir en este esquema? Las pruebas de hipótesis ayudan a tal toma de decisiones.
Este artículo asume que los lectores están familiarizados con los conceptos de una tabla de distribución normal, fórmula, valor p y conceptos básicos de estadística relacionados.
¿Qué es la prueba de hipótesis?
La prueba de hipótesis o significación es un modelo matemático para probar un reclamo, idea o hipótesis sobre un parámetro de interés en un conjunto de población dado, utilizando datos medidos en un conjunto de muestra. Los cálculos se realizan en muestras seleccionadas para recopilar información más decisiva sobre las características de toda la población, lo que permite una forma sistemática de probar afirmaciones o ideas sobre todo el conjunto de datos.
Aquí hay un ejemplo simple: la directora de una escuela informa que los estudiantes en su escuela obtienen un promedio de 7 de 10 en los exámenes. Para probar esta “hipótesis”, registramos marcas de, digamos, 30 estudiantes (muestra) de toda la población estudiantil de la escuela (digamos 300) y calculamos la media de esa muestra. entonces podemos comparar la media de la muestra (calculada) con la media de la población (informada) e intentar confirmar la hipótesis.
Por poner otro ejemplo, el rendimiento anual de un fondo mutuo particular es del 8%. Supongamos que el fondo mutuo existe desde hace 20 años. tomamos una muestra aleatoria de los rendimientos anuales del fondo mutuo por, digamos, cinco años (muestra) y calculamos su media. luego comparamos la media de la muestra (calculada) con la media de la población (reclamada) para verificar la hipótesis.
Los criterios de toma de decisiones deben basarse en ciertos parámetros de los conjuntos de datos.
Existen diferentes metodologías para la prueba de hipótesis, pero los mismos cuatro pasos básicos están involucrados:
Paso 1: define la hipótesis
por lo general, el valor informado (o las estadísticas de reclamo) se establece como la hipótesis y se presume que es verdadero. Para los ejemplos anteriores, la hipótesis será:
- ejemplo a: los estudiantes en la escuela obtienen un promedio de 7 de 10 en los exámenes.
- ejemplo b: el rendimiento anual del fondo mutuo es del 8% anual.
esta descripción declarada constituye la ” hipótesis nula (h 0 ) ” y se supone que es cierta: la forma en que un acusado en un juicio con jurado se presume inocente hasta que la evidencia presentada en el tribunal demuestre su culpabilidad. de manera similar, la prueba de hipótesis comienza declarando y asumiendo una “hipótesis nula”, y luego el proceso determina si es probable que la suposición sea verdadera o falsa.
El punto importante a tener en cuenta es que estamos probando la hipótesis nula porque hay un elemento de duda sobre su validez. cualquier información que esté en contra de la hipótesis nula establecida se captura en la hipótesis alternativa (h 1 ). Para los ejemplos anteriores, la hipótesis alternativa será:
- los estudiantes obtienen un promedio que no es igual a 7.
- El rendimiento anual del fondo mutuo no es igual al 8% anual.
en otras palabras, la hipótesis alternativa es una contradicción directa de la hipótesis nula.
Como en un juicio, el jurado asume la inocencia del acusado (hipótesis nula). el fiscal tiene que demostrar lo contrario (hipótesis alternativa). Del mismo modo, el investigador tiene que demostrar que la hipótesis nula es verdadera o falsa. Si el fiscal no prueba la hipótesis alternativa, el jurado debe dejar ir al acusado (basando la decisión en la hipótesis nula). Del mismo modo, si el investigador no puede probar una hipótesis alternativa (o simplemente no hace nada), se supone que la hipótesis nula es verdadera.
Paso 2: establece los criterios
Los criterios de toma de decisiones deben basarse en ciertos parámetros de los conjuntos de datos y aquí es donde entra en juego la conexión a la distribución normal.
según el postulado estándar de estadísticas sobre la distribución de muestreo, “para cualquier tamaño de muestra n, la distribución de muestreo de x̅ es normal si la población x de la cual se extrae la muestra está normalmente distribuida”. por lo tanto, las probabilidades de todas las demás muestras posibles significan que uno podría seleccionar están normalmente distribuidas.
por ejemplo, determinar si el rendimiento diario promedio, de cualquier acción que cotiza en el mercado bursátil xyz, alrededor del día de año nuevo es mayor al 2%.
h 0 : hipótesis nula: media = 2%
h 1 : hipótesis alternativa: media> 2% (esto es lo que queremos demostrar)
tome la muestra (digamos de 50 acciones de un total de 500) y calcule la media de la muestra.
Para una distribución normal, el 95% de los valores se encuentran dentro de dos desviaciones estándar de la media de la población. por lo tanto, esta distribución normal y el supuesto de límite central para el conjunto de datos de muestra nos permite establecer el 5% como nivel de significancia. tiene sentido ya que, bajo este supuesto, hay menos de un 5% de probabilidad (100-95) de obtener valores atípicos que están más allá de dos desviaciones estándar de la media de la población. Dependiendo de la naturaleza de los conjuntos de datos, se pueden tomar otros niveles de significancia al 1%, 5% o 10%. Para los cálculos financieros (incluidas las finanzas conductuales), el límite generalmente aceptado es el 5%. Si encontramos cálculos que van más allá de las dos desviaciones estándar habituales, entonces tenemos un caso fuerte de valores atípicos para rechazar la hipótesis nula.
gráficamente, se representa de la siguiente manera:
en el ejemplo anterior, si la media de la muestra es mucho mayor que 2% (digamos 3.5%), entonces rechazamos la hipótesis nula. Se acepta la hipótesis alternativa (media> 2%), que confirma que el rendimiento diario promedio de las existencias es superior al 2%.
sin embargo, si no es probable que la media de la muestra sea significativamente mayor al 2% (y se mantiene en, digamos, alrededor del 2.2%), no podemos rechazar la hipótesis nula. El desafío está en cómo decidir sobre casos tan cercanos. Para llegar a una conclusión a partir de muestras y resultados seleccionados, se debe determinar un nivel de significación que permita llegar a una conclusión sobre la hipótesis nula. La hipótesis alternativa permite establecer el nivel de significación o el concepto de “valor crítico” para decidir sobre estos casos de corto alcance.
Según la definición estándar del libro de texto, “un valor crítico es un valor de corte que define los límites más allá de los cuales se puede obtener menos del 5% de las medias de muestra si la hipótesis nula es verdadera. las medias de muestra obtenidas más allá de un valor crítico darán como resultado la decisión de rechazar la hipótesis nula “. En el ejemplo anterior, si hemos definido el valor crítico como 2.1% y la media calculada llega a 2.2%, entonces rechazamos la hipótesis nula Un valor crítico establece una clara demarcación sobre la aceptación o el rechazo.
Paso 3: calcula la estadística
Este paso implica calcular la (s) figura (s) requerida (s), conocidas como estadísticas de prueba (como media, puntaje z, valor p, etc.), para la muestra seleccionada. (llegaremos a esto en una sección posterior).
Paso 4: llegar a una conclusión
con los valores calculados, decida sobre la hipótesis nula. Si la probabilidad de obtener una media muestral es inferior al 5%, la conclusión es rechazar la hipótesis nula. de lo contrario, acepte y conserve la hipótesis nula.
tipos de errores
puede haber cuatro resultados posibles en la toma de decisiones basada en muestras, con respecto a la aplicabilidad correcta a toda la población:
decisión de retener | decisión de rechazar | |
se aplica a toda la población | correcto | incorrecto (error tipo 1 – a) |
no se aplica a toda la población | incorrecto (error tipo 2 – b) | correcto |
los casos “correctos” son aquellos en los que las decisiones tomadas sobre las muestras son realmente aplicables a toda la población. los casos de errores surgen cuando uno decide retener (o rechazar) la hipótesis nula basada en los cálculos de la muestra, pero esa decisión realmente no se aplica a toda la población. Estos casos constituyen errores tipo 1 (alfa) y tipo 2 (beta), como se indica en la tabla anterior.
seleccionar el valor crítico correcto permite eliminar los errores alfa de tipo 1 o limitarlos a un rango aceptable.
alfa denota el error en el nivel de significación y lo determina el investigador. Para mantener el nivel estándar de 5% de significancia o confianza para los cálculos de probabilidad, esto se mantiene en 5%.
de acuerdo con los parámetros y definiciones de toma de decisiones aplicables:
- “Este criterio (alfa) generalmente se establece en 0.05 (a = 0.05), y comparamos el nivel alfa con el valor p. cuando la probabilidad de un error de tipo i es inferior al 5% (p <0.05), decidimos rechazar la hipótesis nula; de lo contrario, conservamos la hipótesis nula “.
- El término técnico utilizado para esta probabilidad es el valor p . se define como “la probabilidad de obtener un resultado muestral, dado que el valor establecido en la hipótesis nula es verdadero. el valor p para obtener un resultado muestral se compara con el nivel de significación “.
- un error tipo ii, o error beta, se define como “la probabilidad de retener incorrectamente la hipótesis nula, cuando de hecho no es aplicable a toda la población”.
Algunos ejemplos más demostrarán este y otros cálculos.
Ejemplo 1
existe un esquema de inversión de ingresos mensuales que promete rendimientos mensuales variables. un inversor invertirá solo si tiene asegurado un ingreso mensual promedio de $ 180. Él tiene una muestra de 300 meses de rentabilidad que tiene una media de $ 190 y una desviación estándar de $ 75. ¿Debería él o ella invertir en este esquema?
Arreglemos el problema. el inversor invertirá en el esquema si tiene asegurado el rendimiento promedio deseado de $ 180.
h 0 : hipótesis nula: media = 180
h 1 : hipótesis alternativa: media> 180
Método 1: enfoque de valor crítico
Identifique un valor crítico x l para la media de la muestra, que es lo suficientemente grande como para rechazar la hipótesis nula, es decir, rechazar la hipótesis nula si la media de la muestra> = valor crítico x l
p (identifique un error alfa de tipo i) = p (rechace h 0 dado que h 0 es verdadero),
esto se lograría cuando la media de la muestra exceda los límites críticos.
= p (dado que h 0 es verdadero) = alfa
gráficamente, aparece de la siguiente manera:
tomando alfa = 0.05 (es decir, nivel de significancia del 5%), z 0.05 = 1.645 (de la tabla z o la tabla de distribución normal)
=> x l = 180 + 1.645 * (75 / sqrt (300)) = 187.12
Dado que la media muestral (190) es mayor que el valor crítico (187.12), se rechaza la hipótesis nula y la conclusión es que el rendimiento mensual promedio es de hecho mayor que $ 180, por lo que el inversor puede considerar invertir en este esquema.
método 2: uso de estadísticas de prueba estandarizadas
también se puede usar el valor estandarizado z.
estadística de prueba, z = (media muestral – media poblacional) / (std-dev / sqrt (no. de muestras).
entonces, la región de rechazo se convierte en lo siguiente:
z = (190-180) / (75 / sqrt (300)) = 2.309
nuestra región de rechazo al nivel de significancia del 5% es z> z 0.05 = 1.645.
dado que z = 2.309 es mayor que 1.645, la hipótesis nula puede rechazarse con una conclusión similar mencionada anteriormente.
método 3: cálculo del valor p
nuestro objetivo es identificar p (media muestral> = 190, cuando media = 180).
= p (z> = (190-180) / (75 / sqrt (300))
= p (z> = 2.309) = 0.0084 = 0.84%
La siguiente tabla para inferir los cálculos del valor p concluye que hay evidencia confirmada de que los retornos mensuales promedio son superiores a 180:
valor p | inferencia |
menos que 1% | evidencia confirmada que respalda hipótesis alternativas |
entre 1% y 5% | fuerte evidencia que respalda hipótesis alternativas |
entre 5% y 10% | evidencia débil que respalda hipótesis alternativas |
mayor al 10% | sin evidencia que respalde hipótesis alternativas |
ejemplo 2
un nuevo corredor de bolsa (xyz) afirma que sus tarifas de corretaje son más bajas que las de su corredor de bolsa actual (abc). los datos disponibles de una firma de investigación independiente indican que la media y el estándar de desarrollo de todos los clientes de abc broker son de $ 18 y $ 6, respectivamente.
se toma una muestra de 100 clientes de abc y se calculan los cargos de corretaje con las nuevas tarifas de xyz broker. si la media de la muestra es $ 18.75 y std-dev es la misma ($ 6), ¿se puede hacer alguna inferencia acerca de la diferencia en la factura promedio de corretaje entre abc y xyz broker?
h 0 : hipótesis nula: media = 18
h 1 : hipótesis alternativa: media <> 18 (esto es lo que queremos probar).
región de rechazo: z <= – z 2.5 y z> = z 2.5 (suponiendo un nivel de significancia del 5%, dividir 2.5 cada uno a cada lado).
z = (muestra media – media) / (std-dev / sqrt (no. de muestras))
= (18.75 – 18) / (6 / (sqrt (100)) = 1.25
este valor z calculado se encuentra entre los dos límites definidos por:
– z 2.5 = -1.96 y z 2.5 = 1.96.
Esto concluye que no hay pruebas suficientes para inferir que hay alguna diferencia entre las tasas de su corredor actual y el nuevo corredor.
alternativamente, el valor p = p (z <-1.25) + p (z> 1.25)
= 2 * 0.1056 = 0.2112 = 21.12% que es mayor que 0.05 o 5%, lo que lleva a la misma conclusión.
gráficamente, está representado por lo siguiente:
puntos de crítica para el método de prueba hipotético:
- Un método estadístico basado en suposiciones
- propenso a errores como se detalla en términos de errores alfa y beta
- La interpretación del valor p puede ser ambigua y conducir a resultados confusos
la línea de fondo
La prueba de hipótesis permite que un modelo matemático valide un reclamo o idea con un cierto nivel de confianza. sin embargo, como la mayoría de las herramientas y modelos estadísticos, está sujeto a algunas limitaciones. El uso de este modelo para tomar decisiones financieras debe considerarse con un ojo crítico, teniendo en cuenta todas las dependencias. También vale la pena explorar métodos alternativos como la inferencia bayesiana para un análisis similar.