La tabla de distribución normal

Abadía de Senanque en Provenza con campos de lavanda

¿Cuál es la distribución normal?

La fórmula de distribución normal se basa en dos parámetros simples, la media y la desviación estándar, que cuantifican las características de un conjunto de datos dado. mientras que la media indica el valor “central” o promedio de todo el conjunto de datos, la desviación estándar indica la “dispersión” o variación de los puntos de datos alrededor de ese valor medio.

ejemplo

considere los siguientes 2 conjuntos de datos:

  1. conjunto de datos 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
  2. conjunto de datos 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

para el conjunto de datos 1, media = 10 y desviación estándar (stddev) = 0

para el conjunto de datos 2, media = 10 y desviación estándar (stddev) = 2,83

tracemos estos valores para el conjunto de datos1:

de manera similar para dataset2:

la línea horizontal roja en los dos gráficos anteriores indica la “media” o el valor promedio de cada conjunto de datos (10 en ambos casos). Las flechas rosadas en el segundo gráfico indican la extensión o variación de los valores de datos del valor medio. esto está representado por un valor de desviación estándar de 2.83 en el caso del conjunto de datos2. dado que el conjunto de datos1 tiene todos los valores iguales (como 10 cada uno) y no hay variaciones, el valor stddev es cero y, por lo tanto, no se aplican flechas rosadas.

El valor stddev tiene algunas características significativas y útiles que son extremadamente útiles en el análisis de datos. para una distribución normal, los valores de los datos se distribuyen simétricamente a ambos lados de la media. para cualquier conjunto de datos distribuido normalmente, graficando el gráfico con stddev en el eje horizontal y no. de valores de datos en eje vertical, se obtiene el siguiente gráfico.

propiedades de una distribución normal

  1. la curva normal es simétrica respecto a la media;
  2. la media está en el medio y divide el área en dos mitades;
  3. el área total debajo de la curva es igual a 1 para media = 0 y stdev = 1;
  4. la distribución se describe completamente por su media y stddev

Como se puede ver en el gráfico anterior, stddev representa lo siguiente:

  • El 68.3%  de los valores de datos están dentro de 1 desviación estándar de la media (-1 a +1)
  • El 95.4%  de los valores de datos están dentro de  2 desviaciones estándar  de la media (-2 a +2)
  • El 99.7%  de los valores de datos están dentro de  3 desviaciones estándar  de la media (-3 a +3)

El área bajo la curva en forma de campana, cuando se mide, indica la probabilidad deseada de un rango dado:

  • menor que x: por ejemplo, la probabilidad de que los valores de los datos sean menores de 70
  • mayor que x – por ejemplo, probabilidad de que los valores de los datos sean mayores que 95
  • entre x 1 y x , por ejemplo, probabilidad de valores de datos entre 65 y 85

donde x es un valor de interés (ejemplos a continuación).

Trazar y calcular el área no siempre es conveniente, ya que los diferentes conjuntos de datos tendrán valores medios y estándar diferentes. Para facilitar un método estándar uniforme para cálculos fáciles y aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a valores z, que forman parte de la tabla de distribución normal .

z = (x – media) / stddev, donde x es la variable aleatoria.

Básicamente, esta conversión obliga a la media y stddev a estandarizarse a 0 y 1 respectivamente, lo que permite utilizar un conjunto estándar definido de valores z (de la tabla de distribución normal ) para cálculos fáciles. Una instantánea de la tabla de valores z estándar que contiene valores de probabilidad es la siguiente:

z

0.00

0,01

0,02

0,03

0,04

0,05

0,06

0.0

0.00000

0.00399

0.00798

0,01197

0,01595

0,01994

0.1

0,0398

0,04380

0,04776

0,05172

0,05567

0,05966

0.2 0.2

0,0793

0,08317

0,08706

0,09095

0,09483

0,09871

0,3

0.11791

0.12172

0,12552

0,12930

0.13307

0.13683

0.4 0.4

0.15542

0.15910

0.16276

0.16640

0.17003

0.17364

0.5 0.5

0.19146

0.19497

0.19847

0.20194

0.20540

0.20884

0.6

0.22575

0.22907

0.23237

0.23565

0.23891

0.24215

0.7

0.25804

0.26115

0.26424

0.26730

0.27035

0.27337

para encontrar la probabilidad relacionada con el valor z de 0.239865, primero redondee a 2 decimales (es decir, 0.24). luego verifique los primeros 2 dígitos significativos (0.2) en las filas y el dígito menos significativo (0.04 restante) en la columna. eso conducirá a un valor de 0.09483.

Aquí se puede encontrar la tabla de distribución normal completa, con precisión de hasta 5 puntos decimales para valores de probabilidad (incluidos los valores negativos).

Veamos algunos ejemplos de la vida real. La altura de los individuos en un grupo grande sigue un patrón de distribución normal. Supongamos que tenemos un conjunto de 100 individuos cuyas alturas se registran y la media y el estándar se calculan en 66 y 6 pulgadas respectivamente.

Aquí hay algunas preguntas de muestra que se pueden responder fácilmente usando la tabla de valores z:

  • ¿Cuál es la probabilidad de que una persona del grupo mida 70 pulgadas o menos?

la pregunta es encontrar el valor acumulativo de p (x <= 70), es decir, en todo el conjunto de datos de 100, cuántos valores estarán entre 0 y 70.

primero convierta el valor x de 70 al valor z equivalente.

z = (x – media) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0.67 (redondeado a 2 decimales)

ahora necesitamos encontrar p (z <= 0.67) = 0. 24857 (de la tabla z de arriba)

es decir, hay una probabilidad del 24.857% de que un individuo en el grupo sea menor o igual a 70 pulgadas.

pero espera, lo anterior está incompleto. recuerde, estamos buscando la probabilidad de todas las alturas posibles hasta 70, es decir, de 0 a 70. lo anterior solo le da la porción del valor medio al deseado (es decir, 66 a 70). necesitamos incluir la otra mitad, de 0 a 66, para llegar a la respuesta correcta.

como 0 a 66 representa la media porción (es decir, una media extrema a media), su probabilidad es simplemente 0.5.

de ahí la probabilidad correcta de que una persona mida 70 pulgadas o menos = 0.24857 + 0.5 = 0. 74857 = 74.857%

gráficamente (calculando el área), estas son las dos regiones sumadas que representan la solución:

  • ¿Cuál es la probabilidad de que una persona mida 75 pulgadas o más?

es decir, encontrar p acumulativo complementario  (x> = 75).

z = (x – media) / stddev = (75-66) / 6 = 9/6 = 1.5

p (z> = 1.5) = 1- p (z <= 1.5) = 1 – (0.5 + 0.43319) = 0.06681 = 6.681%

  • ¿Cuál es la probabilidad de que una persona tenga entre 52 y 67 pulgadas?

encontrar p (52 <= x <= 67).

p (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2.33 <= z <= 0.17)

= p (z <= 0.17) –p (z <= -0.233) = (0.5 + 0.56749) – (.40905) =

Esta tabla de distribución normal (y valores z) se utiliza comúnmente para cualquier cálculo de probabilidad de movimientos de precios esperados en el mercado de valores para acciones e índices. se usan en el comercio basado en el rango, identificando tendencias alcistas o bajistas, niveles de soporte o resistencia y otros indicadores técnicos basados ​​en conceptos de distribución normal de desviación media y estándar.