Artículos

1.6.5.4: Normalidad

1.6.5.4: Normalidad


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

¿Cómo decidir qué prueba usar, paramétrica o no paramétrica, prueba t o Wilcoxon? Necesitamos saber si la distribución sigue o al menos se acerca a la normalidad. Esto se puede verificar visualmente (Figura ( PageIndex {1} )):

Código ( PageIndex {1} ) (R):

¿Cómo funciona QQ plot? Primero, los puntos de datos se ordenan y cada uno se asigna a un cuantil. En segundo lugar, un conjunto de cuantiles teóricos: posiciones que los puntos de datos deberían haber ocupado en un distribución normal-es calculado. Finalmente, los cuantiles teóricos y empíricos se emparejan y grafican.

Hemos superpuesto la trama con una línea que pasa por los cuartiles. Cuando los puntos siguen la línea de cerca, la distribución empírica es normal. Aquí hay muchos puntos en las colas. Nuevamente, llegamos a la conclusión de que la distribución original no es normal.

R también ofrece instrumentos numéricos que verifican la normalidad. La primera de ellas es la prueba de Shapiro-Wilk (por favor correr este código usted mismo):

Código ( PageIndex {2} ) (R):

Aquí la salida es bastante concisa. Los valores p son pequeños, pero ¿cuál fue la hipótesis nula? Incluso la ayuda incorporada no lo indica. Para entender, podemos ejecutar un experimento simple:

Código ( PageIndex {3} ) (R):

El comando rnorm () genera números aleatorios que siguen una distribución normal, tantos como se indica en el argumento. Aquí hemos obtenido un valor p cercano a la unidad. Claramente, la hipótesis nula fue "la distribución empírica es normal".

Figura ( PageIndex {1} ) Comprobación gráfica de la normalidad.

Armados con este pequeño experimento, podemos concluir que las distribuciones tanto de salario como de salario2 no son normales.

La prueba de Kolmogorov-Smirnov funciona con dos distribuciones. La hipótesis nula es que ambas muestras proceden de la misma población. Si queremos probar una distribución contra la normal, el segundo argumento debería ser pnorm:

Código ( PageIndex {4} ) (R):

(El resultado es comparable con el resultado de la prueba de Shapiro-Wilk. Escalamos los datos porque, de manera predeterminada, el segundo argumento usa una distribución normal escalada).

La función ks.test () acepta cualquier tipo del segundo argumento y, por lo tanto, podría usarse para verificar qué tan confiable es para aproximar la distribución actual con ninguna distribución teórica, no necesariamente normal. Sin embargo, la prueba de Kolmogorov-Smirnov a menudo arroja una respuesta incorrecta para muestras cuyo tamaño es (<50 ), por lo que es menos potente que la prueba de Shapiro-Wilks.

2.2e-16 nosotros los llamados notación exponencial, la forma de mostrar números realmente pequeños como este ( (2.2 times 10 ^ {- 16} )). Si esta notación no le resulta cómoda, hay una forma de deshacerse de ella:

Código ( PageIndex {5} ) (R):

(La opción scipen es igual al número máximo permitido de ceros).

La mayoría de las veces estas tres formas de determinar la normalidad están de acuerdo, pero esto no es una sorpresa si arrojan resultados diferentes. El control de normalidad no es una sentencia de muerte, es solo una opinión basada en la probabilidad.

Nuevamente, si el tamaño de la muestra es pequeño, las pruebas estadísticas e incluso las gráficas de cuantiles-cuantiles con frecuencia no detectan la no normalidad. En estos casos, las herramientas más simples como el diagrama de tallo o el histograma proporcionarían una mejor ayuda.


Ver el vídeo: How To Calculate Normality u0026 Equivalent Weight For Acid Base Reactions In Chemistry (Julio 2022).


Comentarios:

  1. Lele

    Te pido disculpas, pero, en mi opinión, no tienes razón. Escríbeme por PM, nos comunicamos.

  2. Gilberto

    Esta es la frase divertida

  3. Goshura

    Qué oración tan conmovedora :)



Escribe un mensaje