Artículos

5.1: Teorema del límite central para medias muestrales (promedios) - Matemáticas

5.1: Teorema del límite central para medias muestrales (promedios) - Matemáticas


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Suponga que (X ) es una variable aleatoria con una distribución que puede ser conocida o desconocida (puede ser cualquier distribución). Usando un subíndice que coincida con la variable aleatoria, suponga:

  1. ( mu_ {x} = ) la media de (X )
  2. ( sigma_ {x} = ) la desviación estándar de (X )

Si extrae muestras aleatorias de tamaño (n ), a medida que (n ) aumenta, la variable aleatoria ( bar {X} ), que consta de medias muestrales, tiende a distribuirse normalmente y

[ bar {X} sim N ( mu_ {x}), dfrac { sigma_ {x}} { sqrt {n}}. ]

El teorema del límite central para las medias muestrales dice que si sigue extrayendo muestras cada vez más grandes (como tirando uno, dos, cinco y finalmente diez dados) y calculando sus medias, las medias muestrales forman las suyas propias. distribución normal (la distribución muestral). La distribución normal tiene la misma media que la distribución original y una varianza que es igual a la varianza original dividida por el tamaño de la muestra. La variable (n ) es el número de valores que se promedian juntos, no el número de veces que se realiza el experimento.

Para decirlo de manera más formal, si extrae muestras aleatorias de tamaño (n ), la distribución de la variable aleatoria ( bar {X} ), que consta de medias muestrales, se llama distribución muestral de la media. La distribución muestral de la media se aproxima a una distribución normal a medida que (n ), el tamaño de la muestra, aumenta.

La variable aleatoria ( bar {X} ) tiene asociada una puntuación (z ) - diferente de la de la variable aleatoria (X ). La media ( bar {x} ) es el valor de ( bar {X} ) en una muestra.

[z = dfrac { bar {x} - mu_ {x}} { left ( dfrac { sigma_ {x}} { sqrt {n}} right)} ]

  • ( mu_ {x} ) es el promedio de (X ) y ( bar {X} ).
  • ( sigma bar {x} = dfrac { sigma_ {x}} { sqrt {n}} = ) desviación estándar de ( bar {X} ) y se denomina error estándar de la media .

Cómo: encontrar probabilidades de medias en la calculadora

2Dakota del Norte DISTR

2: normalcdf

( text {normalcdf} left ( text {valor inferior del área, valor superior del área, media}, dfrac { text {desviación estándar}} { sqrt { text {tamaño de muestra}}} derecho))

dónde:

  • significar es la media de la distribución original
  • Desviación Estándar es la desviación estándar de la distribución original
  • tamaño de la muestra (= n )

Ejemplo ( PageIndex {1} )

Una distribución desconocida tiene una media de 90 y una desviación estándar de 15. Las muestras de tamaño (n = 25 ) se extraen al azar de la población.

  1. Encuentre la probabilidad de que la media muestral esté entre 85 y 92.
  2. Encuentre el valor que esté dos desviaciones estándar por encima del valor esperado, 90, de la media de la muestra.

Respuesta

una.

Sea (X = ) un valor de la población desconocida original. La pregunta de probabilidad le pide que encuentre una probabilidad para el muestra promedio.

Sea ( bar {X} = ) la media de una muestra de tamaño 25. Dado que ( mu_ {x} = 90, sigma_ {x} = 15 ) y (n = 25 ),

[ bar {X} sim N (90, dfrac {15} { sqrt {25}}). sin número]

Encuentre (P (85

[P (85

La probabilidad de que la media muestral esté entre 85 y 92 es 0,6997.

Figura ( PageIndex {1} ).

normalcdf(valor inferior, valor superior, media, error estándar de la media)

La lista de parámetros está abreviada (valor inferior, valor superior, ( mu ), ( dfrac { sigma} { sqrt {n}} ))

normalcdf ((85,92,90, dfrac {15} { sqrt {25}}) = 0,6997 )

B.

Para encontrar el valor que está dos desviaciones estándar por encima del valor esperado 90, use la fórmula:

[ begin {align *} text {value} & = mu_ {x} + ( # text {ofTSDEVs}) left ( dfrac { sigma_ {x}} { sqrt {n}} derecha) [5pt] & = 90 + 2 left ( dfrac {15} { sqrt {25}} right) = 96 end {align *} ]

El valor que está dos desviaciones estándar por encima del valor esperado es 96.

El error estándar de la media es

[ dfrac { sigma_ {x}} { sqrt {n}} = dfrac {15} { sqrt {25}} = 3. nonumber ]

Recuerde que el error estándar de la media es una descripción de qué tan lejos (en promedio) estará la media de la muestra de la media de la población en muestras aleatorias simples repetidas de tamaño (n ).

Ejercicio ( PageIndex {1} )

Una distribución desconocida tiene una media de 45 y una desviación estándar de ocho. Las muestras de tamaño (n ) = 30 se extraen al azar de la población. Encuentre la probabilidad de que la media muestral esté entre 42 y 50.

Respuesta

(P (42 < bar {x} <50) = left (42, 50, 45, dfrac {8} { sqrt {30}} right) = 0.9797 )

Ejemplo ( PageIndex {2} )

El tiempo, en horas, que le toma a un grupo de "más de 40" personas jugar un partido de fútbol se distribuye normalmente con un media de dos horas y un desviación estándar de 0,5 horas. A muestra de tamaño (n = 50 ) se extrae al azar de la población. Encuentre la probabilidad de que el muestra promedio está entre 1,8 horas y 2,3 horas.

Respuesta

Sea (X = ) el tiempo, en horas, que se tarda en jugar un partido de fútbol.

La pregunta de probabilidad le pide que encuentre una probabilidad para el muestra el tiempo medio, en horas, se necesita para jugar un partido de fútbol.

Sea ( bar {X} = ) el tiempo medio, en horas, que se tarda en jugar un partido de fútbol.

Si ( mu_ {x} = ) _________, ( sigma_ {x} = ) __________, y (n = ) ___________, entonces (X sim N ) (______, ______) por teorema del límite central para las medias.

( mu_ {x} = 2, sigma_ {x} = 0.5, n = 50 ) y (X sim N left (2, dfrac {0.5} { sqrt {50}} right ) )

Encuentre (P (1.8 < bar {x} <2.3) ). Dibuja una gráfica.

(P (1.8 < bar {x} <2.3) = 0.9977 )

normalcdf ( left (1.8,2.3,2, dfrac {.5} { sqrt {50}} right) = 0.9977 )

La probabilidad de que el tiempo medio esté entre 1,8 horas y 2,3 horas es 0,9977.

Ejercicio ( PageIndex {2} )

El tiempo que tarda un grupo de estudiantes en el SAT se distribuye normalmente con una media de 2,5 horas y una desviación estándar de 0,25 horas. Un tamaño de muestra de (n = 60 ) se extrae al azar de la población. Encuentre la probabilidad de que la media muestral esté entre dos horas y tres horas.

Respuesta

[P (2 < bar {x} <3) = text {normalcdf} left (2, 3, 2.5, dfrac {0.25} { sqrt {60}} right) = 1 nonumber ]

Habilidades de calculadora

Para encontrar percentiles de medias en la calculadora, siga estos pasos.

  • 2Dakota del Norte DIStR
  • 3: invNorm

(k = text {invNorm} left ( text {área a la izquierda de} k, text {mean}, dfrac { text {desviación estándar}} { sqrt {tamaño de muestra}} right) )

dónde:

  • (k ) = el (k )th percentil
  • significar es la media de la distribución original
  • Desviación Estándar es la desviación estándar de la distribución original
  • tamaño de la muestra = (n )

Ejemplo ( PageIndex {3} )

En un estudio reciente publicado el 29 de octubre de 2012 en Flurry Blog, la edad media de los usuarios de tabletas es de 34 años. Suponga que la desviación estándar es de 15 años. Tome una muestra de tamaño (n = 100 ).

  1. ¿Cuáles son la media y la desviación estándar de las edades medias de la muestra de los usuarios de tabletas?
  2. ¿Qué aspecto tiene la distribución?
  3. Encuentre la probabilidad de que la edad media de la muestra sea superior a 30 años (la edad media informada de los usuarios de tabletas en este estudio en particular).
  4. Encuentra el 95th percentil para la edad media muestral (con un decimal).

Respuesta

  1. Dado que la media muestral tiende a apuntar a la media poblacional, tenemos ( mu_ {x} = mu = 34 ). La desviación estándar de la muestra viene dada por: [ sigma_ {x} = dfrac { sigma} { sqrt {n}} = dfrac {15} { sqrt {100}} = dfrac {15} {10 } = 1.5 nonumber ]
  2. El teorema del límite central establece que para tamaños de muestra grandes ( (n )), la distribución muestral será aproximadamente normal.
  3. La probabilidad de que la edad media de la muestra sea superior a 30 viene dada por: [P (Χ> 30) = text {normalcdf} (30, E99,34,1.5) = 0.9962 nonumber ]
  4. Sea (k ) = el 95th percentil. [k = text {invNorm} left (0,95, 34, dfrac {15} { sqrt {100}} right) = 36,5 nonumber ]

Ejercicio ( PageIndex {3} )

En un artículo de Flurry Blog, se identifica una brecha en el marketing de juegos para hombres de entre 30 y 40 años. Está investigando un juego de inicio dirigido a un grupo demográfico de 35 años. Su idea es desarrollar un juego de estrategia que puedan jugar hombres de entre 20 y 30 años. Según los datos del artículo, la investigación de la industria muestra que el jugador de estrategia promedio tiene 28 años con una desviación estándar de 4.8 años. Toma una muestra de 100 jugadores seleccionados al azar. Si su mercado objetivo es el de 29 a 35 años, ¿debería continuar con su estrategia de desarrollo?

Respuesta

Debe determinar la probabilidad de que los hombres cuya edad media esté entre 29 y 35 años quieran jugar un juego de estrategia.

[P (29 < bar {x} <35) = text {normalcdf} left (29, 35, 28, dfrac {4.8} { sqrt {100}} right) = 0.0186 ]

Puede concluir que hay aproximadamente un 1,9% de posibilidades de que jueguen hombres cuya edad media esté entre 29 y 35 años.

Ejemplo ( PageIndex {4} )

La media de minutos de interacción con la aplicación por parte de un usuario de tableta es de 8,2 minutos. Suponga que la desviación estándar es de un minuto. Tome una muestra de 60.

  1. ¿Cuáles son la media y la desviación estándar del número medio de la muestra de interacción con la aplicación por parte de un usuario de tableta?
  2. ¿Cuál es el error estándar de la media?
  3. Encuentra el 90th percentil para el tiempo medio de la muestra de interacción con la aplicación para un usuario de tableta. Interprete este valor en una oración completa.
  4. Encuentre la probabilidad de que la media muestral esté entre ocho minutos y 8.5 minutos.

Respuesta

  1. ( mu = mu = 8.2 sigma _ { bar {x}} = dfrac { sigma} { sqrt {n}} = dfrac {1} { sqrt {60}} = 0.13 )
  2. Esto nos permite calcular la probabilidad de medias muestrales de una distancia particular de la media, en muestras repetidas de tamaño 60.
  3. Sea (k ) = el 90th percentil
    (k = text {invNorm} left (0.90, 8.2, dfrac {1} { sqrt {60}} right) = 8.37 ). Este valor indica que el 90 por ciento del tiempo medio de interacción con la aplicación para los usuarios de la mesa es inferior a 8,37 minutos.
  4. (P (8 < bar {x} <8.5) = text {normalcdf} left (8, 8.5, 8.2, dfrac {1} { sqrt {60}} right) = 0.9293 )

Ejercicio ( PageIndex {4} )

Las latas de una bebida de cola afirman contener 16 onzas. Se miden las cantidades en una muestra y las estadísticas son (n = 34 ), ( bar {x} = 16.01 ) onzas. Si las latas están llenas de ( mu = 16.00 ) onzas (como se indica en la etiqueta) y ( sigma = 0.143 ) onzas, calcule la probabilidad de que una muestra de 34 latas tenga una cantidad promedio superior a 16.01 onzas. ¿Los resultados sugieren que las latas se llenan con una cantidad superior a 16 onzas?

Respuesta

Tenemos (P ( bar {x}> 16.01) = text {normalcdf} left (16.01, E99,16, dfrac {0.143} { sqrt {34}} right) = 0.3417 ). Dado que existe una probabilidad del 34,17% de que el peso medio de la muestra sea superior a 16,01 onzas, debemos ser escépticos sobre el volumen declarado de la empresa. Si soy un consumidor, debería alegrarme de que probablemente esté recibiendo cola gratis. Si soy el fabricante, necesito determinar si mis procesos de embotellado están fuera de los límites aceptables.

Resumen

En una población cuya distribución puede ser conocida o desconocida, si el tamaño ( (n )) de las muestras es suficientemente grande, la distribución de las medias muestrales será aproximadamente normal. La media de las medias de la muestra será igual a la media de la población. La desviación estándar de la distribución de las medias muestrales, denominada error estándar de la media, es igual a la desviación estándar de la población dividida por la raíz cuadrada del tamaño de la muestra ( (n )).

Revisión de fórmulas

  • El teorema del límite central para medias muestrales: [ bar {X} sim N left ( mu_ {x}, dfrac { sigma_ {x}} { sqrt {n}} right) nonumber ]
  • La media ( bar {X}: sigma_ {x} )
  • Teorema del límite central para medias muestrales puntuación z y error estándar de la media: [z = dfrac { bar {x} - mu_ {x}} { left ( dfrac { sigma_ {x}} { sqrt {n}} right)} nonumber ]
  • Error estándar de la media (desviación estándar ( ( bar {X} ))): [ dfrac { sigma_ {x}} { sqrt {n}} nonumber ]

Glosario

Promedio
un número que describe la tendencia central de los datos; hay una serie de promedios especializados, que incluyen la media aritmética, la media ponderada, la mediana, la moda y la media geométrica.
Teorema del límite central
Dada una variable aleatoria (RV) con media conocida ( mu ) y desviación estándar conocida, ( sigma ), estamos muestreando con tamaño (n ), y estamos interesados ​​en dos RV nuevas: la muestra media, ( bar {X} ), y la suma de la muestra, ( sum X ). Si el tamaño ( (n )) de la muestra es suficientemente grande, entonces ( bar {X} sim N left ( mu, dfrac { sigma} { sqrt {n}} right) ) y ( sum X sim N (n mu, ( sqrt {n}) ( sigma)) ). Si el tamaño ( (n )) de la muestra es suficientemente grande, entonces la distribución de las medias muestrales y la distribución de las sumas muestrales se aproximarán a distribuciones normales independientemente de la forma de la población. La media de las medias de la muestra será igual a la media de la población y la media de las sumas de la muestra será igual a (n ) veces la media de la población. La desviación estándar de la distribución de las medias muestrales, ( dfrac { sigma} { sqrt {n}} ), se denomina error estándar de la media.
Distribución normal
una variable aleatoria continua (RV) con pdf (f (x) = dfrac {1} { sigma sqrt {2 pi}} e ^ { dfrac {- (x- mu) ^ {2}} {2 sigma ^ {2}}} ), donde ( mu ) es la media de la distribución y ( sigma ) es la desviación estándar; notación: (X sim N ( mu, sigma) ). Si ( mu = 0 ) y ( sigma = 1 ), el RV se llama estándar distribución normal.
Error estandar de la media
la desviación estándar de la distribución de las medias muestrales, o ( dfrac { sigma} { sqrt {n}} ).


Ver el vídeo: γ Λυκείου μαθηματικά κατεύθυνσης κανόνες παραγώγισης μέρος 7ό (Mayo 2022).