Artículos

9.2: Presentación gráfica de datos cuantitativos - Matemáticas

9.2: Presentación gráfica de datos cuantitativos - Matemáticas


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Los datos cuantitativos o numéricos también se pueden resumir en tablas de frecuencia.

Ejemplo 9

Un maestro registra los puntajes en una prueba de 20 puntos para los 30 estudiantes de su clase. Las puntuaciones son:

19 20 18 18 17 18 19 17 20 18 20 16 20 15 17 12 18 19 18 19 17 20 18 16 15 18 20 5 0 0

Estos puntajes se pueden resumir en una tabla de frecuencias agrupando valores similares:

PuntajeFrecuencia
02
51
121
152
162
174
188
194
206

Con esta tabla, sería posible crear un gráfico de barras estándar a partir de este resumen, como hicimos para los datos categóricos:

Sin embargo, dado que las puntuaciones son valores numéricos, este gráfico no tiene sentido; la primera y la segunda barras están separadas por cinco valores, mientras que las últimas barras están separadas por un solo valor. Sería más correcto tratar el eje horizontal como una recta numérica. Este tipo de gráfico se llama histograma.

Histograma

Un histograma es como un gráfico de barras, pero donde el eje horizontal es una recta numérica

Ejemplo 10

Para los valores anteriores, un histograma se vería así:

Observe que en el histograma, una barra representa valores en el eje horizontal desde el del lado izquierdo de la barra hasta, pero sin incluir, el valor del lado derecho de la barra. Algunas personas optan por que las barras comiencen con valores ½ para evitar esta ambigüedad.

Desafortunadamente, no muchos paquetes de software comunes pueden graficar correctamente un histograma. Lo mejor que puede hacer en Excel o Word es un gráfico de barras sin espacios entre las barras y espaciado agregado para simular un eje horizontal numérico.

Si tenemos una gran cantidad de valores de datos que varían ampliamente, la creación de una tabla de frecuencia que enumere todos los valores posibles como una categoría conduciría a una tabla de frecuencia excepcionalmente larga y probablemente no revelaría ningún patrón. Por esta razón, es común con los datos cuantitativos agrupar los datos en intervalos de clase.

Intervalos de clase

Los intervalos de clase son agrupaciones de datos. En general, definimos los intervalos de clase para que:

  • Cada intervalo tiene el mismo tamaño. Por ejemplo, si la primera clase contiene valores de 120-129, la segunda clase debe incluir valores de 130-139.
  • Tenemos entre 5 y 20 clases, por lo general, dependiendo de la cantidad de datos con los que estemos trabajando.

Ejemplo 11

Supongamos que hemos recopilado los pesos de 100 sujetos masculinos como parte de un estudio de nutrición. Para nuestros datos de peso, tenemos valores que van desde un mínimo de 121 libras hasta un máximo de 263 libras, lo que da un intervalo total de 263-121 = 142. Podríamos crear 7 intervalos con un ancho de alrededor de 20, 14 intervalos con un ancho de alrededor de 10, o en algún punto intermedio. A menudo tenemos que experimentar con algunas posibilidades para encontrar algo que represente bien los datos. Intentemos usar un intervalo de ancho de 15. Podríamos comenzar en 121, o en 120, ya que es un buen número redondo.

IntervaloFrecuencia
120 – 1344
135 – 14914
150 – 16416
165 – 17928
180 – 19412
195 – 2098
210 – 2247
225 – 2396
240 – 2542
255 – 2693

Un histograma de estos datos se vería así:

En muchos paquetes de software, puede crear un gráfico similar a un histograma colocando los intervalos de clase como etiquetas en un gráfico de barras.

Otros tipos de gráficos, como gráficos circulares, son posibles para datos cuantitativos. La utilidad de los diferentes tipos de gráficos variará según el número de intervalos y el tipo de datos que se representen. Por ejemplo, un gráfico circular de nuestros datos de peso es difícil de leer debido a la cantidad de intervalos que usamos.

Pruébelo ahora 3

El costo total de los libros de texto para el trimestre se recopiló de 36 estudiantes. Cree un histograma para estos datos.

$140 $160 $160 $165 $180 $220 $235 $240 $250 $260 $280 $285

$285 $285 $290 $300 $300 $305 $310 $310 $315 $315 $320 $320

$330 $340 $345 $350 $355 $360 $360 $380 $395 $420 $460 $460

Al recopilar datos para comparar dos grupos, es conveniente crear un gráfico que compare cantidades.

Ejemplo 12

Los datos a continuación provienen de una tarea en la que el objetivo es mover un mouse de computadora a un objetivo en la pantalla lo más rápido posible. En 20 de las pruebas, el objetivo era un pequeño rectángulo; en los otros 20, el objetivo era un gran rectángulo. El tiempo para alcanzar el objetivo se registró en cada prueba.

Intervalo (milisegundos)

Frecuencia

pequeño objetivo

Frecuencia

gran objetivo

300-39900
400-49915
500-599310
600-69965
700-79950
800-89940
900-99900
1000-109910
1100-119900

Una opción para representar estos datos sería un histograma comparativo o un gráfico de barras, en el que las barras para el grupo objetivo pequeño y el grupo objetivo grande se colocan una al lado de la otra.

Polígono de frecuencia

Una representación alternativa es una Polígono de frecuencia. Un polígono de frecuencia comienza como un histograma, pero en lugar de dibujar una barra, se coloca un punto en el punto medio de cada intervalo a una altura igual a la frecuencia. Normalmente, los puntos están conectados con líneas rectas para enfatizar la distribución de los datos.

Ejemplo 13

Este gráfico hace que sea más fácil ver que los tiempos de reacción fueron generalmente más cortos para el objetivo más grande y que los tiempos de reacción para el objetivo más pequeño estaban más dispersos.


1.2 Datos, muestreo y variación de datos y muestreo

Los datos cualitativos son el resultado de categorizar o describir los atributos de una población. Los datos cualitativos también se denominan a menudo datos categóricos. El color del cabello, el tipo de sangre, el grupo étnico, el automóvil que conduce una persona y la calle en la que vive son ejemplos de datos cualitativos. Los datos cualitativos se describen generalmente con palabras o letras. Por ejemplo, el color del cabello puede ser negro, castaño oscuro, castaño claro, rubio, gris o rojo. El tipo de sangre puede ser AB +, O– o B +. Los investigadores a menudo prefieren utilizar datos cuantitativos sobre datos cualitativos porque se prestan más fácilmente al análisis matemático. Por ejemplo, no tiene sentido encontrar un color de cabello o tipo de sangre promedio.

Los datos cuantitativos son siempre números. Los datos cuantitativos son el resultado de contando o medición atributos de una población. La cantidad de dinero, la frecuencia cardíaca, el peso, la cantidad de personas que viven en su ciudad y la cantidad de estudiantes que toman estadísticas son ejemplos de datos cuantitativos. Los datos cuantitativos pueden ser discretos o continuos.

Todos los datos que son el resultado del recuento se denominan datos discretos cuantitativos. Estos datos toman solo ciertos valores numéricos. Si cuenta el número de llamadas telefónicas que recibe cada día de la semana, es posible que obtenga valores como cero, uno, dos o tres.

Los datos que no solo se componen de números de conteo, sino que pueden incluir fracciones, decimales o números irracionales, se denominan datos cuantitativos continuos. Los datos continuos suelen ser el resultado de mediciones como longitudes, pesos o tiempos. Una lista de la duración en minutos de todas las llamadas telefónicas que realiza en una semana, con números como 2.4, 7.5 u 11.0, serían datos cuantitativos continuos.

Ejemplo 1.5

Muestra de datos de datos cuantitativos discretos

Los datos son la cantidad de libros que los estudiantes llevan en sus mochilas. Muestra cinco estudiantes. Dos estudiantes llevan tres libros, un estudiante lleva cuatro libros, un estudiante lleva dos libros y un estudiante lleva un libro. Los números de libros, 3, 4, 2 y 1, son datos discretos cuantitativos.

Los datos son la cantidad de máquinas en un gimnasio. Muestra cinco gimnasios. Un gimnasio tiene 12 máquinas, un gimnasio tiene 15 máquinas, un gimnasio tiene 10 máquinas, un gimnasio tiene 22 máquinas y el otro gimnasio tiene 20 máquinas. ¿Qué tipo de datos es este?

Ejemplo 1.6

Muestra de datos de datos cuantitativos continuos

Los datos son los pesos de las mochilas con libros. Muestra los mismos cinco estudiantes. Los pesos, en libras, de sus mochilas son 6.2, 7, 6.8, 9.1, 4.3. Tenga en cuenta que las mochilas con tres libros pueden tener diferentes pesos. Los pesos son datos cuantitativos continuos.

Los datos son las áreas de césped en pies cuadrados. Muestra cinco casas. Las áreas del césped son 144 pies cuadrados, 160 pies cuadrados, 190 pies cuadrados, 180 pies cuadrados y 210 pies cuadrados. ¿Qué tipo de datos son estos?

Ejemplo 1.7

Vas al supermercado y compras tres latas de sopa (19 onzas de bisque de tomate, 14.1 onzas de lentejas y 19 onzas de boda italiana), dos paquetes de nueces (nueces y maní), cuatro tipos diferentes de vegetales (brócoli, coliflor, espinacas, y zanahorias) y dos postres (16 onzas de helado de pistacho y 32 onzas de galletas con chispas de chocolate).

Nombrar conjuntos de datos cuantitativos discretos, cuantitativos continuos y cualitativos.

Solucion 1

  • Un ejemplo de un conjunto de datos discretos cuantitativos sería tres latas de sopa, dos paquetes de nueces, cuatro tipos de verduras y dos postres porque los cuenta.
  • Los pesos de las sopas (19 onzas, 14,1 onzas, 19 onzas) son datos cuantitativos continuos porque usted mide los pesos con la mayor precisión posible.
  • Los tipos de sopas, nueces, verduras y postres son datos cualitativos porque son categóricos.

Intente identificar conjuntos de datos adicionales en este ejemplo.

Ejemplo 1.8

Los datos son los colores de las mochilas. Nuevamente, muestrea a los mismos cinco estudiantes. Un estudiante tiene una mochila roja, dos estudiantes tienen una mochila negra, un estudiante tiene una mochila verde y un estudiante tiene una mochila gris. Los colores rojo, negro, negro, verde y gris son datos cualitativos.

Los datos son los colores de las casas. Muestra cinco casas. Los colores de las casas son blanco, amarillo, blanco, rojo y blanco. ¿Qué tipo de datos es este?

Puede recopilar datos como números e informarlos categóricamente. Por ejemplo, los puntajes de las pruebas de cada estudiante se registran a lo largo del trimestre. Al final del trimestre, los puntajes de la prueba se informan como A, B, C, D o F.

Ejemplo 1.9

Trabaje en colaboración para determinar el tipo de datos correcto: cuantitativo o cualitativo. Indique si los datos cuantitativos son continuos o discretos. Sugerencia: los datos que son discretos a menudo comienzan con las palabras el número de.

  • la cantidad de pares de zapatos que tienes
  • el tipo de coche que conduces
  • la distancia desde su casa hasta la tienda de comestibles más cercana
  • la cantidad de clases que tomas por año escolar
  • el tipo de calculadora que usa
  • pesos de los luchadores de sumo
  • número de respuestas correctas en un cuestionario
  • Puntuaciones de coeficiente intelectual (esto puede provocar cierta discusión).

Solucion 1

Los ítems a, d y g son ítems cuantitativos discretos c, f, y h son ítems cuantitativos continuos bye son cualitativos o categóricos.

Determine el tipo de datos correcto, cuantitativo o cualitativo, para la cantidad de automóviles en un estacionamiento. Indique si los datos cuantitativos son continuos o discretos.

Ejemplo 1.10

Una profesora de estadística recopila información sobre la clasificación de sus estudiantes como estudiantes de primer año, segundo año, tercero o cuarto año. Los datos que recopila se resumen en el gráfico circular de la Figura 1.3. ¿Qué tipo de datos muestra este gráfico?

Solucion 1

Este gráfico circular muestra a los estudiantes en cada año, que es datos cualitativos o categóricos.

Un distrito escolar grande mantiene datos de la cantidad de estudiantes que reciben puntajes de exámenes en un examen estandarizado de fin de año. Los datos que recopila se resumen en el histograma. Los límites de clase son de 50 a menos de 60, de 60 a menos de 70, de 70 a menos de 80, de 80 a menos de 90 y de 90 a menos de 100.

Discusión de datos cualitativos

A continuación se muestran tablas que comparan la cantidad de estudiantes de tiempo parcial y de tiempo completo en De Anza College y Foothill College matriculados para el trimestre de primavera de 2010. Las tablas muestran recuentos, frecuencias y porcentajes o proporciones, frecuencias relativas. Por ejemplo, para calcular el porcentaje de estudiantes a tiempo parcial en De Anza College, divida 9,200 / 22,496 para obtener .4089. Redondea a la milésima más cercana, el tercer lugar decimal y luego multiplica por 100 para obtener el porcentaje, que es 40,9 por ciento.

Por lo tanto, las columnas de porcentaje facilitan la comparación de las mismas categorías en las universidades. Mostrar los porcentajes junto con los números suele ser útil, pero es particularmente importante cuando se comparan conjuntos de datos que no tienen los mismos totales, como el total de inscripciones para ambas universidades en este ejemplo. Observe cuánto mayor es el porcentaje de estudiantes a tiempo parcial en Foothill College en comparación con De Anza College.

Colegio De Anza Foothill College
Número Por ciento Número Por ciento
Tiempo completo 9,200 40.90% Tiempo completo 4,059 28.60%
Tiempo parcial 13,296 59.10% Tiempo parcial 10,124 71.40%
Total 22,496 100% Total 14,183 100%

Las tablas son una buena forma de organizar y mostrar datos. Pero los gráficos pueden ser aún más útiles para comprender los datos.

Dos gráficos que se utilizan para mostrar datos cualitativos son gráficos circulares y gráficos de barras.

en un Gráfico circular, las categorías de datos se muestran por cuñas en un círculo que representan el porcentaje de individuos / elementos en cada categoría. Usamos gráficos circulares cuando queremos mostrar partes de un todo.

en un gráfico de barras, la longitud de la barra para cada categoría representa el número o porcentaje de individuos en cada categoría. Las barras pueden ser verticales u horizontales. Usamos gráficos de barras cuando queremos comparar categorías o mostrar cambios a lo largo del tiempo.

A diagrama de Pareto consta de barras ordenadas por tamaño de categoría (de mayor a menor).

Mire la Figura 1.5 y la Figura 1.6 y determine qué gráfico (circular o barra) cree que muestra mejor las comparaciones.

Es una buena idea mirar una variedad de gráficos para ver cuál es el más útil para mostrar los datos. Podríamos hacer diferentes elecciones de lo que creemos que es el mejor gráfico en función de los datos y el contexto. Nuestra elección también depende de para qué estamos usando los datos.

Porcentajes que suman más (o menos) del 100 por ciento

A veces, los porcentajes suman más del 100 por ciento (o menos del 100 por ciento). En el gráfico, los porcentajes suman más del 100 por ciento porque los estudiantes pueden estar en más de una categoría. Un gráfico de barras es apropiado para comparar el tamaño relativo de las categorías. No se puede utilizar un gráfico circular. Tampoco podría usarse si los porcentajes se suman a menos del 100 por ciento.

Característica / Categoría Por ciento
Alumnos que cursan materias técnicas 40.9%
Estudiantes que estudian materias no técnicas 48.6%
Estudiantes que tengan la intención de transferirse a una institución educativa de cuatro años. 61.0%
TOTAL 150.5%

Omitir categorías / Datos faltantes

La tabla muestra el origen étnico de los estudiantes, pero falta el Otro / Desconocido categoría. Esta categoría incluye a personas que no sintieron que encajaban en ninguna de las categorías étnicas o que se negaron a responder. Observe que las frecuencias no se suman al número total de estudiantes. En esta situación, cree un gráfico de barras y no un gráfico circular.

Frecuencia Por ciento
asiático 8,794 36.1%
Negro 1,412 5.8%
Filipino 1,298 5.3%
Hispano 4,180 17.1%
Nativo americano 146 .6%
Isleño del pacífico 236 1.0%
blanco 5,978 24.5%
TOTAL 22,044 de 24,382 90,4% de 100%

El siguiente gráfico es el mismo que el gráfico anterior, pero el Otro / Desconocido se ha incluido el porcentaje (9,6 por ciento). El Otro / Desconocido La categoría es grande en comparación con algunas de las otras categorías (nativo americano, .6 por ciento, isleño del Pacífico, 1.0 por ciento). Es importante saber esto cuando pensamos en lo que nos dicen los datos.

Este gráfico de barras en particular en la Figura 1.9 puede ser difícil de entender visualmente. El gráfico de la figura 1.10 es un gráfico de Pareto. El diagrama de Pareto tiene las barras ordenadas de mayor a menor y es más fácil de leer e interpretar.

Gráficos circulares: no faltan datos

Los siguientes gráficos circulares tienen la Otro / Desconocido categoría incluida ya que los porcentajes deben sumar el 100 por ciento. El gráfico de la Figura 1.11b está organizado por el tamaño de cada cuña, lo que lo convierte en un gráfico más informativo visualmente que el gráfico alfabético sin clasificar de la Figura 1.11a.

Distribuciones marginales en tablas bidireccionales

A continuación se muestra un mesa bidireccional, también llamada tabla de contingencia, que muestra los deportes favoritos de 50 adultos: 20 mujeres y 30 hombres.

Esta es una tabla bidireccional porque muestra información sobre dos variables categóricas, en este caso, género y deportes. Los datos de este tipo (datos de dos variables) se denominan datos bivariados. Debido a que los datos representan un recuento, o un recuento, de opciones, es una frecuencia mesa. Las entradas en la fila total y la columna total representan frecuencias marginales o distribuciones marginales. Nota: El término distribuciones marginales recibe su nombre del hecho de que las distribuciones se encuentran en los márgenes de las tablas de distribución de frecuencia. Las distribuciones marginales se pueden dar como una fracción o decimal: por ejemplo, el total para los hombres podría darse como .6 o 3/5 ya que 30/50 = .6 = 3 / 5. 30/50 = .6 = 3/5 . Las distribuciones marginales requieren datos bivariados y solo se centran en uno de las variables representadas en la tabla. En otras palabras, la razón por la que 20 es una frecuencia marginal en esta tabla de dos factores es porque representa el margen o la porción de la población total que son mujeres (20/50). La razón por la que 25 es una frecuencia marginal es porque representa la parte de los muestreados que favorecen el fútbol (25/50). Nota: Los valores que componen el cuerpo de la tabla (por ejemplo, 20, 8, 2) se denominan frecuencias conjuntas.

Distribuciones condicionales en tablas bidireccionales

La distinción entre una distribución marginal y una distribución condicional es que la atención se centra solo en un subconjunto particular de la población (no en toda la población). Por ejemplo, en la tabla, si nos enfocamos solo en la subpoblación de mujeres que prefieren el fútbol, ​​entonces podríamos calcular las distribuciones condicionales como se muestra en la tabla de dos factores a continuación.

Para encontrar la primera subpoblación de mujeres que prefieren el fútbol, ​​lea el valor en la intersección de la fila Mujeres y la columna Fútbol que es 5. Luego, divida esto por la población total de futbolistas que es 25. Entonces, la subpoblación de jugadores de fútbol que son mujeres es 5/25 que es .2.

De manera similar, para encontrar la subpoblación de mujeres que juegan al fútbol, ​​use el valor de 5, que es el número de mujeres que juegan al fútbol. Luego, divida esto por la población total de mujeres que es 20. Entonces, la subpoblación de mujeres que juegan al fútbol es 5/20, que es .25.

Presentando datos

Después de decidir qué gráfico representa mejor sus datos, es posible que deba presentar sus datos estadísticos a una clase u otro grupo en un informe oral o presentación multimedia. Al realizar una presentación oral, debe estar preparado para explicar exactamente cómo recopiló o calculó los datos, así como por qué eligió las categorías, escalas y tipos de gráficos que está mostrando. Aunque es posible que haya realizado numerosos gráficos de sus datos, asegúrese de utilizar solo aquellos que realmente demuestren las intenciones declaradas de su estudio estadístico. Mientras prepara su presentación, asegúrese de que todos los colores, texto y escalas sean visibles para toda la audiencia. Por último, asegúrese de dar tiempo a su audiencia para hacer preguntas y estar preparado para responderlas.

Ejemplo 1.11

Suponga que los consejeros de orientación de De Anza y Foothill necesitan hacer una presentación oral de los datos de los estudiantes presentados en las Figuras 1.5 y 1.6. ¿En qué contexto deberían elegir mostrar el gráfico circular? ¿Cuándo podrían elegir el gráfico de barras? Para cada gráfico, explique qué características deben señalar y los posibles problemas de visualización que podrían existir.

Solucion 1

Los consejeros escolares deben usar el gráfico circular si la información deseada es el porcentaje de matrícula de cada escuela. Deben usar el gráfico de barras si conocer el número exacto de estudiantes y los tamaños relativos de cada categoría en cada escuela son puntos importantes que deben destacarse. Para el gráfico circular, deben señalar qué color representa a los estudiantes a tiempo parcial y cuál representa a los estudiantes a tiempo completo. También deben asegurarse de que los números y colores sean visibles cuando se muestren. Para el gráfico de barras, deben señalar la escala y los números totales para cada categoría, y deben asegurarse de que los números, colores y marcas de escala se muestren claramente.

Suponga que se le pide que haga una presentación oral de los datos graficados en el gráfico circular de la figura 1.11 (b). ¿Qué características señalaría en el gráfico? ¿Qué problemas potenciales de visualización con el gráfico debería comprobar antes de dar su presentación?

Muestreo

Recopilar información sobre toda una población a menudo cuesta demasiado o es prácticamente imposible. En cambio, usamos una muestra de la población. Una muestra debe tener las mismas características que la población que representa. La mayoría de los estadísticos utilizan varios métodos de muestreo aleatorio en un intento por lograr este objetivo. Esta sección describirá algunos de los métodos más comunes. Hay varios métodos diferentes de muestreo aleatorio. En cada forma de muestreo aleatorio, cada miembro de una población tiene inicialmente la misma probabilidad de ser seleccionado para la muestra. Cada método tiene pros y contras. El método más fácil de describir se llama muestra aleatoria simple. En una muestra aleatoria simple, cada grupo tiene la misma probabilidad de ser seleccionado. En otras palabras, cada muestra del mismo tamaño tiene la misma probabilidad de ser seleccionada. Por ejemplo, suponga que Lisa quiere formar un grupo de estudio de cuatro personas (ella misma y otras tres personas) de su clase de precálculo, que tiene 31 miembros sin incluir a Lisa. Para elegir una muestra aleatoria simple de tamaño tres de los otros miembros de su clase, Lisa podría poner los 31 nombres en un sombrero, sacudir el sombrero, cerrar los ojos y elegir tres nombres. Una forma más tecnológica es que Lisa enumere primero los apellidos de los miembros de su clase junto con un número de dos dígitos, como en la tabla 1.7.

IDENTIFICACIÓN Nombre IDENTIFICACIÓN Nombre IDENTIFICACIÓN Nombre
00 Anselmo 11 Rey 22 Roquero
01 Bautista 12 Legenia 23 Roth
02 Bayani 13 Lisa 24 Rowell
03 Cheng 14 Lundquist 25 Salangsang
04 Cuarismo 15 Macierz 26 Slade
05 Cuningham 16 Motogawa 27 Stratcher
06 Fontecha 17 Okimoto 28 Tallai
07 Hong 18 Patel 29 tran
08 Hoobler 19 Precio 30 Wai
09 Jiao 20 Quizon 31 Madera
10 Kan 21 Reyes

Lisa puede usar una tabla de números aleatorios (que se encuentra en muchos libros de estadística y manuales de matemáticas), una calculadora o una computadora para generar números aleatorios. Los generadores de números aleatorios más comunes son números de cinco dígitos donde cada dígito es un número único del 0 al 9. Para este ejemplo, suponga que Lisa elige generar números aleatorios a partir de una calculadora. Los números generados son los siguientes:

.94360, .99832, .14669, .51470, .40581, .73381, .04399.

Lisa lee grupos de dos dígitos hasta que ha elegido a tres miembros de la clase (es decir, lee .94360 como los grupos 94, 43, 36, 60). Cada número aleatorio solo puede contribuir con un miembro de la clase. Si lo hubiera necesitado, Lisa podría haber generado más números aleatorios.

La siguiente tabla muestra cómo Lisa lee números de dos dígitos de cada número aleatorio. Cada número de dos dígitos en la tabla representaría a cada estudiante en la lista anterior en la Tabla 1.7.

Número aleatorio Números leídos por Lisa
.94360 94 43 36 60
.99832 99 98 83 32
.14669 14 46 66 69
.51470 51 14 47 70
.40581 40 05 58 81
.73381 73 33 38 81
.04399 04 39 39 99

Los números aleatorios .94360 y .99832 no contienen números de dos dígitos apropiados. Sin embargo, el tercer número aleatorio, .14669, contiene 14 (el cuarto número aleatorio también contiene 14), el quinto número aleatorio contiene 05 y el séptimo número aleatorio contiene 04. El número de dos dígitos 14 corresponde a Lundquist, 05 corresponde a Cuningham , y 04 corresponde a Cuarismo. Además de ella, el grupo de Lisa estará formado por Lundquist, Cuningham y Cuarismo.

Uso de la calculadora TI-83, 83+, 84, 84+

Para generar números aleatorios, realice los siguientes pasos:

  • Presione MATH.
  • Flecha hacia PRB.
  • Presione 5: randInt (0, 30).
  • Presione ENTER para el primer número aleatorio.
  • Presione ENTER dos veces más para los otros dos números aleatorios. Si hay una repetición, presione ENTER nuevamente.

Nota: randInt (0, 30, 3) generará tres números aleatorios.

Además del muestreo aleatorio simple, existen otras formas de muestreo que implican un proceso aleatorio para obtener la muestra. Otros métodos de muestreo aleatorio bien conocidos son la muestra estratificada, la muestra de conglomerados y la muestra sistemática.

Para elegir una muestra estratificada, divida la población en grupos llamados estratos y luego la muestra se selecciona eligiendo el mismo número de valores de cada estrato hasta que se alcance el tamaño de muestra deseado. Por ejemplo, podría estratificar (agrupar) su población de estudiantes de secundaria por año (estudiantes de primer año, segundo año, tercer año y último año) y luego elegir una muestra aleatoria simple proporcional de cada estrato (cada año) para obtener una muestra aleatoria estratificada. Para elegir una muestra aleatoria simple de cada año, numere a cada estudiante del primer año, numere a cada estudiante del segundo año y haga lo mismo para los años restantes. Luego, use un muestreo aleatorio simple para elegir un número proporcional de estudiantes del primer año y haga lo mismo para cada uno de los años restantes. Los números seleccionados del primer año, del segundo año y así sucesivamente representan a los estudiantes que componen la muestra estratificada.

Para elegir una muestra de conglomerados, divida la población en conglomerados (grupos) y luego seleccione al azar algunos de los conglomerados. Todos los miembros de estos grupos están en la muestra de grupos. Por ejemplo, si muestra al azar cuatro clases de salón de su población estudiantil, las cuatro clases conforman la muestra del grupo. Cada clase es un grupo. Numere cada grupo y luego elija cuatro números diferentes utilizando un muestreo aleatorio. Todos los estudiantes de las cuatro clases con esos números son la muestra del conglomerado. Por lo tanto, a diferencia de un ejemplo estratificado, es posible que una muestra de conglomerados no contenga el mismo número de estudiantes elegidos al azar de cada clase.

Un tipo de muestreo que no es aleatorio es el muestreo por conveniencia. Muestreo de conveniencia implica el uso de resultados que están fácilmente disponibles. Por ejemplo, una tienda de software de computadora realiza un estudio de marketing entrevistando a clientes potenciales que se encuentran en la tienda navegando por el software disponible. Los resultados del muestreo de conveniencia pueden ser muy buenos en algunos casos y muy sesgados (favorecer ciertos resultados) en otros.

Los datos de muestreo deben realizarse con mucho cuidado. La recopilación de datos sin cuidado puede tener resultados devastadores. Las encuestas enviadas por correo a los hogares y luego devueltas pueden estar muy sesgadas. Pueden favorecer a cierto grupo. Es mejor que la persona que realiza la encuesta seleccione los encuestados de la muestra.

Cuando analiza datos, es importante tener en cuenta errores de muestreo y errores ajenos al muestreo. El proceso real de muestreo provoca errores de muestreo. Por ejemplo, es posible que la muestra no sea lo suficientemente grande. Factores no relacionados con la causa del proceso de muestreo errores ajenos al muestreo. Un dispositivo de conteo defectuoso puede causar un error ajeno al muestreo.

En realidad, una muestra nunca será exactamente representativa de la población, por lo que siempre habrá algún error de muestreo. Como regla general, cuanto mayor sea la muestra, menor será el error de muestreo.

En estadística, un sesgo de muestreo se crea cuando se toma una muestra de una población y no es probable que algunos miembros de la población sean elegidos como otros. Recuerde, cada miembro de la población debe tener la misma probabilidad de ser elegido. Cuando ocurre un sesgo de muestreo, se pueden sacar conclusiones incorrectas sobre la población que se está estudiando. Por ejemplo, si una encuesta de todos los estudiantes se lleva a cabo solo durante las horas del mediodía, está sesgada. Esto se debe a que no se incluirán los estudiantes que no tengan mediodía al mediodía.

Evaluación critica

Necesitamos evaluar críticamente los estudios estadísticos sobre los que leemos y analizarlos antes de aceptar los resultados de los estudios. Los problemas comunes a tener en cuenta incluyen los siguientes:

  • Problemas con las muestras: —Una muestra debe ser representativa de la población. Una muestra que no es representativa de la población está sesgada. Las muestras sesgadas que no son representativas de la población dan resultados inexactos y no fiables. La fiabilidad de las medidas estadísticas también debe tenerse en cuenta al analizar los datos. La confiabilidad se refiere a la coherencia de una medida. Una medida es confiable cuando se producen los mismos resultados en las mismas circunstancias.
  • Muestras autoseleccionadas: las respuestas solo de las personas que deciden responder, como las encuestas en Internet, a menudo no son fiables.
  • Problemas de tamaño de la muestra: las muestras que son demasiado pequeñas pueden no ser fiables. Las muestras más grandes son mejores, si es posible. En algunas situaciones, tener muestras pequeñas es inevitable y aún puede usarse para sacar conclusiones. Los ejemplos incluyen pruebas de choque en automóviles o pruebas médicas para enfermedades raras.
  • Influencia indebida: recopilar datos o hacer preguntas de una manera que influya en la respuesta.
  • No respuesta o negativa del sujeto a participar: —Las respuestas recopiladas pueden ya no ser representativas de la población. A menudo, las personas con fuertes opiniones positivas o negativas pueden responder encuestas, lo que puede afectar los resultados.
  • Causalidad: —Una relación entre dos variables no significa que una cause que la otra ocurra. Pueden estar relacionados (correlacionados) debido a su relación a través de una variable diferente.
  • Estudios autofinanciados o de interés propio: un estudio realizado por una persona u organización para respaldar su afirmación. ¿Es el estudio imparcial? Lea el estudio con atención para evaluar el trabajo. No asuma automáticamente que el estudio es bueno, pero tampoco asuma automáticamente que el estudio es malo. Evalúelo por sus méritos y el trabajo realizado.
  • Uso engañoso de los datos: pueden ser gráficos que se muestran incorrectamente, datos incompletos o falta de contexto.

Ejercicio colaborativo

Como clase, determine si las siguientes muestras son representativas o no. Si no es así, discuta las razones.

  1. Para encontrar el GPA promedio de todos los estudiantes de una escuela secundaria, use todos los estudiantes de honor de la universidad como muestra.
  2. Para averiguar cuál es el cereal más popular entre los jóvenes menores de 10 años, párese fuera de un gran supermercado durante tres horas y hable con cada vigésimo niño menor de 10 años que ingrese al supermercado.
  3. Para encontrar el ingreso anual promedio de todos los adultos en los Estados Unidos, tome una muestra de congresistas estadounidenses. Cree una muestra de conglomerados considerando cada estado como un estrato (grupo). Utilizando un muestreo aleatorio simple, seleccione los estados para que formen parte del conglomerado. Luego, encuesta a todos los congresistas estadounidenses del grupo.
  4. Para determinar la proporción de personas que utilizan el transporte público para ir al trabajo, encuesta a 20 personas en la ciudad de Nueva York. Realice la encuesta sentándose en Central Park en un banco y entrevistando a todas las personas que se sientan a su lado.
  5. Para determinar el costo promedio de una estadía de dos días en un hospital de Massachusetts, realice una encuesta en 100 hospitales de todo el estado utilizando un muestreo aleatorio simple.

Ejemplo 1.12

Se realiza un estudio para determinar la matrícula promedio que pagan los estudiantes de secundaria privada por semestre. A cada estudiante de las siguientes muestras se le pregunta cuánto pagó por el semestre de otoño. ¿Cuál es el tipo de muestreo en cada caso?

  1. Se toma una muestra de 100 estudiantes de secundaria organizando los nombres de los estudiantes por clasificación (primer año, segundo año, tercer año o último año) y luego seleccionando 25 estudiantes de cada uno.
  2. Se utiliza un generador de números aleatorios para seleccionar un estudiante de la lista alfabética de todos los estudiantes de secundaria en el semestre de otoño. Comenzando con ese estudiante, se elige cada 50 estudiantes hasta que se incluyen 75 estudiantes en la muestra.
  3. Se utiliza un método completamente aleatorio para seleccionar 75 estudiantes. Cada estudiante de secundaria en el semestre de otoño tiene la misma probabilidad de ser elegido en cualquier etapa del proceso de muestreo.
  4. Los años de primer, segundo, tercer y cuarto año se numeran uno, dos, tres y cuatro, respectivamente. Se utiliza un generador de números aleatorios para elegir dos de esos años. Todos los estudiantes en esos dos años están en la muestra.
  5. Se le pide a un asistente administrativo que se pare frente a la biblioteca un miércoles y pregunte a los primeros 100 estudiantes de pregrado que encuentre qué pagaron por la matrícula el semestre de otoño. Esos 100 estudiantes son la muestra.

Solucion 1

un. estratificado, b. sistemático, c. aleatorio simple, d. racimo, e. conveniencia

Utilizará el generador de números aleatorios para generar diferentes tipos de muestras a partir de los datos.

Esta tabla muestra seis conjuntos de puntajes de pruebas (cada prueba cuenta 10 puntos) para una clase de estadística de primaria.

#1 #2 #3 #4 #5 #6
5 7 10 9 8 3
10 5 9 8 7 6
9 10 8 6 7 9
9 10 10 9 8 9
7 8 9 5 7 4
9 9 9 10 8 7
7 7 10 9 8 8
8 8 9 10 8 8
9 7 8 7 7 8
8 8 10 9 8 7

Instrucciones: Utilice el generador de números aleatorios para seleccionar muestras.

  1. Cree una muestra estratificada por columna. Elija tres puntajes de prueba al azar de cada columna.
    1. Numere cada fila del uno al 10.
    2. En su calculadora, presione Math y la flecha hacia PRB.
    3. Para la columna 1, presione 5: randInt (e ingrese 1,10). Presione ENTER. Anote el número. Presione ENTER 2 veces más (incluso las repeticiones). Registre estos números. Registre los tres puntajes de la prueba en la columna uno que correspondan a estos tres números.
    4. Repita para las columnas dos a seis.
    5. Estos 18 puntajes de pruebas son una muestra estratificada.
    1. Presione MATH y la flecha hacia la función PRB.
    2. Presione 5: randInt (“y luego ingrese“ 1,6). Presione ENTER.
    3. El número que muestra la calculadora nombra la primera columna de puntajes de prueba para incluir en su muestra. Presione ENTER.
    4. El siguiente número que muestra la calculadora identifica la segunda columna, o grupo, de datos para incluir en la muestra, lo que da un total de 20 puntajes de prueba.
    1. Utilice la numeración del uno al 60.
    2. Presione MATH. Flecha hacia PRB. Presione 5: randInt (1, 60).
    3. Presione ENTER 15 veces y registre los números.
    4. Registre las puntuaciones de la prueba que correspondan a estos números.
    5. Estos 15 puntajes de cuestionarios son la muestra sistemática.
    1. Utilice la numeración del uno al 60.
    2. Presione MATH. Flecha hacia PRB. Presione 5: randInt (1, 60).
    3. Presione ENTER. Registre el número y la primera puntuación de la prueba. A partir de ese número, cuente diez puntajes de prueba y registre esa puntuación de prueba. Siga contando diez puntajes de prueba y anote la puntuación de prueba hasta que tenga una muestra de 12 puntuaciones de prueba. Puede envolver (volver al principio).

    Ejemplo 1.13

    Determine el tipo de muestreo utilizado (aleatorio simple, estratificado, sistemático, por conglomerados o por conveniencia).

    1. Un entrenador de fútbol selecciona a seis jugadores de un grupo de niños de ocho a diez años, siete jugadores de un grupo de niños de 11 a 12 años y tres jugadores de un grupo de niños de 13 a 14 años para formar un equipo de fútbol recreativo.
    2. Un encuestador entrevista a todo el personal de recursos humanos de cinco empresas de alta tecnología diferentes.
    3. Un investigador educativo de secundaria entrevista a 50 maestras de secundaria y 50 profesores de secundaria.
    4. Un investigador médico entrevista a uno de cada tres pacientes con cáncer de una lista de pacientes con cáncer en un hospital local.
    5. Un consejero de la escuela secundaria usa una computadora para generar 50 números aleatorios y luego elige a los estudiantes cuyos nombres corresponden a los números.
    6. Un estudiante entrevista a sus compañeros de clase en su clase de álgebra para determinar cuántos pares de jeans tiene un estudiante, en promedio.

    Solucion 1

    un. estratificado b. clúster c. estratificado d. sistemático e. simple aleatorio f. conveniencia


    Vista previa del contenido

    Las tablas de frecuencia, los gráficos circulares y los gráficos de barras se pueden usar para mostrar datos relacionados con una variable categórica (es decir, de nivel nominal u ordinal). A continuación se muestran descripciones de cada uno junto con algunos ejemplos. Al final de esta lección, aprenderá a construir cada uno de estos usando Minitab Express.

    A tabla de frecuencia contiene los recuentos de la frecuencia con la que ocurre cada valor en el conjunto de datos. Algún software estadístico, como Minitab Express, utilizará el término cuenta para describir una tabla de frecuencias. Las tablas de frecuencia se usan más comúnmente con variables de nivel nominal y ordinal, aunque también se pueden usar con variables de nivel de intervalo o de razón si hay un número limitado de resultados posibles.

    Además de contener recuentos, algunas tablas de frecuencia también pueden incluir el porcentaje del conjunto de datos que cae en cada categoría, y algunas pueden incluir valores acumulativos. A recuento acumulativo es el número de casos en esa categoría y todas las categorías anteriores. A Porcentaje acumulado es el porcentaje en esa categoría y todas las categorías anteriores. Los recuentos acumulados y los porcentajes acumulados solo deben presentarse cuando los datos sean al menos de nivel ordinal.

    El primer ejemplo es una tabla de frecuencia que muestra los recuentos y porcentajes de inscripción de estudiantes de pregrado de Penn State por campus. Debido a que se trata de una variable de nivel nominal, no se incluyeron los valores acumulativos.

    Frecuencias del campus
    Instalaciones Contar Por ciento
    Parque universitario 40,639 50.1%
    Campus de la Commonwealth 27,100 33.4%
    Facultad de Tecnología de PA 4,981 6.1%
    Campus mundial 8,360 10.3%
    Total 81,080 100%

    Penn State Fall 2019 Inscripciones de pregrado

    El siguiente ejemplo es una tabla de frecuencias para una variable de nivel ordinal: clasificación de clase. Debido a que las variables de nivel ordinal tienen un orden significativo, a veces queremos mirar los recuentos acumulados o los porcentajes acumulados, que nos dicen el número o porcentaje de casos en ese nivel o por debajo de él.

    Como ejemplo, interpretemos los valores de la fila "Sophomore". Hay 22 estudiantes de segundo año en esta muestra. Hay 27 estudiantes que son estudiantes de segundo año o menos (es decir, primer año o segundo año). En términos de porcentajes, el 34.4% de los estudiantes son de segundo año y el 42.2% de los estudiantes son de segundo año o menos.

    Frecuencias de clase
    Clase de pie Contar Recuento acumulativo Por ciento Porcentaje acumulado
    Primer año 5 5 7.8% 7.8%
    Estudiante de segundo año 22 27 34.4% 42.2%
    Júnior 17 44 26.6% 68.8%
    Mayor 20 64 31.3% 100.0%

    A Gráfico circular muestra datos relacionados con una variable categórica dividiendo un círculo en "sectores" que representan la proporción en cada categoría. Al construir un gráfico circular, preste especial atención a los colores que se utilizan para asegurarse de que sea accesible para personas con diferentes tipos de daltonismo.

    • Parque Universitario (48,5%)
    • Campus de la Commonwealth (34,9%)
    • Facultad de Tecnología de PA (6.5%)
    • Campus mundial (10,1%)

    A gráfico de barras es un gráfico que se puede utilizar para mostrar datos relacionados con una variable de nivel nominal u ordinal. Las barras, que pueden ser verticales u horizontales, simbolizan el número de casos en cada categoría. Tenga en cuenta que las barras en un gráfico de barras están separadas por espacios, esto comunica que se trata de una variable categórica.

    El primer ejemplo a continuación es un gráfico de barras con barras verticales. El segundo ejemplo es un gráfico de barras con barras horizontales. Ambos ejemplos muestran los mismos datos. En ambos gráficos, el tamaño de la barra representa el número de casos en esa categoría.

    Penn State Fall 2019 Inscripciones de pregrado

    Penn State Fall 2019 Inscripciones de pregrado

    Los gráficos circulares tienden a funcionar mejor cuando solo hay unas pocas categorías. Si una variable tiene muchas categorías, un gráfico circular puede ser difícil de leer. En esos casos, una tabla de frecuencias o un gráfico de barras puede ser más apropiado. Cada presentación visual tiene sus propias fortalezas y debilidades. Al comenzar, es posible que deba hacer algunos tipos diferentes de pantallas para determinar cuál comunica con mayor claridad sus datos.


    ¿Por qué son importantes los gráficos?

    Los gráficos son beneficiosos porque resumen y muestran información de una manera fácil de comprender para la mayoría de las personas. Los gráficos se utilizan en muchas disciplinas académicas, incluidas las matemáticas, las ciencias duras y las ciencias sociales. Hacen apariciones en entornos corporativos y sirven como herramientas útiles para transmitir información financiera y facilitar el análisis de datos.

    Se utilizan diferentes gráficos en función de la información que las personas deseen transmitir. Se utilizan muchos gráficos para resumir datos de forma clara y concisa; el mejor tipo de gráfico a utilizar depende del tipo de datos que se transmiten (como nominal, escala discreta, escala continua y ordinal). Los gráficos de resumen de datos son generalmente nominales o contienen datos que pueden reducirse de alguna manera. Los gráficos circulares y los gráficos de barras son ejemplos comunes y populares. Los gráficos circulares representan subcategorías al dividir los componentes en porciones o discos, mientras que los gráficos de barras presentan datos en forma lineal. Los gráficos circulares son ideales para transmitir información con cinco categorías o menos, mientras que los gráficos de barras son mejores para mostrar diferencias entre subgrupos más grandes. Los histogramas se utilizan para resaltar promedios y variaciones dentro y entre conjuntos de datos y se utilizan para conjuntos de datos ordinales o orientados a escalas. Los gráficos pueden mostrarse en papel o electrónicamente y, a menudo, se agregan a hojas de cálculo generadas por computadora en entornos comerciales y para facilitar conferencias científicas.


    Los datos que se pueden contar o expresar en números constituyen los datos cuantitativos. Se usa comúnmente para estudiar los eventos o niveles de concurrencia. Y se recopila a través de un cuestionario estructurado que hace preguntas que comienzan con "cuánto" o "cuántos". Como los datos cuantitativos son numéricos, representan tanto datos definitivos como objetivos. Además, la información cuantitativa está muy ordenada para el análisis estadístico y matemático, lo que permite ilustrarla en forma de cuadros y gráficos.

    Discretos y continuos son las dos categorías principales de datos cuantitativos donde los datos discretos tienen números finitos y los valores de datos constantes caen en un continuo que poseen la posibilidad de tener fracciones o decimales. Si se realiza una investigación para averiguar la cantidad de vehículos que posee el hogar estadounidense, obtenemos un número entero, que es un excelente ejemplo de datos discretos. Cuando la investigación se limita al estudio de medidas físicas de la población como altura, peso, edad o distancia, el resultado es un excelente ejemplo de datos continuos.

    Cualquier método de recopilación de datos tradicional o en línea que ayude a recopilar datos numéricos es un método probado de recopilación de datos cuantitativos.

    Muestreo de probabilidad

    Un método definitivo de muestreo que se lleva a cabo utilizando alguna forma de Selección aleatoria y permitir a los investigadores hacer una declaración de probabilidad basada en datos recopilados al azar del grupo demográfico objetivo. Una de las mejores cosas del muestreo probabilístico es que permite a los investigadores recopilar datos de representantes de la población que están interesados ​​en estudiar. Además, los datos se recopilan aleatoriamente de la muestra seleccionada descarta la posibilidad de sesgo de muestreo.

    Hay tres tipos importantes de muestreo probabilístico

    • Muestreo aleatorio simple: Más a menudo, el grupo demográfico objetivo se elige para su inclusión en la muestra.
    • Muestreo aleatorio sistemático: Cualquiera de los grupos demográficos objetivo se incluiría en la muestra, pero solo la primera unidad para su inclusión en la muestra se selecciona al azar, el resto se selecciona de manera ordenada como si fuera una de cada diez personas en la lista.
    • Muestreo aleatorio estratificado: Permite seleccionar cada unidad de un grupo particular de la audiencia objetivo mientras se crea una muestra. Es útil cuando los investigadores son selectivos sobre la inclusión de un conjunto específico de personas en la muestra, es decir, solo hombres o mujeres, gerentes o ejecutivos, personas que trabajan dentro de una industria en particular.

    Entrevistas

    Entrevistar a las personas es un método estándar utilizado para la recopilación de datos. Sin embargo, las entrevistas realizadas para recopilar datos cuantitativos están más estructuradas, en las que los investigadores solo piden un conjunto estándar de cuestionarios y nada más que eso.

    Hay tres tipos principales de entrevistas realizadas para la recopilación de datos.

    • Entrevistas telefónicas: Durante años, las entrevistas telefónicas gobernaron los gráficos de los métodos de recopilación de datos. Sin embargo, hoy en día, hay un aumento significativo en la realización de entrevistas en video utilizando Internet, Skype o plataformas similares de videollamadas en línea.
    • Entrevistas presenciales: Es una técnica probada para recopilar datos directamente de los participantes. Ayuda a adquirir datos de calidad, ya que proporciona un margen para hacer preguntas detalladas e investigar más para recopilar datos ricos e informativos. Los requisitos de alfabetización del participante son irrelevantes, ya que las entrevistas F2F ofrecen amplias oportunidades para recopilar datos no verbales a través de la observación o para explorar temas complejos y desconocidos. Aunque puede ser un método costoso y que requiere mucho tiempo, las tasas de respuesta para las entrevistas F2F suelen ser más altas.
    • Entrevista personal asistida por computadora (CAPI): No es más que una configuración similar de la entrevista cara a cara en la que el entrevistador lleva consigo una computadora de escritorio o una computadora portátil en el momento de la entrevista para cargar los datos obtenidos de la entrevista directamente en la base de datos. CAPI ahorra mucho tiempo en la actualización y el procesamiento de los datos y también hace que todo el proceso sea sin papel, ya que el entrevistador no lleva un montón de papeles y cuestionarios.

    Encuestas / cuestionarios

    Las encuestas o cuestionarios creados con software de encuestas en línea están desempeñando un papel fundamental en la recopilación de datos en línea, ya sea en investigación cuantitativa o cualitativa. Las encuestas están diseñadas para legitimar el comportamiento y la confianza de los encuestados. Más a menudo, las listas de verificación y el tipo de preguntas de escala de calificación constituyen la mayor parte de las encuestas cuantitativas, ya que ayudan a simplificar y cuantificar la actitud o el comportamiento de los encuestados.

    Hay dos tipos importantes de cuestionarios de encuestas que se utilizan para recopilar datos en línea para la investigación de mercado cuantitativa.

    • Cuestionario basado en web : Este es uno de los métodos más confiables y de reglas para la investigación basada en Internet o la investigación en línea. En un cuestionario basado en la web, reciben un correo electrónico que contiene el enlace de la encuesta, al hacer clic en el que lleva al encuestado a una herramienta de encuesta segura en línea desde donde puede realizar la encuesta o completar el cuestionario de la encuesta. Al ser rentables, más rápidas y tener un alcance más amplio, los investigadores prefieren las encuestas basadas en la web. El beneficio principal de un cuestionario basado en la web es la flexibilidad que los encuestados tienen la libertad de realizar la encuesta en su tiempo libre utilizando una computadora de escritorio, una computadora portátil, una tableta o un dispositivo móvil.
    • Cuestionario por correo: En un cuestionario por correo, la encuesta se envía por correo a una gran cantidad de la población de la muestra, lo que permite al investigador conectarse con una amplia gama de audiencias. El cuestionario por correo generalmente consiste en un paquete que contiene una portada que presenta a la audiencia sobre el tipo de investigación y la razón por la que se está llevando a cabo, junto con una devolución prepaga para recopilar datos en línea.Aunque el cuestionario por correo tiene una tasa de abandono más alta en comparación con otros métodos de recopilación de datos cuantitativos, agregar ciertos beneficios, como recordatorios e incentivos para completar la encuesta, ayuda a mejorar drásticamente la tasa de abandono. Uno de los principales beneficios del cuestionario por correo es que todas las respuestas son anónimas, y los encuestados pueden tomarse todo el tiempo que quieran para completar la encuesta y ser completamente honestos sobre la respuesta sin temor a prejuicios.

    Observaciones

    Como sugiere su nombre, es un método bastante simple y directo de recopilar datos cuantitativos. En este método, los investigadores recopilan datos cuantitativos a través de observaciones sistemáticas mediante el uso de técnicas como contar el número de personas presentes en el evento específico en un momento particular y un lugar particular o el número de personas que asisten al evento en un lugar designado. Más a menudo, para la recopilación de datos cuantitativos, los investigadores tienen un enfoque de observación naturalista que necesita habilidades de observación agudas y sentidos para obtener los datos numéricos sobre el "qué" y no sobre el "por qué" y el "cómo".

    La observación naturalista se utiliza para recopilar ambos tipos de datos, cualitativos y cuantitativos. Sin embargo, la observación estructurada se utiliza más para recopilar datos cuantitativos que cualitativos.

    • Observación estructurada: En este tipo de método de observación, el investigador tiene que hacer observaciones cuidadosas de uno o más comportamientos específicos en un entorno más completo o estructurado en comparación con la observación naturalista o participante. En una observación estructurada, los investigadores, en lugar de observar todo, se centran solo en comportamientos de interés muy específicos. Les permite cuantificar los comportamientos que están observando. Cuando las observaciones requieren un juicio por parte de los observadores & # 8211, a menudo se describe como codificación, lo que requiere una definición clara de un conjunto de comportamientos objetivo.

    Revisión de documentos en la recopilación de datos cuantitativos

    La revisión de documentos es un proceso que se utiliza para recopilar datos después de revisar los documentos existentes. Es una forma eficiente y eficaz de recopilar datos, ya que los documentos son manejables y son el recurso práctico para obtener datos calificados del pasado. Además de fortalecer y apoyar la investigación proporcionando datos de investigación complementarios, la revisión de documentos se ha convertido en uno de los métodos beneficiosos para recopilar datos de investigación cuantitativos.

    Se están analizando tres tipos de documentos principales para recopilar datos de investigación cuantitativos de apoyo.

    • Registros Públicos: Bajo esta revisión de documentos, los registros oficiales y continuos de una organización se analizan para futuras investigaciones. Por ejemplo, manuales de políticas de informes anuales, actividades de los estudiantes, actividades de juegos en la universidad, etc.
    • Documentos personales: A diferencia de los documentos públicos, este tipo de revisión de documentos se ocupa de los relatos personales individuales de los individuos: acciones, comportamiento, salud, físico, etc. Por ejemplo, la altura y el peso de los estudiantes, la distancia que viajan los estudiantes para asistir a la escuela, etc.
    • Evidencia física: La evidencia física o los documentos físicos se refieren a los logros anteriores de un individuo o de una organización en términos de crecimiento monetario y escalable.

    Conclusión

    Los datos cuantitativos no tienen que ver con el razonamiento convergente, sino con el pensamiento divergente. Se ocupa de la postura numérica, lógica y objetiva, centrándose en datos numéricos e invariables. Con mayor frecuencia, los métodos de recopilación de datos se utilizan para recopilar datos de investigación cuantitativos y los resultados dependen de los tamaños de muestra más grandes que comúnmente representan la población que el investigador pretende estudiar.

    Aunque existen muchos otros métodos para recopilar datos cuantitativos, los mencionados anteriormente, el muestreo probabilístico, las entrevistas, la observación de cuestionarios y la revisión de documentos son los métodos más comunes y ampliamente utilizados, ya sea fuera de línea o para la recopilación de datos en línea.

    La investigación de datos cuantitativos es completa y quizás el único tipo de datos que podría mostrar resultados analíticos en tablas y gráficos. Los datos de calidad le brindarán resultados precisos, y el análisis de datos es probablemente el componente esencial, que no solo obstaculizará la integridad y autenticidad de su investigación, sino que también hará que los hallazgos sean inestables si tiene datos débiles. Por lo tanto, no importa el método que elija para recopilar datos cuantitativos, asegúrese de que los datos recopilados sean de buena calidad para proporcionar información valiosa y procesable.


    Capítulo 4 & # 8211 Análisis de datos y resultados

    El capítulo 4 tiene varios nombres, como & # 8216 Análisis de datos & # 8217. & # 8216Análisis de datos & # 8217, & # 8216Análisis y resultados & # 8217 y así sucesivamente. Para nuestro propósito, usaremos el título Análisis y resultados del estudio para el documento del proyecto [Consulte con su institución para conocer el título recomendado]. Las dos palabras clave del título son & # 8216análisis & # 8217 y & # 8216resultados & # 8217 donde analiza los datos recopilados y presenta la resultados en el Capítulo 4. & # 8216Análisis & # 8217 aquí implica el uso de técnicas para dar significado a los datos sin procesar recopilados.

    Discutiremos cómo se escribe el Capítulo 4 para la investigación cuantitativa y el Capítulo 4 para la investigación cualitativa. Si utilizó un enfoque de métodos mixtos, es posible que deba combinar los dos enfoques.

    Redacción del capítulo 4 para la investigación cuantitativa

    A veces, los estudiantes dedican mucho tiempo a recopilar y analizar los datos, pero cuando se trata de informar, no hacen un buen trabajo.

    Algunos estudiantes & # 8216 venden brevemente & # 8217 al informar de forma insuficiente los datos que han recopilado y analizado. Ellos no se burlan de información valiosa y relevante y preséntela en el Capítulo 4.

    Algunos estudiantes no presentan los datos con claridad a pesar de que el Capítulo 1, el Capítulo 2 y el Capítulo 3 están bien redactados.

    El capítulo 4 es quizás el capítulo más importante porque es la culminación de todos sus esfuerzos. A la gente le gustaría saber qué ha descubierto después de pasar tantos años. ¿Cuál es el problema?Es un gran problema porque los hallazgos son la esencia de todo el proyecto. Debería estar más emocionado con lo que ha encontrado y poder transmitir esa emoción en el Capítulo 4. Aquí nos centraremos en escribir los resultados y el análisis de los datos basados ​​en un enfoque cuantitativo que consta de TRES secciones:

    Introducción

    Empiece este capítulo con una & # 8216Introducción & # 8217 en la que le recuerda al lector propósito del estudio y el preguntas de investigación o hipótesis . Cuéntele brevemente al lector acerca de el diseño de la investigación & # 8211, es decir, si se trataba de una encuesta experimental, cuasi-experimental. diseño de correlación y así sucesivamente. Además, brevemente describir las técnicas de recolección de datos & # 8211 como cuestionario, observación, entrevistas, pruebas de aptitud, pruebas de actitud, escalas, inventarios, etc. [Tenga en cuenta que el proceso de cómo recopiló los datos debe estar alineado con lo que se informa en el Capítulo 4 y # 8211 un error común es que lo que informó en el Capítulo 3 no coincide con lo que se mencionó en el Capítulo 4]

    Puede reformular la pregunta de investigación o la hipótesis de la siguiente manera:

    • En forma de preguntas & # 8211 ¿Existe una diferencia significativa en los estilos de liderazgo entre líderes masculinos y femeninos en el sector bancario?.
    • En forma de declaración & # 8211 Género y estilo de liderazgo en el sector bancario.
    • En forma de hipótesis nula & # 8211 No hay una diferencia significativa entre gerentes masculinos y femeninos & # 8230 & # 8230 & # 8230 ..
    • Respalde su presentación con tablas, gráficos, cuadros y figuras cuando corresponda
      • Siga el formato APA.
      • Deben interpretarse tablas, cuadros, gráficos y figuras & # 8211 es su responsabilidad decirle al lector cuál cree que es la información más importante en los gráficos.
      • Asegúrese de que cada gráfico esté claramente etiquetado con un título para que los lectores puedan identificarlos y comprenderlos fácilmente.
      • Nunca presente una tabla, gráfico o figura que no esté planeando explicar
      • Debe escribirse en tiempo pasado porque los datos se han recopilado.
      • No juzgar, editorializar, evaluar ni opinar sobre los resultados obtenidos. Solo informa los hechos, ¡de acuerdo!
      • La presentación debe ser coherente con las preguntas de investigación del capítulo 1.
      • Recuerde escribir para el lector y debe ser lógico y fácil de seguir & # 8211 & # 8216 hacerlo simple pero no más simple & # 8217
      • Evite las citas & # 8211 no es necesario citar fuentes & # 8211 lo hará en el Capítulo 5.

      Directrices de la APA para la presentación de informes de análisis estadístico

      Al intentar responder cada pregunta de investigación o hipótesis, seguramente habría utilizado varias herramientas y procedimientos estadísticos. Tienes que demostrar cómo estas pruebas estadísticas ayudan a responder la Pregunta de Investigación 1 o el rechazo o aceptación de la Hipótesis 1. Tienes que demostrar cómo el análisis estadístico empleado te permite sacar conclusiones.

      Tenga en cuenta que debe asumir que el lectores de su documento de proyecto tiene una conocimiento de estadística. No intente explicar cómo o por qué utilizó una prueba en particular, a menos que sea inusual.

      Informe de estadísticas descriptivas

      Al informar los resultados de las pruebas estadísticas descriptivas, la atención se centra en las medias (M), las desviaciones estándar (DE), las frecuencias (N) y los porcentajes presentados en tablas o gráficos (gráficos de barras, gráficos de líneas, gráficos circulares). Por ejemplo,

      & # 8216Las mujeres (M = 45, SD = 2.1) están más satisfechas con sus trabajos en comparación con sus colegas masculinos (M = 38, SD = 2.2) & # 8217.

      Si presenta estadísticas descriptivas en una tabla o figura, no necesita repetir en forma de texto todo lo que está en la tabla. Sin embargo, debe explicar las características clave de la tabla en la narrativa que ayudarán a la interpretación. Un error común es no decir nada sobre la tabla o el gráfico en el texto o contar por escrito todo lo que hay en la tabla o el gráfico. Debe decidir cuáles son los hallazgos o características clave sobre los que se debe escribir. No puede decir & # 8220 Basta con mirar la tabla e interpretar por sí mismo lo que se encontró & # 8221.

      Informar el pag valor

      La mayor parte de la investigación cuantitativa en las ciencias sociales y del comportamiento implica la comparación de dos o más grupos de individuos. Las herramientas estadísticas (como la prueba t, ANOVA) se utilizan para informar diferencia significativa entre dos o más condiciones donde una condición puede ser más, menos, más alto o más bajo que otra condición. Para ello, el & # 8216p valor & # 8217 se utiliza en un rango de .001, .01 y .05. Antes de informar, asegúrese de mencionar al principio que está utilizando un nivel alfa particular, como .05, para todas las pruebas estadísticas. Así es como se debe informar:

      & # 8220A pag Se informó un valor de .03 que indica una diferencia significativa entre & # 8230 & # 8230 & # 8230 & # 8230 & # 8230 & # 8230 & # 8230 & # 8221

      Reportando correlaciones

      Las correlaciones proporcionan una medida de la relación estadística entre dos variables. Tenga en cuenta que las correlaciones se pueden probar para determinar la significancia estadística e informar de la siguiente manera:

      & # 8220 Para los treinta estudiantes, los puntajes en la prueba de matemáticas (M = 7.00, SD = 1.23) y la actitud hacia las matemáticas (M = 80.89, SD = 6.90) se correlacionaron fuerte y significativamente, r (29) = .70, p = .038 & # 8221

      Informe de la prueba t de muestras independientes

      Para este análisis, el énfasis está en comparar las medias de dos grupos. Aquí nuevamente el resumen y las estadísticas inferenciales se enfocan en la diferencia.

      & # 8220Una prueba t de muestra independiente mostró que la diferencia en los puntajes de las pruebas entre el grupo de control (n = 4, M = 6.00, SD = 0.82) y el grupo experimental (n = 4, M = 8.00, SD = .82) fueron estadísticamente significativo, t (6) = -3.46, p = .013, 95% CI [-3.41, -0.59], d = -2.45 & # 8221

      • Olvidar poner en cursiva símbolos como p, t, F, r.
        • t (34) = 2.39, p = .011 es incorrecto
        • t(34) = 2.39, p = .011 es correcto
        • Olvidar poner espacios alrededor de = y & lt
          • t(34)=2.39,pag& lt.001 es incorrecto
          • t(34) = 2.39, p & lt.001 es mejor
          • Poner ceros a la izquierda en valores p y coeficientes de correlación:
            • t(34) = 2,39, p & lt 0001, r = 0.23 es incorrecto
            • t(34) = 2.39, p & lt.001, r = .23 es correcto
            • Olvidando grados de libertad:
              • t = 2.39, pag& lt.001 es malo
              • t(34) = 2.39, p & lt.001 es bueno

              Al final del capítulo, debe resumir las respuestas a las principales preguntas de investigación o hipótesis que respondió el análisis. Esta sección sirve como transición al Capítulo 5, donde estos resultados se discutirán en detalle. Esta subsección debe orientar al lector hacia el Capítulo 5, así como resumir los hallazgos del Capítulo 4 y # 8217.

              • Resuma los resultados de las pruebas para el lector en su orden de importancia.
              • No se debe incluir nueva información o análisis. El objetivo del resumen es resumir los hallazgos para el lector en uno o dos párrafos.
              • Agregue una transición a los temas del capítulo cinco.

              Consulte estos videoclips que le ayudarán a escribir el Capítulo 4

              Redacción del capítulo 4 para el documento de proyecto que adoptó un enfoque CUALITATIVO

              Similar a Capítulo 4 para la investigación cuantitativa , el Capítulo 4 de Investigación Cualitativa tiene diferentes títulos como & # 8216Análisis de datos & # 8217 , & # 8216Resultados del estudio & # 8217 Etcétera. Para el documento de proyecto, & # 8216Análisis de datos y resultados & # 8216 se utiliza. Las palabras clave son & # 8216análisis & # 8217 y & # 8216results & # 8217 en las que el investigador & # 8216analiza & # 8217 los datos y presenta los & # 8216results & # 8217 en el Capítulo 4. A menudo, los estudiantes pasan mucho tiempo recopilando y analizando datos pero hacer un mal trabajo informando los resultados. Algunos subinforman a pesar de haber recopilado grandes cantidades de datos, mientras que otros carecen de claridad en su presentación a pesar de que han escrito de forma clara y concisa los capítulos 1, 2 y 3.

              El formato para la redacción de la investigación cuantitativa del Capítulo 4 está mucho más organizado en comparación con la investigación cualitativa, ya que el estilo de presentación de informes está más estructurado. Por el contrario, no existe un estilo único para informar los resultados de la investigación cualitativa. Los investigadores cualitativos deben elegir entre una variedad de estilos para contar una & # 8216story & # 8217 de una manera organizada e interesante. Según Wolcott (1990), & # 8220 escribir bien no es un lujo ni una opción & # 8230..es absolutamente esencial & # 8221 (p.13) para los investigadores cualitativos. La investigación cualitativa genera información rica y decidir dónde enfocarse es un gran desafío.

              & # 8220Creo que los datos, que han sido recogidos dolorosamente, deberían & # 8220 ser la estrella & # 8221 en la relación. Con esto quiero decir que el enfoque principal en la investigación cualitativa son los datos en sí mismos, en toda su riqueza, amplitud y profundidad. Cuando todo está dicho y hecho, la & # 8220calidad & # 8221 en un proyecto de investigación cualitativa se basa en lo bien que lo ha hecho en la recopilación de datos de calidad.Por lo tanto, parece natural que cuando llegue el momento de presentar & # 8220 los frutos de su trabajo & # 8221, debe hacer todo lo posible para incluir los datos en sus presentaciones & # 8221 (Ronald J. Chenail, Presentación de datos cualitativos. Informe cualitativo, 2 (3). Diciembre de 1995).

              Lea este artículo sobre los diferentes enfoques para presentar datos cualitativos.


              ¿Qué son los datos cuantitativos?

              Los datos cuantitativos parecen ser más sencillos de definir e identificar.

              Los datos cuantitativos son datos que se pueden expresar como un número o se pueden cuantificar. En otras palabras, los datos cuantitativos se pueden medir mediante variables numéricas.

              Los datos cuantitativos son fácilmente susceptibles de manipulación estadística y se pueden representar con una amplia variedad de tipos estadísticos de gráficos y acelgas, como líneas, gráficos, gráficos de barras, diagramas de dispersión, diagramas de caja y bigotes, etc.

              Características clave de los datos cuantitativos:

              • Puede cuantificarse y verificarse.
              • Los datos se pueden contar.
              • Tipo de datos: número y estadísticas.
              • Responde preguntas como & # 8220cuántos, & # 8220cuánto & # 8221 y & # 8220con qué frecuencia & # 8221.

              Ejemplos de datos cuantitativos:

              • Puntuaciones en pruebas y exámenes, p. Ej. 85, 67, 90 y etc.
              • El peso de una persona o un sujeto.
              • El número de horas de estudio.
              • Tu talla de zapato.
              • Los pies cuadrados de un apartamento.
              • La temperatura en una habitación.
              • El volumen de un gas y etc.

              Tipos de datos cuantitativos:

              Hay 2 tipos generales de datos cuantitativos:

              • Datos discretos & # 8211 un recuento que involucra números enteros. Solo es posible un número limitado de valores. Los valores discretos no se pueden subdividir en partes. Por ejemplo, el número de niños en una escuela son datos discretos. Puede contar individuos enteros. No puedes contar 1,5 niños.
              • Datos continuos & # 8211 información que podría dividirse significativamente en niveles más finos. Se puede medir en una escala o continuo y puede tener casi cualquier valor numérico. Por ejemplo, puede medir su altura a escalas muy precisas: metros, centímetros, milímetros, etc. Más sobre el tema, vea en nuestra publicación datos discretos vs continuos.

              ¿Qué son los datos cualitativos?

              Como puede suponer, los datos cualitativos son información que no puede & # 8217t expresarse como un número y no puede & # 8217t medirse.

              Los datos cualitativos consisten en palabras, imágenes, observaciones y símbolos, no números. Se trata de cualidades.

              Los datos cualitativos también se denominan datos categóricos. La razón es que la información se puede ordenar por categoría, no por número. Los datos cualitativos se analizan para buscar temas comunes.

              Características clave de los datos cualitativos:

              • No se puede cuantificar ni verificar.
              • Los datos no se pueden contar.
              • Tipo de datos: palabras, objetos, imágenes, observaciones y símbolos.
              • Responde preguntas como & # 8220cómo ha sucedido & # 8221 o & # 8220por qué ha ocurrido & # 8221.

              Ejemplos de datos cualitativos:

              • Tu nivel socioeconómico
              • Colores, p. Ej. el color del mar
              • El Olor, p. Ej. aromático, mantecoso, alcanfórico y etc.
              • Su destino de vacaciones favorito, como Hawái, Nueva Zelanda, etc.
              • Nombres como John, Patricia,… ..
              • Suena como bang y blare.
              • Origen étnico como indio americano, asiático, etc.

              Análisis de datos cuantitativos: significado, pasos y tipos

              El análisis de datos cuantitativos finaliza con resultados fáciles de entender y cuantificables. Puedes analizarlo de muchas formas diferentes. Pero antes de iniciar el análisis hay que definir el nivel de medición involucrado en los datos cuantitativos.

              Veamos los pasos del proceso de análisis de variables cuantitativas. Nos ayudará a ver mejor la diferencia entre análisis de datos cualitativos y cuantitativos.

              Paso 1: identificar el nivel de medición

              Hay 4 escalas / niveles de medición:

              • Nominal y # 8211 escalas de datos utilizadas simplemente para etiquetar variables, sin valor cuantitativo. Los datos nominales simplemente nombran una cosa sin aplicarla a un pedido. Aunque podemos usar los números, no denotan cantidad. Ejemplos de datos nominales: color de cabello (Rubio, Castaño, Morena, etc.).
              • Ordinal. Los datos ordinales se colocan en algún tipo de orden según su posición en la escala. A menudo indican superioridad. Ejemplo de datos ordinales: la primera, segunda y tercera persona en una competición. Para entender mejor, vea nuestros datos post nominales vs ordinales.
              • Intervalo & # 8211 escalas numéricas que muestran información sobre un pedido. En escalas de intervalo, los intervalos entre cada valor de datos son los mismos. Un ejemplo popular aquí es la temperatura en grados centígrados, donde, por ejemplo, el intervalo entre 930C y 950C es el mismo que la distancia entre 1060C y 1080C. Sin embargo, no hay & # 8217t un punto de partida en las escalas de intervalo. Vea más ejemplos de datos de intervalo.
              • Proporción & # 8211 no solo muestran orden y tienen intervalos iguales, sino que también pueden tener un valor de cero.

              Identificar los niveles de medición en los que se encuentra un conjunto de datos le ayudará a decidir si los datos son útiles o no para realizar cálculos. Las escalas de medición son muy importantes porque determinan los tipos de análisis de datos que se pueden realizar.

              Debemos tener en cuenta que el nivel nominal solo se usa para clasificar datos, mientras que los niveles de medición de intervalo y razón son mucho más exactos y se usan más para el análisis de datos cuantitativos.


              Después de determinar el nivel de medición, el siguiente paso en el análisis de datos cuantitativos es ingresar los datos en una hoja de cálculo y organizarlos o “codificarlos” de alguna manera que le dé significado a los datos.

              La mejor forma de hacerlo es con un software de datos especializado.

              Como tiene los datos sin procesar, no puede simplemente sentarse y mirarlos. Debe realizar acciones para identificar algunos patrones o visualizar lo que muestran los datos.

              Paso 2: realizar estadísticas descriptivas

              Las estadísticas descriptivas se utilizan para describir y resumir las características básicas de un conjunto de datos. Las estadísticas descriptivas de uso común son:

              • Tendencia central (media, moda y mediana).
              • Porcentajes.
              • Dispersión (rango, cuartiles, varianza y desviación estándar)
              • Distribución.

              Paso 3: realizar estadísticas inferenciales

              Las estadísticas inferenciales se utilizan para sacar conclusiones y tendencias sobre una gran población a partir de una muestra extraída de ella. La estadística inferencial estudia las relaciones entre variables dentro de una muestra.

              La estadística inferencial le permite probar diferentes hipótesis y generalizar los resultados obtenidos a la población en su conjunto.

              Las técnicas, métodos y tipos de cálculos inferenciales clave son:

              Paso 4: definir la significancia estadística

              Por último, debe buscar la significación estadística. La significación estadística se captura a través de un "valor p", que evalúa la probabilidad de que su descubrimiento de los datos sean resultados confiables, no una coincidencia. Cuanto más bajo sea el valor p, más seguro puede estar de que sus hallazgos son confiables.

              Como puede ver en lo que respecta al análisis de datos cuantitativos, existen muchas técnicas y métodos que puede utilizar.

              El siguiente paso en nuestra publicación para la diferencia entre datos cualitativos y cuantitativos es ver qué implica el análisis de datos cualitativos.

              Análisis de datos cualitativos: definición, pasos y tipos

              Es más difícil realizar análisis de datos cualitativos (QDA) en comparación con uno cuantitativo.

              QDA incluye los procesos y métodos para analizar datos y proporcionar cierto nivel de comprensión, explicación e interpretación de patrones y temas en datos textuales.

              El análisis de datos cualitativos es muy importante porque permite que las ciencias de datos y los estadísticos formen parámetros para observar y analizar conjuntos de datos más grandes.

              Por ejemplo, si una empresa necesita identificar la diversidad de su personal, consideraría datos cualitativos como el origen étnico y la raza de sus empleados.

              A modo de comparación, los datos cuantitativos, en este caso, podrían ser la frecuencia de los trabajadores que pertenecen a esas etnias y razas.

              En general, el análisis de datos cualitativos tiene los siguientes pasos:

              Paso 1: familiarícese con sus datos

              Como científico de datos o investigador, debe leer y releer los datos, registrar notas e impresiones detalladas y decidir qué datos poseen valor.

              Paso 2: Defina las preguntas clave que deben responder a través de la QDA.

              Cada QDA tiene preguntas, problemas o temas específicos. Descubra qué preguntas necesita responder.

              Paso 3: Reducir y codificar los datos en temas

              Esto significa crear categorías y subcategorías. Es muy probable que estas categorías se agranden a medida que trabaja con sus datos. La lista de temas de compilación representa su primer conjunto de códigos.

              Paso 4: Buscar patrones y conexiones

              Este paso implica buscar la importancia relativa de los datos, identificar las relaciones entre conjuntos de datos o temas y tratar de encontrar explicaciones a partir de los datos disponibles.

              Paso 5: interpretar los datos y sacar conclusiones

              Después de identificar los temas, las conexiones y los patrones, ahora debe asignar significado e importancia a los datos.

              Es muy probable que descubra mucho más de lo que podría necesitar, por lo que tendrá que decidir cuáles son los datos y resultados más significativos.

              Nota: Los datos cualitativos no generan conclusiones ni generalizaciones en una población. Ésta es una diferencia importante entre el análisis de datos cualitativos y cuantitativos. Por el contrario, el análisis cuantitativo puede llevar a conclusiones o tendencias sobre una gran población a partir de una muestra extraída de ella.

              Existe una variedad de enfoques para el análisis de datos cualitativos. Algunos de los enfoques clave son:

              • Análisis de contenido & # 8211 una técnica para hacer inferencias interpretando y codificando información textual (por ejemplo, documentos, gráficos, comunicaciones orales).
              • Análisis temático & # 8211 un método QDA ampliamente utilizado que implica agrupar los datos en temas para definir el significado con patrones en un conjunto de datos.
              • Análisis del discurso & # 8211 incluye un grupo de enfoques para analizar interacciones escritas o vocales o cualquier evento semiótico significativo. El método se centra en el contexto social en el que ocurrió la comunicación. Busca comprender cómo se expresan las personas.
              • Teoría fundamentada & # 8211 le permite buscar estructuras y patrones sociales latentes.

              Como puede ver, la diferencia entre datos cualitativos y cuantitativos es significativa, no solo en lo que respecta a la naturaleza de los datos, sino que también los métodos y técnicas de análisis son bastante diferentes.


              Tanto el análisis de datos cualitativos como cuantitativos tienen un lugar vital en la estadística, la ciencia de datos y la investigación de mercado. Los dos tipos de análisis de datos funcionan muy bien juntos para ayudar a las organizaciones a construir un proceso de toma de decisiones basado en datos mucho más exitoso.

              Trabajar en el área de gestión de datos implica familiarizarse con las soluciones de software adecuadas. Existe una amplia gama de herramientas, paneles y programas que puede utilizar para que todo el proceso de análisis de datos sea efectivo y rentable.

              Sobre el Autor

              Silvia Valcheva

              Silvia Valcheva es una comercializadora digital con más de una década de experiencia creando contenido para la industria tecnológica. Tiene una gran pasión por escribir sobre software y tecnologías emergentes como big data, IA (inteligencia artificial), IoT (Internet de las cosas), automatización de procesos, etc.


              Rama 2: Estadística inferencial

              Como mencioné, mientras descriptivo Estadísticas tienen que ver con los detalles de su conjunto de datos específico & # 8211 su muestrainferencial Estadísticas tienen como objetivo hacer inferencias sobre el población. En otras palabras, utilizará estadísticas inferenciales para hacer predicciones sobre lo que esperaría encontrar en toda la población.

              ¿Qué tipo de predicciones, preguntas? Bueno, hay dos tipos comunes de predicciones que los investigadores intentan hacer usando estadísticas inferenciales:

              • En primer lugar, las predicciones sobre diferencias entre grupos - por ejemplo, diferencias de altura entre niños agrupados por su comida favorita o sexo.
              • Y en segundo lugar, relaciones entre variables - por ejemplo, la relación entre el peso corporal y la cantidad de horas a la semana que una persona hace yoga.

              En otras palabras, las estadísticas inferenciales (cuando se hacen correctamente), le permiten conectar los puntos y hacer predicciones sobre lo que espera ver en la población del mundo real, en función de lo que observa en sus datos de muestra. Por esta razón, las estadísticas inferenciales se utilizan para hipótesis pruebas - en otras palabras, para probar hipótesis que predicen cambios o diferencias.

              Por supuesto, cuando se trabaja con estadísticas inferenciales, el composición de su muestra es realmente importante. En otras palabras, si su muestra no representa con precisión la población que está investigando, sus hallazgos no serán necesariamente muy útiles.

              Por ejemplo, si su población de interés es una combinación de 50% hombres y 50% mujeres, pero tu muestra es 80% hombres, no puede hacer inferencias sobre la población en función de su muestra, ya que no es representativa. Esta área de estadísticas se llama muestreo, pero no entraremos en esa madriguera de conejo aquí (¡es profunda!). La guardaremos para otra publicación.

              ¿Qué estadísticas se utilizan habitualmente en esta rama?

              Hay muchos, muchos métodos de análisis estadístico diferentes dentro de la rama inferencial y sería imposible para nosotros discutirlos todos aquí. Así que solo echaremos un vistazo a algunos de los métodos estadísticos inferenciales más comunes para que tenga un punto de partida sólido.

              Primero están Pruebas T. Pruebas t comparar los medios (los promedios) de dos grupos de datos para evaluar si son estadísticamente significativamente diferentes. En otras palabras, ¿tienen medias, desviaciones estándar y sesgos significativamente diferentes?

              Este tipo de prueba es muy útil para comprender qué tan similares o diferentes son dos grupos de datos. Por ejemplo, es posible que desee comparar la presión arterial media entre dos grupos de personas, uno que ha tomado un nuevo medicamento y otro que no, para evaluar si son significativamente diferentes.

              Levantando las cosas un nivel, tenemos ANOVA, que significa "análisis de varianza". Esta prueba es similar a una prueba T en que compara las medias de varios grupos, pero ANOVA le permite analizar varios grupos, no solo dos grupos. Por lo tanto, es básicamente una prueba t con esteroides & # 8230

              A continuación, tenemos Análisis de correlación. Este tipo de análisis evalúa la relación entre dos variables. En otras palabras, si una variable aumenta, la otra también aumenta, disminuye o permanece igual. Por ejemplo, si la temperatura promedio aumenta, ¿aumentan también las ventas promedio de helados? Esperaríamos algún tipo de relación entre estas dos variables intuitivamente, pero el análisis de correlación nos permite medir esa relación científicamente.

              Por último, tenemos análisis de regresión - esto es bastante similar a la correlación en el sentido de que evalúa la relación entre variables, pero va un paso más allá para comprender causa y efecto entre variables, no solo si se mueven juntas. En otras palabras, ¿una variable realmente hace que la otra se mueva, o simplemente se mueven juntas de forma natural gracias a otra fuerza? El hecho de que dos variables se correlacionen no significa necesariamente que una cause la otra.

              Sobrecarga de estadísticas & # 8230

              Te escucho. Para que todo esto sea un poco más tangible, echemos un vistazo mira un ejemplo de una correlación en acción.

              Aquí hay un diagrama de dispersión que demuestra la correlación (relación) entre el peso y la altura. Intuitivamente, esperaríamos que hubiera alguna relación entre estas dos variables, que es lo que vemos en este diagrama de dispersión. En otras palabras, los resultados tienden a agruparse en una línea diagonal de abajo a la izquierda a arriba a la derecha.

              Como mencioné, estos son solo un puñado de técnicas inferenciales - hay muchas, muchas más. Es importante destacar que cada método estadístico tiene su propio supuestos y limitaciones.

              Por ejemplo, algunos métodos solo funcionan con datos distribuidos normalmente (paramétricos), mientras que otros métodos están diseñados específicamente para datos no paramétricos. Y es exactamente por eso las estadísticas descriptivas son tan importantes - son el primer paso para saber qué técnicas inferenciales puede y no puede usar.


              Contenido

              Los gráficos juegan un papel importante en las estadísticas y el análisis de datos. Los procedimientos aquí se pueden dividir en dos partes: cuantitativa y gráfica. Las técnicas cuantitativas son el conjunto de procedimientos estadísticos que producen resultados numéricos o tabulares. Entre los ejemplos de técnicas cuantitativas se incluyen: [1]

              Estas y otras técnicas similares son todas valiosas y se encuentran en la corriente principal en términos de análisis clásico. También hay muchas herramientas estadísticas que generalmente se denominan técnicas gráficas. Estos incluyen: [1]

              Los procedimientos gráficos, como los gráficos, son un camino corto para obtener información sobre un conjunto de datos en términos de supuestos de prueba, selección de modelos, validación de modelos, selección de estimadores, identificación de relaciones, determinación del efecto de factores, detección de valores atípicos. Los gráficos estadísticos dan una idea de los aspectos de la estructura subyacente de los datos. [1]

              Los gráficos también se pueden utilizar para resolver algunas ecuaciones matemáticas, por lo general al encontrar dónde se cruzan dos gráficos.


              1 respuesta 1

              Creo que esto es lo más cercano que puedo llegar a la primera solución actual.

              Podemos usar estrellas y barras para el numerador. El número de soluciones para $ a_1 + dots + a_k = n $ en enteros positivos es $ binom$ .

              Luego puede volver a calcular la parte superior e inferior usando la identidad del palo de hockey para obtener:

              Pero esto no funciona. ¿Por qué? Porque también contamos soluciones como $ 7 + 0 = 7 $, etc. Si quieres obtener una buena fórmula, tendrás que hacer algo similar a esto:



Comentarios:

  1. Mac Alasdair

    Das más información.

  2. Quintin

    En mi opinión, él está equivocado. Puedo demostrarlo. Escríbeme en PM, discúblalo.

  3. Bersules

    Estoy de acuerdo, este maravilloso pensamiento será útil.



Escribe un mensaje