Un estadístico puede utilizar una muestra de una población mayor para calcular cantidades estadísticas que den información sobre la población mayor. La media muestral es una estadística que indica el estándar de normalidad de un conjunto de datos determinado. La media muestral, la varianza, el error estándar y la varianza pueden utilizarse para averiguar la desviación estándar de una población determinada.
En este artículo, exploramos qué son la media muestral, la varianza y el error estándar y cómo calcular la media muestral.
Aprenda a ser un analista de datos
¿Qué es la media de la muestra?
La media muestral puede utilizarse para determinar la tendencia central, la desviación estándar y la varianza de un conjunto de datos. La media muestral puede utilizarse para determinar las medias de la población, además de otros usos diversos. En los sectores profesionales que utilizan datos estadísticos, por ejemplo:
- Campos científicos como la ecología, la biología y la meteorología
- Campos de la medicina y la farmacología
- Datos e informática, tecnología de la información y ciberseguridad
- Industria aeroespacial y aeronáutica
- Campos de la ingeniería y el diseño
Cómo calcular la media muestral
Calcular la media muestral es tan sencillo como sumar el número de artículos de un conjunto de muestras y dividir esa suma entre el número de artículos del conjunto de muestras. Para calcular la media muestral mediante programas de hojas de cálculo y calculadoras, puede utilizar la fórmula
x̄ = ( Σ xi ) / n
Aquí, x̄ representa la media de la muestra, Σ nos dice que hay que sumar, xi se refiere a todos los valores X y n representa el número de elementos del conjunto de datos.
Al calcular la media de la muestra utilizando la fórmula, introducirá los valores de cada uno de los símbolos. Los siguientes pasos le mostrarán cómo calcular la media muestral de un conjunto de datos:
- Suma las partidas del ejemplo
- Dividir la suma por el número de muestras
- El resultado es la media
- Utiliza la media para hallar la varianza
- Utilice la varianza para hallar la desviación típica
1. Suma los elementos de muestra
En primer lugar, tendrá que contar cuántos artículos de muestra tiene dentro de un conjunto de datos y sumar la cantidad total de artículos. Veamos un ejemplo:
Un profesor quiere encontrar la puntuación media de un alumno de su clase. El conjunto de muestras del profesor tiene siete puntuaciones diferentes en los exámenes: 78, 89, 93, 95, 88, 78, 95. Suma todas las puntuaciones y obtiene una suma de 616. Puede utilizar esta suma en el siguiente paso para hallar su media muestral.
2. Divida la suma por el número de muestras
A continuación, divide la suma del primer paso entre el número total de artículos del conjunto de datos. Utilizando al profesor como ejemplo, esto es lo que parece:
El profesor utiliza la suma de 616 para encontrar la puntuación media. Divide 616 entre siete, ya que el número de puntuaciones en su conjunto de datos era de siete. El cociente resultante es 88.
3. El resultado es la media
Después de dividir, el cociente resultante se convierte en la media de la muestra, o el promedio. En el ejemplo del profesor:
Las puntuaciones de los estudiantes que estaba calculando dieron como resultado una nota media del 88%. Puede utilizar la media muestral para calcular además la varianza, la desviación estándar y el error estándar.
Relacionado: Habilidades para la resolución de problemas: Definiciones y ejemplos
4. Utilice la media para hallar la varianza
Puede utilizar la media de la muestra en otros cálculos encontrando la varianza de la muestra de datos. La varianza representa la dispersión de cada uno de los elementos de la muestra dentro de un conjunto de datos. Para calcular la varianza, se encuentra la diferencia entre cada elemento de datos y la media. Utilizando el ejemplo del profesor, veamos cómo funciona:
El profesor quiere encontrar la varianza de las puntuaciones de sus alumnos, así que calcula la varianza encontrando primero la diferencia entre la puntuación media y las siete puntuaciones de los alumnos que utilizó para encontrar la media:
( 78-88, 89-88, 93-88, 95-88, 88-88, 78-88, 95-88) = (-10, 1, 5, 7, 0, -10, 7).
A continuación, el profesor eleva al cuadrado cada diferencia (100, 1, 25, 49, 0, 100, 49) y, al igual que la media, suma todos los números y los divide por siete. Obtiene 324 / 7 = 46,3, es decir, aproximadamente 46. Cuanto mayor es la varianza, más se alejan los datos de la media.
5. Utilizar la varianza para encontrar la desviación estándar
También puede llevar la media de la muestra aún más lejos calculando la desviación estándar del conjunto de la muestra. La desviación estándar representa la tasa de distribución normal de un conjunto de datos, y es la raíz cuadrada de la varianza. Veamos un ejemplo:
El profesor utiliza la varianza de 46 para encontrar la desviación estándar: √46 = 6,78. Este número le dice al profesor cuánto está por encima o por debajo de la media del 88% de su estudiante en cualquier puntuación de la prueba en el conjunto de la muestra.
¿Cuál es la varianza de la distribución muestral de la media?
La varianza de un conjunto de datos se refiere a la dispersión de los elementos dentro del conjunto de la muestra. Cuando los estadísticos calculan la varianza, intentan averiguar la distancia entre los elementos al representar los datos en un gráfico. La varianza puede indicar la diferencia de cada elemento de un conjunto de muestras. Además, la media, la varianza, la desviación estándar y el error de la muestra pueden analizarse para suponer y predecir resultados y tendencias sobre una población, así como sobre un muestreo de esa población.
Relacionado: Habilidades analíticas: Definiciones y ejemplos
¿Cuál es el error estándar de la media muestral?
El error estándar de la media (SEM), o desviación estándar, representa lo lejos que está la media de la muestra de la verdadera media de la población. Por ejemplo, en el ejemplo de un profesor, la muestra era de un solo alumno. La media, la varianza y la desviación de la muestra representan los datos de esa muestra únicamente, y el error estándar puede utilizarse para comparar los datos de la muestra con los de toda la población.
Por ejemplo, la población total podría ser toda la clase, todo el décimo grado o toda la población de estudiantes. En cualquiera de estas situaciones, el error estándar de la media de la muestra estaría representado por lo lejos que está la puntuación media del estudiante de la puntuación media de toda la población.