Fórmula de la desviación: Definición y Ejemplos

La fórmula de la varianza informa a los estadísticos sobre varios aspectos de un conjunto de datos. Normalmente, se utilizan dos fórmulas ligeramente diferentes para calcular la varianza de un conjunto de datos completo y para calcular la varianza de una muestra del conjunto de datos. Además, la varianza depende de la desviación estándar, y ambos conceptos estadísticos son útiles en una variedad de escenarios.

En este artículo, exploraremos qué es la fórmula de la varianza, por qué es importante, en qué se diferencia de la desviación estándar y cómo utilizar cada fórmula para calcular la varianza de una población y una muestra pequeña.

Relacionado: Guía definitiva para entender las estadísticas descriptivas

¿Qué es la desviación?

La varianza es la media de las diferencias al cuadrado, también conocida como desviación estándar, con respecto a la media. En pocas palabras, la varianza es una medida estadística de la dispersión de los puntos de datos dentro de una muestra o conjunto de datos. Además de la media y la desviación estándar, la varianza de un conjunto de muestras permite a los estadísticos dar sentido, organizar y evaluar los datos que recogen con fines de investigación.

Esencialmente, la varianza tiene dos fórmulas que puede utilizar dependiendo del grupo de datos que esté midiendo. Por ejemplo, si está midiendo los datos de todo un conjunto de población, como las notas de toda una clase universitaria, calculará la varianza utilizando esta fórmula:

Varianza = (La suma de cada término – la media)^2 / n

Estos son los elementos de la fórmula:

  • La varianza de toda la población será el cuadrado de la desviación estándar.
  • Cada término representa cada uno de los valores o números de su conjunto de datos.
  • Deberá conocer la media de su conjunto de datos.
  • La expresión ^2 representa la función de elevar al cuadrado, o lo que es lo mismo, multiplicar un número por sí mismo.
  • La variable n representa el número de valores que tiene en su población.

Cuando se calcula la varianza de sólo una muestra de la población, se utiliza esta fórmula:

Varianza = (La suma de cada término – la media)^2 / n-1

Estos son los elementos de la fórmula:

  • La varianza es lo que quieres encontrar para tu conjunto de muestras.
  • Cada término es lo que se utiliza para restar la media, que también tendrá que conocer antes de calcular la varianza.
  • La variable n representa el número total de muestras que tiene.

Se utiliza n-1 ya que se está calculando la varianza para una muestra de toda la población en lugar de toda la población en sí.

Relacionado: Cómo calcular la desviación

Varianza frente a desviación estándar

En pocas palabras, la desviación estándar examina los valores exactos de la diferencia entre un conjunto de puntos de datos y la media de una población o muestra. La varianza, sin embargo, mide el grado medio en que cada punto de datos difiere de la media. Esto significa que la varianza se refiere a la media de todos los valores del conjunto de datos, mientras que la desviación estándar se refiere a la valoración exacta de la dispersión de los datos.

Aunque existe esta ligera diferencia entre estos dos conceptos, la varianza y la desviación típica dependen la una de la otra. Cuando se encuentra la desviación estándar dentro de un conjunto de muestras o de una población entera, se puede elevar al cuadrado este resultado para obtener la varianza. Aunque esta es la relación más sencilla entre la varianza y la desviación estándar, representa la necesidad de entender cómo funcionan ambos cálculos para proporcionar una visión de los diferentes aspectos de los datos que se estudian.

Además, la desviación estándar representa el rango relativo de un conjunto de datos y no tiene en cuenta los valores atípicos en cualquier dirección de la media estándar. La varianza, por el contrario, representa todas las variables de cambio o diferencia dentro del conjunto de datos, incluidos los valores atípicos relativos a cada lado de la media. Sin estos dos factores estadísticos, no habría diversidad dentro del rango de datos del conjunto de la muestra, lo que significa que los valores del conjunto de datos se agruparán más en torno a la media en lugar de dispersarse, de forma similar a una curva de campana.

Relacionado: Cómo Calcular la Desviación Estándar Relativa: Fórmula y Ejemplos

Cómo calcular la varianza de un conjunto de datos

En estadística, se puede calcular la varianza de todo el conjunto de datos, como un informe anual de ventas que enumera las ventas netas totales de cada día durante el año. También se puede calcular sólo una muestra de todos los puntos de datos. En el ejemplo de un simple informe de ventas anual, una muestra podría ser los totales de ventas del verano. En este caso, los estadísticos medirían el conjunto de la muestra dentro de un rango de fechas específico. En ambos ejemplos, se puede calcular la varianza utilizando una de las dos fórmulas:

Cálculo de la varianza de todo un conjunto de datos

Si se mide el conjunto de datos completo, utilice los siguientes pasos para la fórmula de la varianza para conjuntos de datos completos:

Varianza = (La suma de cada término – la media)^2 / n

  1. Reste la media de cada valor de su conjunto de datos. Su primer paso es restar la media de su población de cada uno de los términos de su conjunto. Por ejemplo, suponga que tiene una población de tres puntos de datos. Restará el valor medio de cada uno de estos tres términos. Aquí's un ejemplo asumiendo que el valor medio de una población es 35: (108-35, 100-35, 78-35) donde cada término resta 35.
  2. Cuadra cada una de estas diferencias. Una vez que haya restado la media de todos sus términos, eleve al cuadrado cada uno de estos resultados multiplicando el valor por sí mismo. Utilizando el ejemplo de arriba, esto es lo que se vería: (73), (65), (43) y cada uno de estos términos elevados al cuadrado da como resultado (5.329), (4.225) y (1.849), respectivamente.
  3. 6. Suma todos los cuadrados resultantes. Suma estos nuevos valores para llegar a una suma total, así (5,329) + (4,225) + (1,849) = 11,403.
  4. Divida la suma resultante entre el número de valores de su conjunto de datos. Ahora puede dividir la suma del tercer paso por el número total de valores que tiene en la población que está midiendo. Utilizando los valores de ejemplo de los pasos anteriores, la suma que se utiliza para dividir es 11.403 y el valor que se utiliza para n es tres, ya que sólo hay tres términos en la población de ejemplo. Esto es lo que se vería: (11,403) / (3) = 3,801. Por tanto, la varianza de toda la población es de 3.801.

He aquí una versión simplificada del ejemplo anterior:

σ2 = ((108-35)^2 + (100-35)^2 + (78-35)^2) / 3
= (73^2 + 65^2 + 43^2) / 3
= (5,329 + 4,225 + 1,849) / 3
= 11,403 / 3
= 3,801

Relacionado: Cómo Calcular la Desviación Estándar Relativa: Fórmula y Ejemplos

Cálculo de la varianza dentro de una muestra de los datos

Si está midiendo sólo una muestra de todo el conjunto de datos, se basará en la fórmula que tiene en cuenta esto con el término n-1. Al igual que la fórmula de la varianza para una población entera, usted's comenzará esta fórmula de la misma manera. Siga los pasos siguientes:

Varianza = (La suma de cada término – la media)^2 / (n-1)

  1. Reste la media de cada valor de su conjunto de muestras. Al igual que harías con un conjunto de datos completo, resta la media de cada uno de los términos de tu muestra. Este es un ejemplo, suponiendo que la media es 25 y que tiene tres valores en su muestra: (33-25), (16-25), (45-25). Sus diferencias darán como resultado (8), (-9) y (20), respectivamente.
  2. Cuadrar cada una de estas diferencias. Después de obtener cada una de las diferencias, sigue adelante y eleva al cuadrado cada uno de estos valores. Utilizando los valores de ejemplo del paso anterior, aquí están los productos resultantes: (64), (81) y (400). Con este ejemplo, puedes ver cómo el valor (-9) se eleva al cuadrado para darte un valor positivo. Esto es importante y esencial para la varianza, ya que la varianza es más bien un promedio de los puntos' de dispersión de la media.
  3. Suma todos los cuadrados resultantes. Al igual que la fórmula de desviación anterior, sume todos los productos resultantes del segundo paso: (64) + (81) + (400) = 545.
  4. Reste uno del número total de valores de su conjunto de muestras. Antes de dividir, reste uno al número de valores de su conjunto de muestras. Utilizando el ejemplo anterior, sólo tienes tres términos. Introduzca tres en la parte n-1 de la fórmula: n-1 = (3) – 1. El resultado es dos.
  5. Dividir la suma por la diferencia resultante de n-1. Por último, divida la suma del paso tres entre dos, ya que ésta es la diferencia resultante a la que llegó en el paso cuatro. Utilice los valores del ejemplo anterior para dividir: (545) / (2) = 272.5. Por tanto, la varianza del conjunto de muestras de ejemplo es igual a 272,5.

σ2 = ((33-25)^2 + (16-25)^2 + (45-25)^2) / (3-1)
= (8^2 + -9^2 + 20^2) / (3-1)
= (64 + 81 + 400) / (3-1)
= 545 / (3-1)
= 545 / 2
= 272.5

Relacionado: Cómo calcular el coeficiente de variación con ejemplos

Varianza de la población frente a la varianza de la muestra

La varianza de una pequeña muestra de toda una población o conjunto de datos sólo ofrece a los investigadores y estadísticos una perspectiva limitada de lo que realmente ocurre en toda la población. La varianza de la población, sin embargo, puede dar a los estadísticos una representación más precisa sobre el rango de datos y su relación con la media. He aquí algunos ejemplos de cómo funciona esto:

Ejemplo de variación de la población

Supongamos que un estadístico quiere medir la varianza de los pesos de una población de cebras en una reserva natural. El estadístico encontrará primero la media de los pesos de la población y luego restará ese valor de cada valor de peso. Supongamos que hay cinco cebras en la reserva. El estadístico mide el peso de cada cebra en los siguientes valores:

  • Cebra 1: 670 libras
  • Zebra 2: 765 libras
  • Zebra 3: 780 libras
  • Cebra 4: 820 libras
  • Zebra 5: 735 libras

A continuación, el estadístico suma todos estos valores para obtener 3.770 libras totales. Dividen este valor por cinco, ya que cinco es el número de cebras de toda la población. La media resultante es 754. Esto significa que el peso medio de las cinco cebras del coto es de 754 libras. A continuación, el estadístico resta este valor medio del peso de cada cebra:

  • 670 – 754 = -84
  • 765 – 754 = 11
  • 780 – 754 = 26
  • 820 – 754 = 66
  • 735 – 754 = -19

El estadístico eleva al cuadrado cada una de estas diferencias antes de sumar los productos resultantes:

  • (-84)^2 = 7,056
  • (11)^2 = 121
  • (26)^2 = 676
  • (66)^2 = 4,356
  • (-19)^2 = 361

(7,056) + (121) + (676) + (4,356) + (361) = 12,570

A continuación, el estadístico divide esta suma entre el número de cebras de la población: (12,570) / (5) = 2,514. Este valor representa la varianza de toda la población.

Ejemplo de desviación de muestra

Si el conjunto de cinco cebras del ejemplo representa una muestra de una población mayor, el estadístico restará uno de cinco antes de dividir. Esto es lo que parecerá:

(12,570) / (5-1) = 12,570 / 4 = 3,142.5. Esto significa que la varianza de sólo esa pequeña muestra sería entonces de 3.142,5.

¿Cuál es la importancia de la desviación?

La varianza permite a los estadísticos comprender la amplitud de la diversidad en una muestra o en toda la población, ya que la varianza suele dar cuenta de cualquier valor atípico dentro de la población. La fórmula de la varianza también es útil en muchas situaciones empresariales, como la medición y evaluación de las cifras de ventas, el desarrollo de productos basados en estudios de mercado y muchos otros usos aplicables que pueden beneficiar a las empresas y organizaciones.

Además de los usos comerciales, los estadísticos se basan en la varianza para comparar diferentes números dentro de un rango de datos. Dentro de un conjunto de datos, la varianza es extremadamente importante para rastrear los valores atípicos, es decir, los puntos de datos que se alejan de la media. Cuanto más se acerque a cero la varianza, más agrupado estará el conjunto de datos. Cuando la varianza tiene un valor más alto y, sobre todo, se expresa como un cociente, los puntos de datos están más separados (y, por tanto, son más diversos).

Te recomendamos

FAQ: ¿CÓMO FUNCIONA LA AUTENTICACIÓN MULTIFACTORIAL? ¿Cómo funciona la autenticación multifactorial?

¿Qué es el tipo de personalidad social? (Con trayectorias profesionales)

Cómo escribir un correo electrónico solicitando algo en 6 pasos

Cómo convertirse en un técnico veterinario

Cómo medir el compromiso de los empleados

4 Etapas del crecimiento empresarial: Definiciones y consejos para navegar por cada etapa