La varianza es una medida estadística que describe la dispersión de un conjunto de variables con respecto al valor medio del conjunto. A través de su papel en el cálculo de la desviación estándar, se describe la dispersión de los conjuntos de datos. Si eres un científico o un analista de datos, es posible que necesites conocer este procedimiento estadístico fundamental.
En este artículo, definimos la varianza, cómo calcularla y otras cosas que necesitas saber sobre la varianza como estadístico.
¿Qué es la varianza?
Al recoger los datos, las variables aleatorias se miden en términos de su distancia a la media del conjunto. La varianza describe la medida estadística de la dispersión en relación con las variables aleatorias de un conjunto. También informa a los estadísticos sobre la dispersión del conjunto de datos, la distancia de cada variable respecto a la media y, a su vez, la distancia entre las variables. La inferencia estadística, las pruebas de hipótesis, los métodos de muestreo de Montecarlo y los análisis de bondad de ajuste se basan en la varianza.
Esta herramienta se utiliza mucho en la inversión para determinar el rendimiento individual de todas las partes de una cartera de inversión. Esto ayuda a los gestores de activos y a los inversores a mejorar el rendimiento de sus inversiones. Sin embargo, varios profesionales utilizan la varianza de alguna manera—no se limita a los inversores.
Otros profesionales que podrían utilizar la varianza son los científicos, los estadísticos, los matemáticos, los analistas de datos y cualquier persona responsable de identificar el riesgo o determinar la información sobre la población de un experimento o muestra.
En algunos casos, la varianza y la desviación estándar se pueden utilizar indistintamente, y alguien podría elegir la desviación estándar en lugar de la varianza porque es un número más pequeño, que en algunos casos podría ser más fácil de trabajar y es menos probable que se vea afectado por la inclinación. Para hallar la desviación estándar, basta con tomar la raíz cuadrada de la varianza. Con este número, se pueden hacer los mismos tipos de inferencias que se harían si se utilizara la varianza, pero con cálculos más pequeños.
Relacionado: Cómo realizar un análisis de riesgos
Cómo calcular la varianza
Para calcular la varianza, hay que elevar al cuadrado cada desviación de una variable dada (X) y la media.
En un conjunto de datos de muestra, se restaría cada valor de la media individualmente, y luego se elevaría el valor al cuadrado, así:(μ – X)² . A continuación, se suman todas las desviaciones al cuadrado y se dividen por el número total de valores para obtener una media. Este número es la varianza.
Para hallar la desviación estándar, basta con tomar la raíz cuadrada de la varianza.
La fórmula de la varianza es la siguiente:
Var(X) = E (x – μ)** ² / N**
La fórmula muestra que la varianza de X (Var[X]) es igual a la media del cuadrado de X menos el cuadrado de su media. Y se puede resolver dividiéndola entre el número de números de un conjunto, o N.
Cómo utilizar los datos de varianza
En una evaluación de riesgos, los inversores utilizan la media para determinar la variabilidad que podría equivaler al riesgo dentro de una cartera. Esto se suele utilizar cuando se considera una nueva compra para decidir si la inversión merece el riesgo. La varianza ayuda a los analistas de riesgos a determinar una medida de incertidumbre, que sin la varianza y la desviación estándar es difícil de cuantificar.
Aunque la incertidumbre no se puede medir expresamente, la varianza y la desviación estándar permiten a los analistas determinar el impacto estimado que una acción concreta podría tener en una cartera.
En estadística, los científicos y los estadísticos utilizan la varianza para determinar lo bien que la media representa un conjunto de datos.
Por ejemplo, cuanto más alta sea la varianza, más rango existe dentro del conjunto. Los científicos de datos pueden utilizar esa información para deducir que la media puede no reflejar el conjunto tan bien como lo haría si el conjunto tuviera una varianza menor. Los investigadores pueden buscar la varianza entre los grupos de prueba para determinar si son lo suficientemente similares como para probar una hipótesis con éxito.
Relacionado: Ejemplos de currículos de analistas financieros
Ventajas de utilizar la varianza
La mayor ventaja de utilizar la varianza es obtener información sobre un conjunto de datos. Tanto si se trata de un inversor que busca mitigar el riesgo como de un estadístico que necesita comprender la dispersión de una muestra, la varianza es una información que se puede utilizar para hacer rápidas inferencias.
Es más rápido utilizar una varianza que trazar cada número en una dispersión y determinar la distancia aproximada a la media de cada variable. Esta medida permite a las personas que utilizan la estadística realizar estimaciones importantes con un cálculo relativamente rápido que proporciona información suficiente sobre el rango de una muestra.
La varianza trata todos los números de un conjunto por igual, independientemente de si son positivos o negativos, lo que constituye otra ventaja de utilizar esta fórmula.
Relacionado: Tipos de gráficos y diagramas
Desventajas de usar la varianza
Una desventaja del uso de la varianza es que los valores periféricos más grandes en el conjunto pueden causar cierta desviación de los datos, por lo que no es necesariamente un cálculo que ofrezca una precisión perfecta. Esto se debe a que, una vez elevados al cuadrado, los valores atípicos de cualquier lado de la población pueden tener un peso significativo asociado en función de los valores del resto de la muestra.
Esto se ve agravado por el hecho de que algunos investigadores prefieren trabajar con números más pequeños, por lo que podrían preferir trabajar en desviaciones estándar, que toma la raíz cuadrada de la varianza y es menos probable que se incline fuertemente hacia números altos. La varianza también puede ser difícil de interpretar, lo cual es otra razón por la que su raíz cuadrada podría ser preferible.
Ejemplo de variación
En este ejemplo de inversión, digamos que la rentabilidad de sus acciones es del 10% en el primer año de inversión, del 20% en el segundo y del 15% en el tercero. La rentabilidad media es del 15%.
Ahora, tomemos la diferencia de cada rendimiento y el rendimiento medio, que se ve así:
Retorno | Rendimiento medio | |
---|---|---|
Primer año | 10% – 15% = -5% | -5%² = 25% |
Segundo año | 20% – 15% = 5% | 5%² = 25% |
Tercer año | 15% – 15% = 0% | 0%² = 0 |
Ahora, debemos sumar los tres años y dividir para hallar la media:
25% + 25% + 0% = 50%
50% / 3 = 16.667%
Según este ejemplo, la varianza de los rendimientos de las acciones es de casi el 17%.