5 Herramientas básicas de estadística y cómo elegir la correcta

Conocer estos patrones y anomalías en la vida personal y profesional de las personas puede descubrirse con sencillas herramientas estadísticas. Con estas herramientas se pueden descubrir. Así que debes entender cómo funcionan estas herramientas para interpretar correctamente los resultados de la investigación y diseñar tus propios experimentos.

En este artículo, analizamos cuándo puede utilizar las herramientas estadísticas básicas, cinco de las más utilizadas y consejos para elegir una para su situación.

¿Para qué sirven las herramientas estadísticas básicas?

Los datos empresariales de cualquier tipo pueden analizarse y comprenderse con herramientas estadísticas básicas. Los registros de ventas, los costes de material y las previsiones de mercado, entre otras cosas, pueden estudiarse y comprenderse utilizando herramientas estadísticas. Puede utilizar las herramientas estadísticas para reconocer patrones y hacer previsiones sobre las ventas futuras, o para decidir si debe investigar más a fondo determinadas cuestiones. Otras herramientas estadísticas le ayudan a manejar masas de datos cuando no sabe por dónde empezar.

Los profesionales de las finanzas podrían utilizar herramientas estadísticas básicas para comprender el rendimiento de la empresa, mientras que los profesionales del marketing podrían utilizarlas para realizar una encuesta a los clientes o usuarios. Los desarrolladores de productos podrían analizar las reacciones de los clientes a los productos actuales, y los ejecutivos o propietarios de empresas podrían utilizar este tipo de análisis para informar sobre planes y acciones estratégicas. Los profesionales del ámbito académico o de la investigación suelen utilizar herramientas estadísticas para comprender las acciones y reacciones humanas, animales y materiales.

5 herramientas estadísticas básicas

A continuación se presentan cinco herramientas básicas de análisis estadístico y las situaciones adecuadas para utilizarlas:

1. Regresión

La regresión es un método para comparar dos variables cuando una de ellas es independiente y la otra, o las otras, dependen de esa primera variable. Existen diferentes métodos de regresión en función del número de variables que se analicen. Una vez que se calcula la regresión para un conjunto de datos, se pueden predecir los resultados futuros en función de los valores de la variable independiente. La regresión se centra en las tendencias, por lo que es importante combinar un análisis de regresión con la interrogación y el análisis de cualquier punto de datos periférico que se aleje de lo esperado.

Y = a + mx + e

Cuando:

Y = la variable independiente

a = el intercepto Y, el valor de Y cuando X = 0

m = la pendiente de la línea de datos

x = la variable dependiente

e = el término de error, que se utiliza cuando se hacen previsiones con la fórmula de regresión

Ejemplo: La panadería Better Bakery está tratando de pronosticar cuántas rosquillas venderán si saben cuántas exhiben. La variable independiente es el número de donas que exhiben, y el número vendido es la variable dependiente. No venden ningún donut cuando no tienen ninguno expuesto, por lo que su valor es cero.Un jueves, tenían 48 donuts en exposición y vendieron 36. El viernes, tenían 60 donuts en exposición y vendieron 45. La aplicación de la fórmula a ambos días les permite comprender la pendiente de su regresión de los donuts:

Jueves: 48 donuts mostrados = 0 + (m x 36)

Viernes: 60 = 0 + (m x 45)

En estas dos ecuaciones, m = 0,75, por lo que la panadería puede utilizarlo en la ecuación para proyectar cuántos donuts venderá en el futuro.

Relacionado: ¿Qué le dice el análisis de regresión?

2. 4. Cálculo de la media

La media de un conjunto de datos, también llamada promedio, puede ser útil para entender cómo se organizan los datos dentro de un conjunto y dónde se producen los números con mayor frecuencia. Funciona mejor cuando se trata de obtener una idea general del tamaño de una sola operación o evento. Combinar la media con otra información, como la moda y el rango del conjunto de datos, puede ser útil para entender la media de forma más completa. La fórmula para calcular la media es:

(Suma de todos los puntos de datos del conjunto) / (número de puntos de datos del conjunto) = media del conjunto de datos

Ejemplo: September Sales and Distributing realizó cinco ventas en un día, por un total de 3.000 $, 5.500 $, 2.000 $, 4.000 $ y 6.500 $. Para calcular la venta media de ese día, suman las ventas y las dividen entre cinco:

(3.000 dólares + 5.500 dólares + 2.000 dólares + 4.000 dólares + 6.500 dólares) / 5 = media o promedio

21.000 $ / 5 = 4.200 $ = tamaño medio de cada venta del día

Relacionado: Cómo Calcular la Media (Con Ejemplos)

3. Desviación estándar

La desviación estándar mide cómo se distribuyen los datos en su rango. Un conjunto de datos con una desviación estándar grande tiene puntos de datos repartidos en un área amplia, mientras que un conjunto de datos con una desviación estándar pequeña tiene la mayoría de sus datos agrupados. La desviación estándar puede ser más útil cuando los datos se encuentran en un rango razonable y no hay demasiados valores atípicos. Hay dos fórmulas para calcular la desviación estándar, dependiendo de si se tiene sólo una muestra de datos o el conjunto completo de datos de toda la población.

s = √([Σ(xi – media de todos los valores de x)2] / [N – 1])

Cuándo:

s = desviación estándar de la muestra

xi = valores observados de 1 a N

N = número de observaciones

Ejemplo: Mouse Greenhouse mide la variación de sus ventas de bolsas de abono durante las 12 semanas de verano. Calculan la desviación estándar de sus ventas semanales durante todo el verano calculando primero la media de sus totales de ventas semanales.

A continuación, para cada semana de ventas, xi en la fórmula, restan la media del total de esa semana y elevan el resultado al cuadrado. Toman la suma de todos estos cuadrados y la dividen por el número de observaciones menos uno, en este caso, 11. Toman la raíz cuadrada de ese resultado y hallan la desviación estándar, que para esta muestra es de seis. Esto significa que, en la mayoría de las semanas de verano, el número de sacos de abono que vendan estará dentro de seis de su media de ventas semanales.

Relacionado: Cómo calcular la desviación estándar: Qué es y cómo utilizarla

4. Determinación del tamaño de la muestra

La determinación del tamaño de la muestra es el proceso de elegir los datos adecuados para analizar de un conjunto grande. Un tamaño de muestra correctamente elegido puede proporcionarle los mismos resultados que el análisis de toda la muestra, pero es más eficiente ya que implica menos procesamiento. Estos son los factores que hay que tener en cuenta al calcular el tamaño de la muestra:

  • Tamaño total de la población: Este es el tamaño máximo de todos los datos posibles. Si ha completado su investigación, el tamaño total de la población es el número de puntos de datos o respuestas que ha obtenido, mientras que si está diseñando un estudio, el tamaño total de la población es el número máximo de puntos de datos posibles.

  • Margen de error: Determina el grado de error que está dispuesto a aceptar en su estudio.

  • Nivel de confianza: Es el porcentaje de probabilidad de que sus resultados, como una media calculada, estén dentro de la media real de todo el conjunto de datos. Después de determinar el nivel de confianza necesario, normalmente el 90% o más, utilice una tabla para encontrar la puntuación z que se corresponde con el nivel de confianza elegido.

  • Desviación estándar: Esta es la cantidad de variación que se espera en los datos.

Tamaño de la muestra = (puntuación z2 x desviación estándar x [1 – desviación estándar]) / margen de error** 2**

Relacionado: Cómo calcular el tamaño de la muestra necesaria para su encuesta o estudio

5. Pruebas de hipótesis

La comprobación de hipótesis es un proceso utilizado para determinar si los datos apoyan una hipótesis específica. Puede realizar la prueba de hipótesis determinando primero qué fórmula específica espera que sea cierta. Este resultado esperado se convierte en su primera hipótesis, o H1. El resultado inesperado es la hipótesis nula, o H0. Es importante tener en cuenta que las fórmulas de las pruebas de hipótesis dependen de lo que se esté analizando y probando. Por ejemplo, las hipótesis pueden ser fórmulas específicas que relacionan las dos variables entre sí, de modo que algunos resultados numéricos significarían que H1 es verdadera, mientras que otros muestran directamente que H0 es verdadera.

H0: A ≠ B

H1: A = B

Cuándo:

A = datos sobre el valor o la variable que el estadístico está estudiando

B = las predicciones del investigador' s

Ejemplo: Smooth Storage Solutions cree que sus clientes utilizan sus camiones de alquiler más grandes para las mudanzas de más de 100 millas, por lo que ésta es su primera hipótesis:

H1: Promedio de millas > 100 por viaje

La hipótesis nula sería cualquier circunstancia en la que ellos' están equivocados:

H0: Promedio de millas < 100 por viaje o promedio de millas = 100 por viaje

Comprueban los cuentakilómetros de sus camiones antes y después de cada alquiler y descubren que todos los viajes fueron de al menos 200 millas, por lo que tienen razones para creer que su primera hipótesis es cierta.

Consejos para elegir una herramienta de estadística básica

A continuación se ofrecen algunos consejos y consideraciones a la hora de decidirse por una herramienta estadística básica:

Tenga en cuenta la fase de recopilación de datos

Si sólo está diseñando un estudio para averiguar algo específico, puede utilizar una herramienta como la determinación del tamaño de la muestra para ayudarle a decidir cuántas encuestas o experimentos debe realizar. Otras herramientas, como la regresión o el cálculo de la media, son diferentes formas de analizar los datos que ya has recopilado. Si estás en medio de la recopilación de información, puedes considerar la determinación del tamaño de la muestra para medir si tienes suficientes datos para obtener resultados fiables o probar algún análisis temprano a través de la regresión para medir los datos posteriores y ver si tu nueva información refuerza los patrones anteriores.

Considere el tamaño de sus datos

Algunas herramientas son mejores para conjuntos de datos más grandes. Si tiene una encuesta de clientes o cifras de ventas semanales, podría utilizar herramientas diferentes que si' está comparando cuatro resultados de cada trimestre financiero o dos productos diferentes. Si no está seguro de qué herramientas son mejores para conjuntos más grandes o más pequeños, puede investigar estudios similares que su institución o empresa haya realizado en el pasado para comparar métodos y resultados.

Investiga cada herramienta antes de usarla

Aunque estas son algunas de las herramientas más comunes y útiles en estadística, es importante entender exactamente cómo funcionan antes de aplicarlas. Entender si hay que utilizar la desviación estándar de la muestra o la desviación estándar de la población, por ejemplo, puede ayudarle a entender cómo interpretar los resultados que obtenga. También puede aprender más sobre qué herramientas son apropiadas tomando una clase de estadística o aprendiendo de un compañero de trabajo sobre las expectativas y los procedimientos de su organización para utilizar el análisis estadístico.