No se encontraron resultados
No podemos encontrar nada con ese término en este momento, intenta buscar algo distinto.
Calculadora de media, mediana y moda en estadística. Utilice esta calculadora para obtener la media, la mediana, la moda, el rango y el promedio de cualquier conjunto de datos.
Resultado | |||
---|---|---|---|
Media x̄ | 16.75 | Valores atípicos | 6, 33, 35 |
Mediana x̃ | 15 | Cuartil Q1 | 12.5 |
Moda | 15 apareció 3 veces | Cuartil Q2 | 15 |
Rango | 29 | Cuartil Q3 | 16 |
Mínimo | 6 | Rango intercuartílico IQR | 3.5 |
Máximo | 35 | ||
Suma | 201 | ||
Conteo n | 12 |
Hubo un error con tu cálculo.
Mirar tablas y gráficos de datos estadísticos puede ser difícil de interpretar para nosotros. A menudo necesitamos resumir conjuntos de datos e identificar características importantes para obtener información más útil de las estadísticas.
En estadística, se utilizan diferentes medidas para resumir los datos. Algunas describen la parte central de los datos; se les llama medidas de tendencia central. Otras describen cuán dispersos están los valores de los datos; se llaman medidas de dispersión. Otras, llamadas medidas de posición, revelan la proporción de los datos que es menor que un valor dado.
El objetivo principal de esta calculadora es determinar medidas de tendencia central (la media y la mediana) que pueden representar el valor típico o central en un conjunto de datos. El propósito secundario de esta calculadora es determinar el grado de variación en un conjunto de datos calculando el rango, los cuartiles y el rango intercuartil.
La media es la suma de los valores dividida por el número total de valores. Es más fácil de entender y calcular usando la siguiente fórmula que nos sirve para calcular la media de una muestra:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
La fórmula para el promedio de la población es:
$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$
Aquí, el numerador representa la suma de los valores en el conjunto de datos. Y el denominador representa el número de valores en el conjunto de datos.
La característica principal de usar la media aritmética es que involucra todos los puntos de datos presentes en el conjunto de datos.
La principal limitación de la media es que es muy sensible a los valores extremos que son demasiado grandes o demasiado pequeños. Dichos valores se conocen como valores atípicos y afectan significativamente el promedio.
Tenga en cuenta también que el valor promedio no es necesariamente el valor típico de los datos. El valor medio puede ser un valor que no está presente en absoluto en el conjunto de datos.
La población está formada por todo el conjunto de valores sobre los que se obtiene información, y la muestra está formada por un grupo más pequeño tomado de la población.
El método para calcular el valor medio es el mismo tanto para muestras como para poblaciones. Sólo cambian las designaciones.
Si x₁, x₂,..., x_n es una muestra, la media se denomina media muestral y se representa con el símbolo x̄.
El promedio de la población se denota con la letra griega 𝜇.
Recuerde que en estadística usamos la letra minúscula n para indicar el tamaño de la muestra y la letra mayúscula n para indicar el tamaño de la población.
Veamos el siguiente ejemplo: Luigi es un chef de primera y fanático de la pizza. Ha decidido abrir su pizzería en Bali. Para encontrar un inversor, escribe un plan de negocios. Y para valorar el desempeño financiero futuro, quiere determinar el costo promedio de la pizza en diferentes restaurantes de la isla.
Investigó un poco sobre el precio de la pizza Margherita en los restaurantes de Bali y obtuvo un conjunto de datos de los precios. Para facilitar el cálculo, descartemos los últimos tres ceros y especifiquemos el número en miles. Es decir, 60 en nuestros cálculos significará 60 000 rupias indonesias.
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Luigi no ha visitado todas las pizzerías de la isla. Seleccionó al azar 20 de ellas. Por lo tanto, estamos ante una muestra.
Calculemos el valor promedio para este conjunto de datos usando la fórmula:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Terminamos con x̄ = 71,9.
La investigación de Luigi muestra que 71.900 rupias indonesias es el precio promedio de una pizza Margherita en Bali. Ahora puede basar sus cálculos en este precio.
La mediana es una medida posicional que representa el valor promedio de un conjunto de datos dispuestos en orden ascendente o descendente.
Al calcular la mediana, tratamos de encontrar un número que divida el conjunto de datos por la mitad. La mitad de los valores de los datos son menores que la mediana y la otra mitad son mayores que la mediana. Es por eso que cuando determinamos la mediana manualmente sin una calculadora de mediana, necesitamos ordenar los valores en orden ascendente o descendente.
El cálculo de la mediana difiere dependiendo de si el número de observaciones en el conjunto de datos es par o impar.
Si el número total de elementos es impar, es decir, n o n es impar, se aplica la siguiente fórmula:
$$Mediana=(\frac{n+1}{2})\ elemento$$
Sin embargo, si el número de elementos es par, lo que significa que n es un número par, entonces se usa la siguiente fórmula:
$$Mediana=\frac{\left[(\frac{n}{2})\ elemento+(\frac{n}{2}+1)\ elemento\right]}{2}$$
La principal ventaja de utilizar la mediana es que se ve menos afectada por valores extremadamente altos o extremadamente bajos.
Para un conjunto dado de veinte valores,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Podemos calcular la mediana de la siguiente manera:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Si n es impar, elegimos el valor promedio de los datos como la mediana. Si n es par, encontramos la media aritmética de los dos valores de en medio. Súmelos y divida la suma entre 2.
20 es un número par.
Los valores centrales en nuestra muestra son 69 y 70. Encontramos la mediana de esta manera:
$$Mediana = \frac{69 + 70}{2} = 69,5$$
Si Luigi tuviera un conjunto de 21 valores, por ejemplo,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70
Podría ordenar los valores de la siguiente manera:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160
y seleccionar el valor en el centro el de la posición 11, es decir, 70.
Tanto la media como la mediana se utilizan como medidas de tendencia central. Pero es importante saber en qué se diferencian.
Una diferencia importante entre la media y la mediana es que la fórmula de la media utiliza todos los valores del conjunto de datos. Por el contrario, la fórmula para la mediana depende solo del número medio o dos de los números medios.
Esto es especialmente importante para conjuntos de datos en los que uno o más números son inusualmente grandes o inusualmente pequeños. Estos números se denominan valores atípicos. En la mayoría de los casos, estos valores atípicos tendrán un gran efecto sobre la media, pero tendrán poco o ningún efecto sobre la mediana.
En estadística, decimos que una medida es resistente o robusta si su valor no se ve muy afectado por los valores extremos del conjunto de datos. Entonces podemos decir que la mediana es resistente y la media no es resistente.
La media y la mediana miden el centro del conjunto de datos de manera diferente. La media es el punto en el que el conjunto de datos se equilibra. La mediana es el promedio que separa el 50% de los datos de un lado del 50% de los datos del otro lado. Cuando el conjunto de datos es simétrico, la media y la mediana son iguales. Pero pueden no ser iguales.
En algunos conjuntos de datos, la media puede ser menor que la mediana o la mediana puede ser menor que la media. En este caso, decimos que el conjunto de datos está sesgado.
Si el valor medio está a la izquierda o es menor que la mediana, decimos que el conjunto de datos está sesgado a la izquierda. Si la media está a la derecha o es mayor que la mediana, decimos que el conjunto de datos está sesgado a la derecha.
De estas dos medidas de tendencia central, ni la media ni la mediana son mejores. Ambos miden el centro de diferentes maneras. Algunos expertos prefieren usar la mediana cuando los datos están muy sesgados o contienen valores extremos porque la mediana es más representativa de un valor típico.
Una moda es el valor de un conjunto de datos que ocurre el número máximo de veces en el conjunto de datos. Ese es el valor que ocurre con más frecuencia.
Un conjunto de datos con un solo valor que ocurre con mayor frecuencia se denomina unimodal.
Si un conjunto de datos tiene dos valores con la misma frecuencia más alta, ambos valores se consideran modales y el conjunto de datos se considera bimodal.
Si un conjunto de datos tiene más de dos valores con la misma frecuencia más alta, cada valor se usa como una moda y el conjunto de datos se considera multimodal.
Si ningún valor de datos único aparece más de una vez, se dice que el conjunto de datos no tiene moda. Al hacerlo, sería incorrecto decir que la moda es cero. Esto sería incorrecto porque cero puede ser el valor real en algunos datos, como las mediciones de temperatura.
La principal ventaja de calcular una moda es que es más fácil de calcular y no se ve afectada por los valores extremos. La desventaja del cálculo es que, en determinadas situaciones, es posible que no exista un valor de moda para algunos conjuntos de datos.
Para un conjunto dado de veinte valores,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Podemos calcular la moda de la siguiente manera:
Organice el conjunto de datos en orden ascendente o descendente. Aquí el orden es el siguiente:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
A continuación, encontramos el valor repetido el máximo número de veces. Para nuestro caso, el valor más frecuente es 70. Por lo tanto, para un conjunto de datos dado, el valor modal es 70.
La moda también se considera como medida de tendencia central. Pero esto no es del todo preciso. La moda puede ser el valor más grande del conjunto de datos, el valor más pequeño o cualquier otro valor. Por ejemplo, si tuviéramos los siguientes números en el conjunto de datos:
42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120
La moda sería 120. Aunque en este caso no reflejaría una tendencia central.
Curiosamente, podemos calcular la media y la mediana únicamente para datos cuantitativos. Y podemos calcular la moda tanto para datos cuantitativos como cualitativos.
Por ejemplo, Anna come pizza un promedio de 12 veces al mes.
En este caso, tendremos dos modas: pizza napoletana y pizza margherita.
Usamos medidas de dispersión para determinar la variabilidad en un conjunto de datos. Por lo general, reflejan el grado de variación en los datos del valor central. Podemos examinar la varianza en un conjunto de datos utilizando el rango, los cuartiles y el rango intercuartil.
El rango de un conjunto de datos es la diferencia entre el valor más alto y el más bajo en el conjunto de datos. Podemos calcularlo determinando los valores máximo y mínimo del conjunto de datos. La fórmula para calcular el rango es:
$$Rango = valor\ mayor - valor\ menor$$
Para un conjunto dado de veinte valores,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70,
podemos calcular el rango de la siguiente manera:
Organice el conjunto de datos en orden ascendente o descendente. En este caso, el orden se ve así:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
El valor más alto es 160 y el valor más bajo es 42. Por lo tanto, el rango:
$$Rango = valor\ mayor - valor\ menor = 160 - 42 = 118$$
Por lo tanto, para este conjunto de datos, el rango es 118.
Los cuartiles son valores que dividen el conjunto de datos en cuatro cuartos separados por tres puntos, conocidos como, el primer, segundo y tercer cuartil.
El primer cuartil, etiquetado como Q₁, representa el punto que corresponde al primer 25 % de los valores del conjunto de datos que son menores que este valor. Y el otro 75% de los valores son mayores.
El segundo cuartil, etiquetado como Q₂, es la mediana. Esto significa que el 50 % del conjunto de datos es menor que este valor y el otro 50 % es mayor que Q₂.
El tercer cuartil, denotado Q₃, es el punto que representa el 75% de los valores que son menores a este valor y el 25% restante son mayores.
Un procedimiento para calcular los cuartiles de un conjunto de datos:
Organice los datos en orden ascendente.
Para calcular el segundo cuartil, simplemente calcule la mediana.
Para el primer y tercer cuartiles, proceda de la siguiente manera. Determine n - el número de valores en el conjunto de datos.
Para el primer cuartil, calcule L = 0,25n. Para el tercer cuartil, calcule L = 0,75n.
Si L es un número entero, el cuartil es el promedio del número en la posición L y el número en la posición L + 1.
Si L no es un número entero, redondee al siguiente número entero más alto. El cuartil es el número en la posición correspondiente al valor redondeado.
Para un conjunto dado de veinte valores,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Podemos calcular los cuartiles de la siguiente manera:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
De los cálculos anteriores, ya sabemos que Mediana = 70
L para el primer cuartil: 0,25 × 20 = 5. L Para el tercer cuartil: 0.75 × 20 = 15.
5 es un número entero, entonces Q₁ en nuestro caso es:
$$Q₁ = \frac{55+59}{2} = 57$$
$$Q₃ = \frac{72+75}{2} = 73,5$$
Por lo tanto, para este conjunto de datos, el primer cuartil es 57, el segundo es 70 y el tercero es 73,5.
El rango intercuartil (IQR) es la diferencia entre el tercer $(Q₃)$ y el primer Q₁ cuartiles de un conjunto de datos. Es una medida de la dispersión promedio, que se puede calcular de la siguiente manera:
IQR = Q₃ - Q₁
En la sección anterior, ya calculamos el primer y tercer cuartil. Son 57 y 73,5. Todo lo que tenemos que hacer es simplemente aplicar la fórmula.
IQR = Q₃ - Q₁ = 73,5 - 57 = 16,5
Por lo tanto, para este conjunto de datos, el rango intercuartil es 16,5.
En nuestro caso, con la mini encuesta de Luigi sobre los precios de la pizza Margherita, se puede obtener las siguientes conclusiones: la media y la mediana no coinciden; se formó una ligera asimetría en los datos. Pero no se nota mucho. Entonces, tanto la media como la mediana podrían usarse para medir la tendencia central.
Si Luigi quisiera optar por el precio promedio de una pizza Margherita, debería haber elegido el promedio o la mediana. Pero 71.900 IDR o 69.500 IDR no habrían sido muy convenientes como un precio de pizza. Afortunadamente, el precio de moda de la pizza de Margherita está justo en ese rango, que es de 70.000 rupias indonesias. Por lo tanto, Luigi podría utilizar este precio para sus cálculos.
Si quisiera crear una pizzería para un grupo objetivo más económico, podría enfocarse en cifras más cercanas al primer cuartil. Que correspondería a un precio de alrededor de 57.000 rupias indonesias. No es muy conveniente centrarse en el tercer cuartil para determinar el precio para clientes más exigentes puesto que el tercer cuartil es poco representativo.