Nessun risultato trovato
Non possiamo trovare nulla con quel termine al momento, prova a cercare qualcos'altro.
Calcolatrice per media, mediana e moda in statistica. Utilizza questa calcolatrice per ottenere la media, mediana, moda, l'intervallo e la media per qualsiasi insieme di dati.
Risultato | |||
---|---|---|---|
Media x̄ | 16.75 | Valori anomali | 6, 33, 35 |
Mediana x̃ | 15 | Quartile Q1 | 12.5 |
Moda | 15 è apparso 3 volte | Quartile Q2 | 15 |
Intervallo | 29 | Quartile Q3 | 16 |
Minimo | 6 | Intervallo interquartile IQR | 3.5 |
Massimo | 35 | ||
Somma | 201 | ||
Conteggio n | 12 |
C'è stato un errore con il tuo calcolo.
Guardare tabelle e grafici di dati statistici può essere difficile da interpretare per noi. Spesso abbiamo bisogno di riassumere insiemi di dati e identificare caratteristiche importanti per ottenere informazioni più utili dalle statistiche.
In statistica, diverse misure sono utilizzate per riassumere i dati. Alcune descrivono il centro dei dati; sono chiamate misure di tendenza centrale. Altre indicano quanto sono dispersi i valori dei dati; sono chiamate misure di dispersione. Altre ancora, chiamate misure di posizione, rivelano la proporzione dei dati che è inferiore a un dato valore.
Lo scopo principale di questa calcolatrice è calcolare misure di tendenza centrale—la media e la mediana—che possono rappresentare il valore tipico o centrale in un insieme di dati. Lo scopo secondario di questa calcolatrice è determinare il grado di variazione in un insieme di dati calcolando l'intervallo, i quartili e l'intervallo interquartile.
La media è la somma dei valori divisa per il numero totale di valori. È la più facile da comprendere e da calcolare usando la seguente formula per il calcolo della media per un campione:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
La formula per la media della popolazione è:
$$\mu=\frac{x₁+x₂+x₃+\ldots+x_n}{N}=\frac{\sum_{}^{}x}{N}$$
Qui, il numeratore rappresenta la somma dei valori nell'insieme di dati. E il denominatore rappresenta il numero di valori nell'insieme di dati.
La caratteristica principale dell'uso della media aritmetica è che coinvolge tutti i punti dati presenti nell'insieme di dati.
La principale limitazione della media è che è suscettibile a valori estremi che sono troppo grandi o troppo piccoli. Tali valori sono noti come valori anomali e influenzano significativamente la media.
Nota anche che il valore medio non è necessariamente il valore tipico per i dati. Il valore medio può essere un valore che non è presente affatto nell'insieme di dati.
La popolazione consiste nell'intero insieme di valori su cui si ottengono informazioni. Il campione consiste in un gruppo più piccolo preso dalla popolazione.
Il metodo per calcolare il valore medio è lo stesso sia per campioni che per popolazioni. Solo le denominazioni differiscono.
Se x₁, x₂,..., xₙ è un campione, la media è indicata come media del campione ed è rappresentata dal simbolo x̄. La media della popolazione è indicata dalla lettera greca 𝜇.
In statistica, usiamo la lettera minuscola n per indicare la dimensione del campione e la lettera maiuscola N per indicare la dimensione della popolazione.
Guardiamo il seguente esempio: Luigi è un cuoco di prima classe e amante della pizza. Ha deciso di aprire la sua pizzeria a Bali. Per trovare un investitore, Luigi scrive un piano aziendale. Vuole determinare il costo medio della pizza nei diversi ristoranti dell'isola per valutare le future prestazioni finanziarie.
Ha fatto una piccola ricerca sul prezzo della pizza Margherita nei ristoranti di Bali e ha ottenuto un insieme di dati sui prezzi della pizza. Per semplicità di calcolo, scartiamo gli ultimi tre zeri e usiamo il numero delle migliaia nel prezzo. Ovvero, 60 nei nostri calcoli significherà 60.000 rupie indonesiane.
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Luigi non ha visitato ogni pizzeria sull'isola. Ha selezionato casualmente 20 di esse. Quindi, stiamo trattando con un campione.
Calcoliamo il valore medio per questo insieme di dati usando la formula:
$$\bar{x}=\frac{x₁+x₂+x₃+\ldots+x_n}{n}=\frac{\sum_{}^{}x}{n}$$
Otteniamo così la media x̄ = 71,9.
La ricerca di Luigi mostra che 71.900 rupie indonesiane è il prezzo medio di una pizza Margherita a Bali. Ora può basare i suoi calcoli su questo prezzo.
La mediana è una misura di posizione che rappresenta il valore medio di un insieme di dati disposto in ordine crescente o decrescente.
Calcolando la mediana, cerchiamo di trovare un numero che divida l'insieme di dati a metà. La metà dei valori dei dati è inferiore alla mediana e la metà è superiore alla mediana. Questo è il motivo per cui quando determiniamo manualmente la mediana senza una calcolatrice della mediana, dobbiamo ordinare i valori in ordine crescente o decrescente.
Il calcolo della mediana differisce a seconda se il numero di valori nell'insieme di dati è pari o dispari.
Se il numero totale degli elementi è dispari, ovvero n o N è dispari, allora si applica la seguente formula:
$$Mediana=(\frac{n+1}{2})-\text{esimo\ elemento}$$
Tuttavia, se il numero degli elementi è pari, il che significa che n è un numero pari, allora si utilizza la seguente formula:
$$Mediana=\frac{\left[(\frac{n}{2})-\text{esimo\ elemento}+(\frac{n}{2}+1)-\text{esimo\ elemento}\right]}{2}$$
Il principale vantaggio dell'utilizzo della mediana è che è meno influenzata da valori estremamente alti o estremamente bassi.
Per un dato insieme di venti valori,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Possiamo calcolare la mediana come segue:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Determiniamo il numero di valori nell'insieme di dati. Abbiamo n = 20.
Se n è dispari, scegliamo il valore centrale dei dati come mediana. Se n è pari, troviamo la media aritmetica dei due valori mediani. Li sommiamo e dividiamo la somma per 2.
20 è un numero pari.
I valori centrali nel nostro campione sono 69 e 70. Troviamo la mediana in questo modo:
$$Mediana = \frac{69 + 70}{2} = 69,5$$
Se Luigi avesse un insieme di 21 valori, ad esempio,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 90, 55, 72, 70
Potrebbe ordinare i valori:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 90, 95, 120, 160
e selezionare il valore al centro nella 11ª posizione, cioè 70.
Sia la media sia la mediana vengono utilizzate come misure di tendenza centrale. Ma è essenziale sapere come si differenziano.
Una differenza cruciale tra la media e la mediana è che la formula per la media utilizza tutti i valori nell'insieme di dati. Invece, la formula per la mediana dipende solo dal numero centrale o dai due numeri centrali.
Questo è particolarmente importante per gli insiemi di dati in cui uno o più numeri sono insolitamente grandi o insolitamente piccoli. Tali numeri vengono chiamati valori anomali. Nella maggior parte dei casi, questi valori anomali influenzeranno significativamente la media, ma avranno poco o nessun effetto sulla mediana.
In statistica, diciamo che una misura è resistente se il suo valore non è molto influenzato dai valori estremi nell'insieme di dati. Quindi possiamo dire che la mediana è resistente, e la media non è resistente.
La media e la mediana misurano il centro dell'insieme di dati in modo diverso. La media è il punto in cui l'insieme di dati si bilancia. La mediana è la media che separa il 50% dei dati da un lato e il 50% dei dati dall'altro lato. Quando l'insieme di dati è simmetrico, la media e la mediana sono uguali.
Tuttavia, la media e la mediana possono non essere uguali.
In alcuni insiemi di dati, la media può essere inferiore alla mediana, o la mediana può essere inferiore alla media. In questo caso, diciamo che l'insieme di dati è distorto.
Se il valore medio è posizionato a sinistra o meno della mediana, diciamo che l'insieme di dati è distorto a sinistra. Se la media è posizionata a destra o più della mediana, diciamo che l'insieme di dati è distorto a destra.
Né la media né la mediana sono migliori come misura di tendenza centrale. Entrambe misurano il centro in modi diversi. Alcuni esperti preferiscono usare la mediana quando i dati sono fortemente distorti o contengono valori estremi perché la mediana è più rappresentativa di un valore tipico.
La moda è il valore di un insieme di dati che si verifica il maggior numero di volte nell'insieme. La moda di un insieme di dati è il valore che appare più frequentemente.
Un insieme di dati è unimodale se ha un valore che si verifica più frequentemente di ogni altro.
Se un insieme di dati ha due valori con la stessa massima frequenza, allora entrambi i valori sono considerati modalità, e l'insieme di dati è considerato bimodale.
Se un insieme di dati ha più di due valori con la stessa massima frequenza, allora ogni valore è usato come una moda, e l'insieme di dati è considerato multimodale.
Se nessun singolo valore di dati si verifica più di una volta, allora si dice che l'insieme di dati non ha moda. In questo caso, sarebbe scorretto dire che la moda è zero. Infatti zero potrebbe essere il valore effettivo in alcuni insiemi di dati, come le misurazioni della temperatura.
Il principale vantaggio del calcolo della moda è che è il più facile da trovare e non è influenzato da valori estremi. Lo svantaggio del calcolo della moda è che, in certe situazioni, un valore di moda potrebbe non esistere per alcuni insiemi di dati.
Per un dato insieme di venti valori,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Possiamo trovare la moda come segue:
Ordiniamo l'insieme di dati in ordine crescente o decrescente. Qui l'ordine è il seguente:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Successivamente, troviamo il valore ripetuto il massimo numero di volte. Qui, il valore più frequente è 70. Pertanto, per un dato insieme di dati, il valore modale è 70.
Mentre la moda è una misura di tendenza centrale, potrebbe non riflettere sempre il valore centrale di una distribuzione, particolarmente in distribuzioni asimmetriche. La moda può essere il valore più grande nell'insieme di dati, il valore più piccolo, o qualsiasi altro valore. Ad esempio, se avessimo i seguenti numeri nell'insieme di dati:
42, 45, 50, 53, 55, 57, 59, 60, 63, 69, 70, 72, 79, 82, 83, 95, 96, 120, 120, 120
La moda sarebbe 120. Anche se in questo caso, non rifletterebbe la tendenza centrale.
È interessante notare che possiamo calcolare la media e la mediana solo per i dati quantitativi. E possiamo calcolare la moda sia per i dati quantitativi che per quelli qualitativi.
In media, Anna mangia pizza 12 volte al mese.
In questo caso, avremo due mode: pizza Napoletana e pizza Margherita.
Le misure di dispersione, conosciute anche come misure di variabilità, sono utilizzate per determinare la diffusione o variabilità all'interno di un insieme di dati. Riflettono solitamente il grado di variazione dei dati rispetto al valore centrale. Possiamo esaminare la varianza in un insieme di dati usando l'intervallo, i quartili e l'intervallo interquartile.
L'intervallo per un insieme di dati è la differenza tra il valore più alto e il valore più basso nell'insieme di dati. Possiamo calcolarlo determinando i valori massimo e minimo dell'insieme di dati. La formula per calcolare l'intervallo è:
$$Intervallo = Valore\ più\ grande - Valore\ più\ piccolo$$
Per un dato insieme di venti valori,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
possiamo calcolare l'intervallo come segue:
Ordiniamo l'insieme di dati in ordine crescente o decrescente. Qui, l'ordine è il seguente:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Inoltre, il valore più alto è 160 e il valore più basso è 42. Pertanto, l'intervallo:
$$Intervallo = valore\ più\ grande - valore\ più\ piccolo = 160 - 42 = 118$$
Quindi, per questo insieme di dati, l'intervallo è 118.
I quartili sono valori che dividono l'insieme di dati in quattro parti uguali tramite tre punti, ovvero il primo, secondo e terzo quartile.
Il primo quartile, indicato con Q₁, è il valore sotto il quale cade il 25% dei dati, con il restante 75% che si trova al di sopra.
Il secondo quartile, indicato con Q₂, è anche conosciuto come mediana. Divide l'insieme di dati in due parti uguali, con il 50% dei valori che si trova sotto di esso e il 50% al di sopra.
Il terzo quartile, denotato con Q₃, è il valore sotto il quale cade il 75% dei dati, con il restante 25% che si trova al di sopra.
Una procedura per il calcolo dei quartili di un insieme di dati:
Ordina i dati in ordine crescente.
Per calcolare il secondo quartile, calcola la mediana. Per il primo e il terzo quartile, procedi come segue. Determina n - il numero di valori nell'insieme di dati.
Per il primo quartile, calcola L = 0,25n. Per il terzo quartile, calcola L = 0,75n.
Se L è un numero intero, il quartile è la media del numero nella posizione L e del numero nella posizione L + 1.
Se L non è un numero intero, arrotondalo all'intero successivo. Il quartile è il numero nella posizione corrispondente al valore arrotondato.
Per un dato insieme di venti valori,
60, 60, 84, 45, 59, 70, 42, 59, 53, 70, 69, 70, 120, 160, 95, 50, 75, 55, 72, 70
Possiamo calcolare i quartili come segue:
42, 45, 50, 53, 55, 59, 59, 60, 60, 69, 70, 70, 70, 70, 72, 75, 84, 95, 120, 160
Mediana = 70
L per il primo quartile: 0,25 × 20 = 5. L per il terzo quartile: 0,75 × 20 = 15.
5 è un numero intero, quindi Q₁ nel nostro caso è:
$$Q₁=\frac{55+59}{2}=57$$
$$Q₃=\frac{72+75}{2}=73,5$$
Quindi, per questo insieme di dati, il primo quartile è 57, il secondo è 70 e il terzo è 73,5.
Il range interquartile (IQR) è la differenza tra il terzo quartile Q₃ e il primo quartile Q₁ di un insieme di dati. È una misura della dispersione media, che può essere calcolata come segue:
IQR = Q₃ - Q₁
Nella sezione precedente, abbiamo già calcolato il primo e il terzo quartile. Sono 57 e 73,5. Tutto ciò che dobbiamo fare è semplicemente applicare la formula.
IQR = Q₃ - Q₁ = 73,5 - 57 = 16,5
Così, per questo insieme di dati, il range interquartile è 16,5.
Nel nostro caso, con il mini sondaggio di Luigi sui prezzi della pizza Margherita, potrebbe trarre le seguenti conclusioni: La media e la mediana non corrispondono; si è formata una lieve asimmetria nei dati. Ma non è molto evidente. Quindi sia la media che la mediana potrebbero essere utilizzate per misurare la tendenza centrale.
Se Luigi volesse determinare un prezzo medio per una pizza Margherita, potrebbe considerare sia la media che la mediana. Tuttavia, prezzi come 71.900 IDR o 69.500 IDR potrebbero non essere così facili da ricordare. Fortunatamente, il prezzo più frequente per la pizza Margherita rientra in questo intervallo, a 70.000 IDR, il che lo rende una cifra conveniente per Luigi da usare nella sua strategia di prezzo.
Se volesse creare una pizzeria per un target più parsimonioso, potrebbe concentrarsi su cifre più vicine al primo quartile. Ovvero un prezzo intorno a 57.000 rupie indonesiane. Non è molto conveniente focalizzarsi sul terzo quartile per determinare il prezzo per clienti più esigenti perché il terzo quartile non è molto rappresentativo.