Media, deviazione standard e varianza: analisi dei dati con Excel

Analisi dei dati con Excel
Analisi dei dati con Excel

In azienda le statistiche supportano le decisioni dei manager poiché presentano un elevato numero di variabili che, correttamente interpretate, offrono interessanti spunti di riflessione. Le banche, ad esempio, stanno molto attente alle statistiche che riguardano le richieste di finanziamenti o le domande di mutuo mentre le imprese commerciali raccolgono i dati relativi agli acquisti effettuati. In tale ambito assumono particolare rilievo la media, la deviazione standard e la varianza.

Analisi di dati e informazioni

La tendenza a conservare e analizzare grosse quantità di dati è tipica di manager e imprenditori poiché basano le loro decisioni sull'analisi dei dati in loro possesso. Molti di loro, ad esempio, non sono in grado di prendere decisioni se non sono supportati da tabelle, grafici e diagrammi.
È importante, quindi, essere a conoscenza delle principali tecniche e delle migliori soluzioni da adottare per presentarli al meglio. Si parte dalla suddivisione dei dati nelle due grandi tipologie solitamente utilizzate in ambito aziendale: dati qualitativi e dati quantitativi.

Dati qualitativi

I dati qualitativi non possono essere misurati secondo una scala numerica naturale ma possono essere classificati all'interno di altri gruppi di categorie. Ad esempio una serie di dati qualitativi può essere rappresentata dal sesso (uomo, donna), dall'età (under 40, over 40), dall'area geografica (nord, centro, sud) e così via.
Ipotizziamo, quindi, di dover analizzare i seguenti dati:

ID Sesso Età Area
1 Uomo Under 40 Nord
2 Uomo Under 40 Centro
3 Donna Under 40 Sud
4 Uomo Under 40 Centro
5 Uomo Over 40 Sud
6 Uomo Over 40 Sud
7 Donna Under 40 Sud
8 Donna Over 40 Sud
9 Uomo Over 40 Nord
10 Donna Over 40 Sud
11 Donna Over 40 Sud
12 Uomo Under 40 Nord
13 Uomo Over 40 Centro
14 Uomo Over 40 Centro
15 Uomo Under 40 Nord
16 Donna Under 40 Centro
17 Donna Over 40 Centro
18 Uomo Over 40 Nord
19 Uomo Over 40 Sud
20 Uomo Over 40 Nord

Trasformare dati qualitativi in dati quantitativi

A questo punto occorre trasformare i dati qualitativi di cui alla tabella precedente in dati quantitativi. Per questo raggrupperemo i dati nelle tre aree geografiche esaminate riportando la relativa frequenza:

ID Area Frequenza assoluta Frequenza relativa
1 Nord 6 30,00%
2 Centro 6 30,00%
3 Sud 8 40,00%
TOTALE 20 100,00%

La prima colonna mostra le differenti aree geografiche analizzate mentre la seconda e la terza colonna mostrano la frequenza assoluta e relativa di ciascuna area. In tale circostanza è facile individuare come il Sud possa essere l'area geografica in cui maggiormente si concentra il risultato della nostra analisi con 8 individui che equivalgono al 40% del totale. In questo modo sarà possibile riepilogare facilmente i dati senza necessariamente dover scorrere ogni singolo record.

Grafico a torta e istogramma

I dati nell'esempio possono essere rappresentati anche sotto forma di grafico a torta, utilizzato per mostrare la dimensione delle varie aree geografiche e facilmente sostituibile allo schema tabellare per via della sua semplice interpretazione.

Un altro tipo di grafico abbastanza diffuso è l'istogramma nel quale ogni barra corrisponde ad una area geografica.

Tendenza: media, moda e mediana

Solitamente i dati acquisiti vanno analizzati tenendo conto della loro tendenza. Le formule che rappresentano la tendenza di una serie di valori sono tre: la media, la mediana e la moda. La media si calcola sommando i valori e dividendo per il numero delle classi. Nel nostro esempio la media sarà data dalla seguente formula: (6+6+8)/3 = 6,67. La mediana divide un insieme di numeri in due gruppi: valori minori della mediana e valori superiori della mediana. In tale ambito è essenziale che l'ordinamento dei numeri sia crescente. Nel nostro esempio la mediana sarà pari a 6. La moda è il valore che si verifica più frequentemente nei dati. Nel nostro esempio la moda sarà 6.

Varianza e deviazione standard

Oltre alla tendenza, anche la varianza è un concetto chiave in statistica. La varianza rappresenta la media aritmetica dei quadrati degli scarti dei valori della loro media aritmetica. Nel nostro caso la varianza sarà data dalla seguente formula: (6+6+8)/3 = 6,67 Quindi [(6-6,67)2 + (6-6,67)2 + (8-6,67)2] / (3-1) = 1,33. Questo vuol dire che la distanza media tra un valore e quello successivo è di 1,33. Molto simile alla varianza è la deviazione standard che indica quanto un valore sia distante dalla media.

Normalizzazione dei dati

Solitamente, per interpretare meglio i valori derivanti dalla media e dalla deviazione standard si utilizza una funzione che tende a normalizzare i dati. La funzione richiede l'indicazione del dato da analizzare, la media e la deviazione standard. Supponiamo di voler conoscere il dato normalizzato dell'area geografica Sud rispetto alle aree analizzate. La formula da inserire su Excel sarà =NORMALIZZA(8;6,67;1,15). Se il risultato sarà positivo vorrà dire che la deviazione standard del Sud cade al di sopra della media di tutte le aree geografiche osservate. In caso di risultato negativo vorrà dire che la deviazione standard del Sud cadrà al di sotto della media di tutte le aree osservate.

Analisi dei dati con Excel

Per l'analisi dei dati, lo strumento più potente e versatile è indubbiamente Excel. Il software della Microsoft permette, attraverso l'applicazione di numerosissime funzioni, di analizzati dati e valori contenuti in un elenco. Certo, è un programma abbastanza complesso e non tutti riescono a trovare la giusta affinità. Ma se sei interessato a saperne di più e iniziare a imparare le tecniche di analisi dei dati ti suggerisco di leggere il libro Excel. Formule e funzioni For Dummies.

Articoli correlati

Argomenti: 

Aggiungi un commento