Come Descrivere la variazione dei dati in R

Un numero unico doesnâ € t si dice molto circa i vostri dati. Spesso ita € s importante per conoscere la diffusione dei tuoi dati. È possibile utilizzare R guardare a questa diffusione utilizzando un numero di approcci diversi.

In primo luogo, è possibile calcolare sia la varianza o la deviazione standard di riassumere la diffusione in un unico numero. Per questo, si ha la funzione comoda var () per la varianza e deviazione standard () per la deviazione standard. Ad esempio, si calcola la deviazione standard del mpg variabili nelle auto telaio dati come questo:

> sd (auto $ mpg)
[1] 6,026,948 mila

Accanto alla media e la variazione, si può anche dare un'occhiata ai quantili. A quantile, o percentile, ti dice quanto dei vostri dati si trova sotto di un certo valore. Il 50 percento quantile, per esempio, non è altro che la mediana. Anche in questo caso, R ha alcune funzioni utili per aiutarvi con guardando i quantili.

Come calcolare intervallo dati in R

I quantili più utilizzati sono in realtà i 0 per cento e 100 per cento quantili. Si potrebbe facilmente chiamare loro il minimo e il massimo, perché thatâ € s che cosa sono. È possibile ottenere sia funzioni max () insieme con la funzione range () min () e. Questa funzione consente facilmente la gamma dei dati. Quindi, per sapere quali sono situati tra due valori di tutti i chilometraggi, è sufficiente effettuare le seguenti operazioni:

> Gamma (auto $ mpg)
[1] 10.4 33.9

Come calcolare i dati quartili in R

La gamma si dà ancora solo informazioni limitate. Spesso statistici segnalare il primo e il terzo quartile vicino alla catena e la mediana. Questi quartili sono, rispettivamente, il 25 per cento e 75 per cento quantili, che sono i numeri per i quali un quarto e tre quarti dei dati è più piccolo. È possibile ottenere questi numeri utilizzando la funzione quantile (), in questo modo:

> quantile (auto $ mpg)
0% 25% 50% 75% 100%
10,400 15,425 19,200 22,800 33,900

I quartili non sono gli stessi come la cerniera inferiore e superiore calcolata nel sommario cinque numero. Questi ultimi due sono, rispettivamente, la mediana della metà inferiore e superiore dei vostri dati, e differiscono leggermente da il primo e il terzo quartile. Per ottenere le cinque statistiche numero, si utilizza la funzione fivenum ().

Come arrivare alla velocità con la funzione quantile in R

La funzione quantile () può dare qualsiasi quantile che vuoi. Per questo, si utilizza l'argomento probs. Tu dai i probs (o probabilità) come numero frazionario. Per il 20 per cento quantile, per esempio, si utilizza 0.20 come argomento per il valore. Questo argomento prende anche un vettore come un valore, in modo da poter, ad esempio, ottenere il 5 per cento e 95 per cento quantili come questo:

> Quantile (auto $ mpg, probs = c (0,05, 0,95))
5% 95%
11,995 31,300

Il valore di default per l'argomento probs è un vettore che rappresenta il minimo (0), il primo quartile (0,25), la mediana (0.5), il terzo quartile (0,75), e il massimo (1).

Tutte queste funzioni hanno un na.rm discussione che permette di rimuovere tutti i valori NA prima di calcolare il rispettivo statistica. Se si dona € t fare questo, qualsiasi vettore contenente NA NA avrà come risultato. Questo funziona in modo identico all'argomento na.rm della funzione sum ().