Come utilizzare Parcelle quantili per controllare i dati normalità in R

06/04/2012 by admin

Istogrammi lasciano molto all'interpretazione dello spettatore. Un modo migliore grafica in R per capire se i dati sono distribuiti normalmente è quello di guardare un cosiddetto quantile-quantile (QQ) plot.

Con questa tecnica, si traccia quantili contro l'altro. Se si confrontano due campioni, per esempio, si confrontano semplicemente i quantili di entrambi i campioni. O, per dirla un po 'diverso, R fa la seguente di costruire una trama QQ:

  • Essa ordina i dati di entrambi i campioni.
  • Si traccia questi valori filtrate contro l'altro.

Se entrambi i campioni donâ € t contengono lo stesso numero di valori, R calcola valori extra per interpolazione per il campione più piccolo per creare due campioni della stessa dimensione.

Come confrontare due campioni di dati

Naturalmente, si dona € t hanno a che fare che tutto da solo, si può semplicemente utilizzare la funzione QQPlot () per questo. Così, per verificare se le temperature durante l'attività e durante il riposo sono distribuiti equamente, è sufficiente effettuare le seguenti operazioni:

> QQPlot (beaver2 $ temp [beaver2 $ activ == 1],
+ Beaver2 $ temp [beaver2 $ activ == 0])

Questo crea una trama in cui i valori ordinate sono riportati contro l'altro.

Come utilizzare Parcelle quantili per controllare i dati normalità in R

Tra le parentesi quadre, è possibile utilizzare un vettore logico per selezionare i casi che si desidera. Qui è possibile selezionare tutti i casi in cui il activ variabile è pari a 1 per il primo campione, e tutti i casi in cui la variabile è uguale a 0 per il secondo campione.

Come utilizzare un complotto R QQ per verificare la normalità dei dati

Nella maggior parte dei casi, si dona € t vuole confrontare due campioni con l'altro, ma confrontare un campione con un campione teorico che proviene da una certa distribuzione (ad esempio, la distribuzione normale).

Per fare una trama QQ in questo modo, R ha la funzione qqnorm speciale (). Come suggerisce il nome, questa funzione traccia il campione contro una distribuzione normale. È sufficiente dare il campione che si desidera tracciare un primo argomento e aggiungere eventuali parametri grafica che ti piace.

R crea quindi un campione con valori provenienti dalla distribuzione normale standard, o una distribuzione normale con media zero e una deviazione standard di uno. Con questo secondo campione, R crea la trama QQ come spiegato prima.

R ha anche una funzione qqline (), che aggiunge una riga al vostro normale trama QQ. Questa linea rende molto più facile da valutare se si vede una chiara deviazione dalla normalità. Il più vicino tutti i punti si trovano sulla linea, più la distribuzione del campione arriva alla distribuzione normale. La funzione qqline () batte anche il campione come argomento.

Ora si vuole fare questo per le temperature sia durante la attiva e il periodo di inattività del castoro. È possibile utilizzare la funzione qqnorm () due volte per creare due grafici. Per i periodi di inattività, è possibile utilizzare il seguente codice:

> Qqnorm (beaver2 $ temp [beaver2 $ activ == 0], principali = 'inattivo')
> Qqline (beaver2 $ temp [beaver2 $ activ == 0])

Si può fare lo stesso per il periodo attivo modificando il valore 0 a 1.

Come utilizzare Parcelle quantili per controllare i dati normalità in R


Articoli Correlati