Che cosa è una curva di distribuzione di frequenza?

Una curva di distribuzione di frequenza è un tipo di statistiche descrittive raffigurato come un grafico che illustra la frequenza di occorrenza di una data variabile, dove x rappresenta un certo grado di occorrenza della variabile e y rappresenta il numero di casi ciascuna frequenza. Con molto grandi popolazioni, una curva di distribuzione di frequenza è detto per assomigliare all'ideale statistica di una curva a campana ed assume le proprietà di una distribuzione normale. La curva a campana - noto anche come una curva normale - è giustamente intitolato. Si ricorda una campana con estremità arrotondate simmetriche convergenti verso il basso e verso di una frequenza zero l'asse x. La curva a campana è attraversata dal idealizzato media identico (μ), mediana e modalità di tutti i dati di misura, con la metà di ogni grafico su entrambi i lati.

Quando una curva di distribuzione di frequenza di campionamento si presume di possedere le proprietà di una curva a campana ideale, allora aspetti della popolazione sotto studio possono essere assunti come pure. Inoltre, formule statistiche standard possono dare un grado in cui tali ipotesi possono essere invocati. Con la curva a campana ideale, di una popolazione media, mediana e moda sono tutti assunti come uguali. Calcolo della deviazione standard, σ, quindi dà una misura dei dati della popolazione "spread". Nella curva ideale, tutti, ma lo 0,25 per cento del totale dei dati di una popolazione si trova all'interno di più o meno tre deviazioni standard dalla media della curva di distribuzione di frequenza, o tra μ-3σ e μ + 3σ.

Mentre la curva a campana ideale differisce da una curva di distribuzione di frequenza di campionamento in un numero di modi, permette una certa comprensione assumptive sia del campione di popolazione e anche la posizione di una singola misurazione all'interno della popolazione complessiva campione. In una curva ideale, il 68 per cento dei valori per la variabile misurata nel campione, e presumibilmente nella popolazione, sarà in una deviazione standard dalla media in entrambe le direzioni, o μ-1σ e μ + 1σ. Spostandosi lungo la curva a campana, i valori per il 95 per cento del campione e la popolazione si trovano all'interno di più o meno due deviazioni standard dalla media, o μ-2σ e μ + 2σ. Ai bordi del curva di distribuzione di frequenza, tutto ma 0,25 per cento rientra più o meno tre deviazioni standard. Tali misurazioni rari che si trovano nel 0,25 per cento al di là delle misure di tre deviazioni standard sono noti come valori anomali e vengono spesso rimossi dai dati quando calcoli inferenziali hanno luogo.