Qual è la regressione semplice lineare?

Semplice regressione lineare applica alle statistiche e aiuta a descrivere (x, y) dati che sembra avere una relazione lineare, consentendo un certo predizione di y se x è noto. Questi dati vengono spesso tracciati sulla dispersione e la formula per la regressione lineare crea una linea che meglio si adatta tutti i punti, a condizione che davvero hanno una correlazione lineare. Non si adatta esattamente tutti i punti, ma dovrebbe essere una linea in cui la somma dei quadrati delle differenze tra i dati effettivi ei dati attesi (residui) crea il numero più basso, che è spesso chiamata linea dei minimi quadrati o linea di best fit. L'equazione della linea per i dati campione e dati sulla popolazione sono i seguenti: y = b 0 + B 1 x e Y = B 0 + B 1 x.

Chiunque abbia familiarità con algebra può notare la somiglianza di questa linea y = mx + b, e infatti i due sono relativamente identici, tranne i due termini sul lato destro dell'equazione sono accesi, in modo che B 1 uguale pendenza o m. La ragione di questo riarrangiamento è allora diventa elegantemente facile aggiungere ulteriori termini con caratteristiche come esponenti che potrebbero descrivere diverse forme lineari di relazione.

Le formule per ottenere una linea di regressione lineare semplice sono relativamente complessa e ingombrante, e la maggior parte delle persone non passano molto tempo a scrivere queste giù perché si prendono molto tempo per completare. Invece, vari programmi, quali ad Excel o per molti tipi di calcolatrici scientifiche, possono facilmente calcolare una linea dei minimi quadrati. La linea è appropriato solo per la previsione, se non vi è una chiara evidenza di una forte correlazione tra i gruppi di (x, y) di dati. Una calcolatrice genererà una linea, indipendentemente dal fatto che ha un senso di usarlo.

Allo stesso tempo, viene generata una semplice equazione linea di regressione lineare, le persone devono osservare livello di correlazione. Ciò significa valutare r, il coefficiente di correlazione, contro una tabella di valori per determinare se esiste correlazione lineare. Inoltre, la valutazione dei dati tracciando come una dispersione è un buon modo di ottenere un senso se i dati ha un rapporto lineare.

Ciò che può poi essere fatto con una semplice linea di regressione lineare, purché abbia una correlazione lineare, è che i valori possono essere sostituiti in x, per ottenere un valore previsto per y. Questa previsione ha i suoi limiti. I dati presenti, soprattutto se è solo un esempio, può avere una correlazione lineare ora, ma potrebbe in seguito non con materiale campione aggiuntivo aggiunto.

In alternativa, un campione complesso può condividere una correlazione mentre un'intera popolazione non. La previsione è quindi limitato, e andando ben oltre i valori dei dati disponibili si chiama estrapolazione, e non è incoraggiata. Inoltre, la gente dovrebbe sapere che se non esiste correlazione lineare, la migliore stima di x è la media di tutti i dati y.

In sostanza, semplice regressione lineare è uno strumento statistico utile che può, con discrezione, essere utilizzato per prevedere i valori y in base al valore ascia. È quasi sempre insegnato con l'idea di correlazione lineare poiché determinazione utilità di una linea di regressione richiede l'analisi di r. Fortunatamente con molti programmi tecnici moderni, le persone possono grafico a dispersione, aggiungere linee di regressione e di determinare il coefficiente di correlazione r con un paio di voci.