Video: Testarea ipotezelor modelului liniar de regresie | TUTORIAL EXCEL 2024
Regresia liniară este o metodă statistică care analizează și găsește relațiile între două variabile. În analiza predictivă, aceasta poate fi utilizată pentru a prezice o valoare numerică viitoare a unei variabile.
Luați în considerare un exemplu de date care conține două variabile: datele anterioare constând în timpul de sosire a unui tren și timpul său de întârziere corespunzător. Să presupunem că doriți să anticipați care ar fi întârzierea pentru următorul tren. Dacă aplicați regresia liniară la aceste două variabile - timpul de sosire și întârziere - puteți genera o ecuație liniară, cum ar fi
Întârziere = a + (b * Timp de sosire) + d
Această ecuație exprimă relația dintre timpul de întârziere și timpul de sosire. Constantele a și b sunt parametrii modelului. Variabila d este termenul de eroare (cunoscut și sub numele de restul ) - o valoare numerică care reprezintă nepotrivirea dintre cele două variabile > și timpul de sosire . Dacă eroarea nu este egală cu zero, atunci aceasta ar putea indica faptul că există criterii care afectează variabila întârziere . a, b,
și d . Regresia liniară este (după cum vă imaginați) cea mai potrivită pentru datele liniare. Dar este foarte sensibil la valori extreme în punctele de date. Excesele din datele dvs. pot avea un impact semnificativ asupra modelului. Se recomandă să eliminați aceste valori de la setul de antrenament dacă intenționați să utilizați regresia liniară pentru modelul dvs. predictiv.