Logisztikus regresszió

Innen: testwiki
A lap korábbi változatát látod, amilyen imported>LinguisticMystic 2024. október 17., 14:39-kor történt szerkesztése után volt.
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)
Ugrás a navigációhoz Ugrás a kereséshez

Sablon:Hunfn

  1. Sablon:Mat A logisztikus regresszió egy széles körben használt statisztikai módszer a függő változó és egy vagy több független változó közötti kapcsolat modellezésére. Elsősorban bináris osztályozási problémákra használják, ahol a függő változónak két lehetséges kimenetele van, például „igen” vagy „nem”, „1” vagy „0” stb. Íme egy tömör áttekintés:

Kulcsfogalmak: - Függő változó (eredmény): Bináris, azaz két lehetséges értékkel rendelkezik (pl. siker/hiány, igen/nem). - Függő változók: Ezek lehetnek folyamatosak, kategorikusak vagy a kettő keveréke, és a kimenetel előrejelzésére szolgálnak.

A logisztikus függvény: A logisztikus regresszió a logisztikus függvény (más néven szigmoid függvény) alkalmazásával modellezi annak valószínűségét, hogy egy adott bemenet egy adott kategóriába tartozik: P(y=1|X)=11+e(β0+β1X1++βnXn) Ahol: - P(y=1|X) annak a valószínűsége, hogy az eredmény 1 (siker). - β0,β1,,βn a modell együtthatói. - X1,X2,,Xn a független változók.

Logisztikus regresszió lépései: 1. A kapcsolat modellezése: A független változók és a kimenetel valószínűsége közötti kapcsolatot a logisztikus függvény segítségével modellezzük. 2. Együtthatók becslése: Az β0,β1,,βn együtthatók becslése maximum likelihood estimation (MLE) segítségével történik, amely módszer megtalálja a modellhez legjobban illeszkedő paramétereket. 3. Jóslás: Miután a modellt betanítottuk, a modell minden egyes bemenetre egy (0 és 1 közötti) valószínűséget ad ki. Az osztályozáshoz egy küszöbértéket alkalmaz, jellemzően 0,5, így: - Ha P(y=1|X)>0,5, akkor az 1. osztályt jósoljuk. - Ha P(y=1|X)0,5, akkor a 0. osztályt jósoljuk.

Az együtthatók értelmezése: - Minden egyes βj együttható az Xj egy egységnyi változása esetén az eredmény log-odds-ját jelenti, minden más változót állandó értéken tartva. - Esélyek: Egy esemény bekövetkezésének esélye P1P, ahol P a siker valószínűsége.

Előnyök: - Egyszerű és könnyen értelmezhető. - Valószínűségeket ad ki, így számos alkalmazásban használható. - Jól működik bináris osztályozásra, és kiterjeszthető többosztályos problémákra is az olyan technikák segítségével, mint az One-vs-Rest.

Korlátozások: - Lineáris kapcsolatot feltételez a független változók és a kimenetel log-odds értékei között. - Nem hatékony, ha az osztályok erősen kiegyensúlyozatlanok, kivéve, ha kiigazításokat végeznek.

A logisztikus regresszió népszerű az olyan területeken, mint az orvostudomány (betegségek jelenlétének előrejelzése), a pénzügy (hitelpontozás) és a marketing (az ügyfelek elvándorlásának előrejelzése).

Sablon:Hunl