Négyzetes középhiba
- Sablon:Label A négyzetes középhiba (más néven négyzetes hiba, angolul mean squared error, MSE) egy statisztikai mérőszám, amely a becslések és a valós értékek közötti eltérés négyzetének átlagát méri. Az MSE-t gyakran használják a statisztikai modellek teljesítményének értékelésére, mivel érzékeny a nagy eltérésekre, és így a modellek pontosságát jellemzi.
Definíció A négyzetes középhiba a következőképpen számítható:
1. Legyen a valós érték, és a becsült érték (pl. a modell által előrejelzett érték) a -edik megfigyelésnél. 2. A négyzetes középhiba az alábbi képlettel számolható: ahol a megfigyelések száma.
Jelentősége - Pontosság mérése: Az MSE segít mérni, hogy a modell mennyire pontosan becsüli meg a valós értékeket. Minél alacsonyabb az MSE, annál jobb a modell teljesítménye. - Érzékenység a nagy hibákra: Mivel a hibákat négyzetre emeljük, a nagyobb eltérések aránytalanul nagyobb hatással vannak az MSE-re, így a modell érzékeny lesz a jelentős eltérésekre.
Példa Tegyük fel, hogy van egy egyszerű lineáris regressziós modell, amelynek valós értékei a következők: -
A modell által előrejelzett értékek: -
A négyzetes középhiba kiszámítása: 1. Kiszámoljuk a hibákat: - - - -
2. Összegezzük a hibákat: -
3. Osztjuk a megfigyelések számával: -
Különbség az MAE-val A négyzetes középhiba (MSE) eltér a középabsolút hiba (MAE) mutatótól, amely az abszolút eltérések átlagát méri. Az MSE a nagyobb eltérésekre nagyobb súlyt ad, míg az MAE lineárisan súlyozza a hibákat.
Összefoglalás A négyzetes középhiba egy fontos mérőszám a statisztikában és a gépi tanulásban, amely segít a modellek teljesítményének kiértékelésében. A MSE minimális értéke általában a legjobb modellt jelzi, amely a legpontosabb becsléseket adja a valós értékekhez képest. Sablon:Hunl