Négyzetes középhiba

Innen: testwiki
Ugrás a navigációhoz Ugrás a kereséshez

Sablon:Hunfn

  1. Sablon:Label A négyzetes középhiba (más néven négyzetes hiba, angolul mean squared error, MSE) egy statisztikai mérőszám, amely a becslések és a valós értékek közötti eltérés négyzetének átlagát méri. Az MSE-t gyakran használják a statisztikai modellek teljesítményének értékelésére, mivel érzékeny a nagy eltérésekre, és így a modellek pontosságát jellemzi.

Definíció A négyzetes középhiba a következőképpen számítható:

1. Legyen yi a valós érték, és y^i a becsült érték (pl. a modell által előrejelzett érték) a i-edik megfigyelésnél. 2. A négyzetes középhiba az alábbi képlettel számolható: MSE=1ni=1n(yiy^i)2 ahol n a megfigyelések száma.

Jelentősége - Pontosság mérése: Az MSE segít mérni, hogy a modell mennyire pontosan becsüli meg a valós értékeket. Minél alacsonyabb az MSE, annál jobb a modell teljesítménye. - Érzékenység a nagy hibákra: Mivel a hibákat négyzetre emeljük, a nagyobb eltérések aránytalanul nagyobb hatással vannak az MSE-re, így a modell érzékeny lesz a jelentős eltérésekre.

Példa Tegyük fel, hogy van egy egyszerű lineáris regressziós modell, amelynek valós értékei a következők: - y=[3,5,2.5,7]

A modell által előrejelzett értékek: - y^=[2.5,5,4,6]

A négyzetes középhiba kiszámítása: 1. Kiszámoljuk a hibákat: - (32.5)2=0.25 - (55)2=0 - (2.54)2=2.25 - (76)2=1

2. Összegezzük a hibákat: - 0.25+0+2.25+1=3.5

3. Osztjuk a megfigyelések számával: - MSE=3.54=0.875

Különbség az MAE-val A négyzetes középhiba (MSE) eltér a középabsolút hiba (MAE) mutatótól, amely az abszolút eltérések átlagát méri. Az MSE a nagyobb eltérésekre nagyobb súlyt ad, míg az MAE lineárisan súlyozza a hibákat.

Összefoglalás A négyzetes középhiba egy fontos mérőszám a statisztikában és a gépi tanulásban, amely segít a modellek teljesítményének kiértékelésében. A MSE minimális értéke általában a legjobb modellt jelzi, amely a legpontosabb becsléseket adja a valós értékekhez képest. Sablon:Hunl