Zipf-eloszlás

Sablon:Humatek A Zipf-eloszlás egy valószínűségi eloszlás, amely a természetes nyelvek szavainak gyakoriságát, városok lakosságát, vállalatok bevételét és sok más jelenséget ír le, ahol néhány elem nagyon gyakran fordul elő, míg a többi ritkábban. A Zipf-eloszlás a hatványfüggvények csoportjába tartozik, és George Zipf amerikai nyelvész után kapta a nevét.

Matematikai formában a Zipf-eloszlás a következőképpen írható le:

$P (X = k) \propto \frac{1}{k^{s}}$

ahol $k$ egy adott elem rangja, $s$ pedig a Zipf-exponens, amely meghatározza az eloszlás meredekségét. Az eloszlás gyakran $s \approx 1$ értékkel fordul elő természetes nyelvek esetében.

A Zipf-törvény szerint az $n$ -edik leggyakoribb szó előfordulási gyakorisága fordítottan arányos az $n$ -el, vagyis a leggyakoribb szó kétszer olyan gyakori, mint a második leggyakoribb, háromszor olyan gyakori, mint a harmadik leggyakoribb, és így tovább.

A Zipf-eloszlás sok valós alkalmazásban megfigyelhető, például a városok lakossága (ahol néhány nagyváros dominál), vagy a szavak gyakorisága egy szövegben (ahol néhány szó, mint "és", "a", "az" sokkal gyakrabban fordul elő, mint más szavak). Sablon:Hunl

Zipf-eloszlás

Navigációs menü

Keresés