Zipf-eloszlás
- Sablon:Humatek A Zipf-eloszlás egy valószínűségi eloszlás, amely a természetes nyelvek szavainak gyakoriságát, városok lakosságát, vállalatok bevételét és sok más jelenséget ír le, ahol néhány elem nagyon gyakran fordul elő, míg a többi ritkábban. A Zipf-eloszlás a hatványfüggvények csoportjába tartozik, és George Zipf amerikai nyelvész után kapta a nevét.
Matematikai formában a Zipf-eloszlás a következőképpen írható le:
ahol egy adott elem rangja, pedig a Zipf-exponens, amely meghatározza az eloszlás meredekségét. Az eloszlás gyakran értékkel fordul elő természetes nyelvek esetében.
A Zipf-törvény szerint az -edik leggyakoribb szó előfordulási gyakorisága fordítottan arányos az -el, vagyis a leggyakoribb szó kétszer olyan gyakori, mint a második leggyakoribb, háromszor olyan gyakori, mint a harmadik leggyakoribb, és így tovább.
A Zipf-eloszlás sok valós alkalmazásban megfigyelhető, például a városok lakossága (ahol néhány nagyváros dominál), vagy a szavak gyakorisága egy szövegben (ahol néhány szó, mint "és", "a", "az" sokkal gyakrabban fordul elő, mint más szavak). Sablon:Hunl