Zipf-eloszlás

Innen: testwiki
Ugrás a navigációhoz Ugrás a kereséshez

Sablon:Hunfn

  1. Sablon:Humatek A Zipf-eloszlás egy valószínűségi eloszlás, amely a természetes nyelvek szavainak gyakoriságát, városok lakosságát, vállalatok bevételét és sok más jelenséget ír le, ahol néhány elem nagyon gyakran fordul elő, míg a többi ritkábban. A Zipf-eloszlás a hatványfüggvények csoportjába tartozik, és George Zipf amerikai nyelvész után kapta a nevét.

Matematikai formában a Zipf-eloszlás a következőképpen írható le:

P(X=k)1ks

ahol k egy adott elem rangja, s pedig a Zipf-exponens, amely meghatározza az eloszlás meredekségét. Az eloszlás gyakran s1 értékkel fordul elő természetes nyelvek esetében.

A Zipf-törvény szerint az n-edik leggyakoribb szó előfordulási gyakorisága fordítottan arányos az n-el, vagyis a leggyakoribb szó kétszer olyan gyakori, mint a második leggyakoribb, háromszor olyan gyakori, mint a harmadik leggyakoribb, és így tovább.

A Zipf-eloszlás sok valós alkalmazásban megfigyelhető, például a városok lakossága (ahol néhány nagyváros dominál), vagy a szavak gyakorisága egy szövegben (ahol néhány szó, mint "és", "a", "az" sokkal gyakrabban fordul elő, mint más szavak). Sablon:Hunl