Wersja z 22:10, 2 kwi 2016 edytuj 95.160.153.191 (dyskusja) -pleonazm Znacznik: VisualEditor ← poprzednia edycja		Wersja z 13:52, 21 lut 2017 edytuj anuluj edycję Mozarteus (dyskusja \| edycje) Redaktorzy 14 338 edycji m jęz. następna edycja →
Linia 5: Po przeanalizowaniu odpowiednio dużej ilości tekstu zamienia się liczbę wystąpień na [[Prawdopodobieństwo\|prawdopodobieństwa]] poprzez [[normalizacja\|normalizację]]. Umożliwia to predykcje kolejnego elementu na podstawie sekwencji ''n'' dotychczasowych. Dla języka polskiego przeanalizowanie tekstów zawierających 300 000 000 słów daje dobry model 1-gramowy i satysfakcjonujący 2-gramowy. W celu utworzenia wiarygodnego modelu 3-gramowego potrzebne są dużo większe zasoby{{r\|dsp.agh-resources-ngram}}. Duża ilość przeanalizowanego tekstu podnosi jakość modelu, aczkolwiek istnieją także metody umożliwiające ulepszenie n-gramowych modeli bez dodatkowych danych, w oparciu o wygładzanie zebranych statystyk{{r\|Jurafsky}}. Głównymi zaletami n-gramów są prostota i skalowalność. Poprzez zmianę ''n'' można tym samym schematem otrzymywać zarówno modele ~~nie wymagające~~niewymagające wielu danych treningowych, ale ~~nie dające~~niedające dużej mocy predykcyjnej, jak i modele wymagające wielu danych ale oferujące duże możliwości predykcyjne. == Przypisy ==

N-gram: Różnice pomiędzy wersjami