Stop lista (wyszukiwarki): Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
m Tar Lócesilion przeniósł stronę Stop listy do Stop lista (wyszukiwarki): liczba pojedyncza
drobne redakcyjne, WP:SK+ToS+mSK
Linia 1:
{{Dopracować|źródła=2011-05}}
'''Stop listylista''' ([[Językjęzyk angielski|ang.]]. ''Stop-Wordsstop word'') – lista słów odrzucanych przez [[wyszukiwarka internetowa|wyszukiwarki internetowe]] w celu zredukowania wielkości zbiorów.
 
'''Stop listy''' ([[Język angielski|ang]]. ''Stop-Words'') – lista słów odrzucanych przez [[wyszukiwarka internetowa|wyszukiwarki internetowe]] w celu zredukowania wielkości zbiorów.
 
Są to słowa o małym znaczeniu ([[spójnik (część mowy)|spójniki]]: ''i'', ''oraz'', ''lub'') oraz słowa popularne (''mp3'', ''sex''), czyli niewpływające na identyfikację dokumentu. Listy takie można utworzyć dla określonej dziedziny lub dla określonego języka. Istnieją stop-listy dla języka angielskiego, zawierające ok. 450 słów.
 
Usuwanie wyrazów nieznaczących z tekstu może się odbywać w następujący sposób:
* słownikowy – z tekstu usuwane są wyrazy wymienione w specjalnym słowniku,
* statystyczny – z tekstu usuwane są wyrazy, których częstość występowania znajduje się w założonym przedziale,