Mowa (językoznawstwo): Różnice pomiędzy wersjami

[wersja przejrzana][wersja nieprzejrzana]
Usunięta treść Dodana treść
m drobne redakcyjne
drobne redakcyjne
Linia 18:
 
== Technika dźwiękowa ==
Mowa jest [[sygnał]]em ''quasi-stacjonarnym''. Za jej zakres [[częstotliwość|częstotliwości]] przyjmuje się najczęściej 300Hz - 3kHz (w [[telefonia|telefonii]]), jednakże w wielu wypadkach [[sygnał]] mowy może mieć częstotliwości do 8 kHz. Zakres zależy od cech osobniczych mówiącego oraz języka. Język polski relatywnie często korzysta z fonemów o wysokich częstotliwościach, np. "sz"„sz” i„”i "ś"„ś”. W sygnale mowy wyróżniamy jednostki podstawowe – [[fonem]]y (w [[Język polski|języku polskim]] występuje ich 38). Fonemy nie zawsze są oddzielone chwilami [[Cisza (akustyka)|ciszy]], co więcej występuje zjawisko wzajemnego modyfikowania i nakładania się sąsiadujących fonemów – [[koartykulacja]]<ref name="przetwarzaniemowy">{{Cytuj|url=http://przetwarzaniemowy.pl/|autor=B. Ziółko; [[Mariusz Ziółko|M. Ziółko]]|tytuł=Przetwarzanie mowy|wydawca= Wydawnictwa AGH|data=2012}}</ref>.
 
Wraz z rozwojem [[technika|technik]] informacyjnych, możliwe stało się automatyczne przetwarzanie mowy: synteza, rozpoznawanie i rozumienie, co pozwoliło na opracowanie automatycznych systemów dialogowych. Zadanie rozpoznawania mowy okazało się trudniejsze niż spodziewano się podejmując pierwsze prace nad rozwiązaniem tego problemu. Skuteczność automatycznego rozpoznawania mowy wciąż jest niższa od osiąganej przez człowieka. Wymaga bowiem przeprowadzenia analizy nie tylko na poziomie [[akustyka|akustycznym]], ale również zaangażowania wiedzy [[językoznawstwo|lingwistycznej]] i [[semantyka (językoznawstwo)|semantycznej]] – w prawidłowym rozpoznaniu pomaga człowiekowi umiejętność domyślania się poszczególnych [[słowo|słów]] na podstawie [[kontekst]]u wypowiedzi, [[logika|logiki]] i [[wiedza|wiedzy]] o [[Ziemia|świecie]]. Aby maszynowe rozpoznawanie było równie skuteczne, elementy te powinny być wbudowane w [[algorytm]] rozpoznawania. Obecnie systemy automatycznego rozpoznawania i [[Synteza mowy|syntezy mowy]] stosowane są z powodzeniem do sterowania urządzeniami, dyktowania tekstów, dostępu do [[Baza danych|baz danych]].