Tłumaczenie automatyczne: Różnice pomiędzy wersjami

Usunięte 81 bajtów ,  1 miesiąc temu
m
drobne merytoryczne, drobne redakcyjne
(Rescuing 2 sources and tagging 0 as dead.) #IABot (v2.0.8)
m (drobne merytoryczne, drobne redakcyjne)
'''Tłumaczenie automatyczne''', '''tłumaczenie maszynowe''' ({{ang.|machine translation}}) – dziedzina [[lingwistyka komputerowa|językoznawstwa komputerowego]], która zajmuje się stosowaniem [[algorytm]]ów tłumaczenia tekstu z jednego [[język naturalny|języka (naturalnego)]] na drugi.
 
Pierwsze odnotowane pomysły tłumaczy automatycznych pochodzą już z XVII w., lecz nie było możliwości ich realizacji. Dopiero nadejście komputerów pozwoliło tej dziedzinie „rozwijać powoli skrzydła”. Pierwsze maszyny tłumaczące pojawiły się w 1933 r. i wykorzystywano je głównie w wojskowości.
== Główne metody tłumaczenia automatycznego ==
Główne metody realizowania tłumaczenia automatycznego:
* Systemysystemy tłumaczenia bezpośredniego – wyrazy tekstu źródłowego zamieniane są wprost na ich odpowiedniki w oczekiwanym języku. Program zawiera odpowiadające sobie słowa i najczęściej stosowane frazy. Tłumaczenie tego typu daje akceptowalne wyniki tylko w zastosowaniu dla blisko ze sobą spokrewnionych języków.
 
* Systemysystemy przekładu składniowego – analizują składniową stronę tekstu. Najczęściej rezultatem jest drzewo składników, do którego następnie stosuje się odpowiednie reguły transferu.
* Systemy tłumaczenia bezpośredniego – wyrazy tekstu źródłowego zamieniane są wprost na ich odpowiedniki w oczekiwanym języku. Program zawiera odpowiadające sobie słowa i najczęściej stosowane frazy. Tłumaczenie tego typu daje akceptowalne wyniki tylko w zastosowaniu dla blisko ze sobą spokrewnionych języków.
* Systemysystemy oparte na powierzchniowym transferze semantycznym – biorą pod uwagę własności składniowe i częściowo znaczeniowe. Realizowane jest to poprzez dołączenie do drzewa struktury syntaktycznej dodatkowych informacji naprowadzających, np. atrybutów znaczeniowych.
* Systemy przekładu składniowego – analizują składniową stronę tekstu. Najczęściej rezultatem jest drzewo składników, do którego następnie stosuje się odpowiednie reguły transferu.
* Systemysystemy międzyjęzykowe – oparte są na uniwersalnym języku reprezentacji znaczenia (tzw. interlingwie), który jest niezależny od języków naturalnych, zawartych w systemie. Proces translacji składa się z dwóch etapów: tłumaczenia z języka źródłowego na interlingwę i tłumaczenia z interlingwy na język wynikowy.
* Systemy oparte na powierzchniowym transferze semantycznym – biorą pod uwagę własności składniowe i częściowo znaczeniowe. Realizowane jest to poprzez dołączenie do drzewa struktury syntaktycznej dodatkowych informacji naprowadzających, np. atrybutów znaczeniowych.
* [[Tłumaczenietłumaczenie statystyczne]] – tłumaczenie w oparciu o wielkie zestawy (korpusy) tekstów przetłumaczonych przez człowieka. Dla danego zdania szukane jest jego najbardziej prawdopodobne tłumaczenie. Prawdopodobieństwo tłumaczenia obliczane jest na podstawie współwystępowania wyrazów w zebranym korpusie. Sukcesy w tym podejściu notuje portal Google, gdyż korzysta ze swoich olbrzymich korpusów stron internetowych.
* Systemy międzyjęzykowe – oparte są na uniwersalnym języku reprezentacji znaczenia (tzw. interlingwie), który jest niezależny od języków naturalnych, zawartych w systemie. Proces translacji składa się z dwóch etapów: tłumaczenia z języka źródłowego na interlingwę i tłumaczenia z interlingwy na język wynikowy.
* Tłumaczenietłumaczenie oparte na przykładach – podobnie jak tłumaczenie statystyczne opiera się na istniejących tekstach przetłumaczonych. Dla danego zdania źródłowego system szuka najbardziej podobnego przykładu w swojej bazie danych i na tej podstawie wnioskuje jego tłumaczenie.
* [[Tłumaczenie statystyczne]] – tłumaczenie w oparciu o wielkie zestawy (korpusy) tekstów przetłumaczonych przez człowieka. Dla danego zdania szukane jest jego najbardziej prawdopodobne tłumaczenie. Prawdopodobieństwo tłumaczenia obliczane jest na podstawie współwystępowania wyrazów w zebranym korpusie. Sukcesy w tym podejściu notuje portal Google, gdyż korzysta ze swoich olbrzymich korpusów stron internetowych.
* Tłumaczenie oparte na przykładach – podobnie jak tłumaczenie statystyczne opiera się na istniejących tekstach przetłumaczonych. Dla danego zdania źródłowego system szuka najbardziej podobnego przykładu w swojej bazie danych i na tej podstawie wnioskuje jego tłumaczenie.
 
== Podstawowe jednostki języka ==
Podstawowe jednostki języka. Podlegają one abstrakcji.
 
* [[głoska|Głoski]], czyli konkretne dźwięki. Abstrakcją głosek są [[fonem]]y. Fonem to klasa dźwięków, które użytkownicy języka poznają jako posiadające pewne odrębne cechy, wyróżniające je spośród innych dźwięków.
* [[Morf]]y – są najmniejszymi składnikami języka posiadającymi znaczenie. Ich abstrakcję zwiemy [[morfem]]ami.
* [[Wyraz]]y – konkretną formę wyrazu, którą używamy, nazywamy wyrazem tekstowym. Abstrakcją dla niego jest leksem. Teraz mały przykład: domem, domy to dwa wyrazy tekstowe jednego leksemu, z kolei wyraz domy składa się z dwóch morfemów: dom – budynku oraz końcówki y wskazującej, że jest ich więcej niż jeden.
* [[Fraza (składniajęzykoznawstwo)|Frazy]] (związki frazeologiczne) – ich abstrakcje to schematy frazy.
* [[zdanie|Zdania]] – przyjmuje się, iż są podstawową jednostką tekstu. Ich abstrakcjami są schematy zdań.
* Wypowiedź – jest po prostu ciągiem zdań.
Rodzaje programów tłumaczenia automatycznego (maszynowego):
 
* [[Tłumaczenie przy użyciu komputera|Tłumaczenietłumaczenie wspomagane maszynowokomputerowo]], polega na tym, że całe tłumaczenie jest wykonywane przez człowieka wykorzystującegoużywającego komputerkomputera w celu usprawnienia i przyspieszenia całego procesu.
* Tłumaczenietłumaczenie wspomagane przez człowieka, polega na tym, że tekst źródłowy jest modyfikowany przed, w czasie lub po przetłumaczeniu go przez komputer.
* Tłumaczenietłumaczenie całkowicie maszynowe, polega na tym, że program otrzymuje tekst źródłowy i bez żadnej ingerencji człowieka generuje tekst w języku wynikowym.
 
== Efekty ==
== Zobacz też ==
* [[przetwarzanie języka naturalnego]]
* [[Tłumacz Google]], [[DeepL]]
 
== Bibliografia ==