Modele IBM

Modele IBM – pięć modeli tłumaczenia automatycznego metodą statystyczną. Zostały one opracowane i opublikowane przez grupę badaczy z IBM^[1] w 1993 r.

Model I edytuj

Najprostszy model tłumaczenia statystycznego według IBM. Obliczane jest tylko prawdopodobieństwo częstości występowania danego wyrazu w zdaniu, inne parametry nie są brane pod uwagę. Wykorzystywany jest tutaj model zaszumionego kanału, który zdanie wynikowe przyjmuje za zdanie źródłowe.

P(f,a|e)=P(m|e)P(a|m,e)P(f|a,m,e).

Dla danego zdania docelowego $e$ oblicza się prawdopodobieństwo, że długość jego tłumaczenia $f$ wynosi $m.$ Kolejno oblicza się prawdopodobieństwo dopasowania $a.$ Dopiero na podstawie dopasowania można obliczyć prawdopodobieństwo, że zdanie źródłowe $f$ jest tłumaczeniem zdania $e$ ^[2].

Model II edytuj

Prawdopodobieństwo podobne jak w Modelu I, lecz dodatkowo pojawia się prawdopodobieństwo dopasowania, czyli parametr uwzględniający pozycję słowa w zdaniu.

Model III edytuj

W tym modelu występują cztery parametry:

„płodność” wyrazu, czyli liczba słów, która musi powstać w celu przetłumaczenia wyrazu np. blok – block of flats,
informacje o położeniu słowa w zdaniu,
tłumaczenie wyrazu,
nieprawdziwe słowa.

Model IV edytuj

Umieszczenie kolejnych przetłumaczonych słów zależy od innych wcześniejszych słów pochodzących od tego samego źródła. Wprowadza podział na grupy słów występujące razem i rozłącznie np. implemented – mis en application, not – no … pas.

Model V edytuj

Podobny do Modelu IV, lecz uniemożliwia powstawanie zdań, w których brakuje słów, takich gdzie dana pozycja zajmowana jest przez więcej niż jedno słowo oraz umieszczania słów przed pierwszym lub za ostatnim wyrazem przetłumaczonego zdania.

Najbardziej skuteczny, jednak zazwyczaj odrzucany na korzyść modeli II, III i IV m.in. ze względu na złożoność obliczeniową.

Przypisy edytuj

↑ P. Brown, S. Della Pietra, V. Della Pietra, R. Mercer (1993). The mathematics of statistical machine translation: parameter estimation. Computational Linguistics, 19(2), s. 263–311.
↑ M. Junczys-Dowmunt, (2008). Wprowadzenie do metod statystycznych w tłumaczeniu automatycznym,. Investigationes Linguisticase vol. XVI,, s. 44-66.

[1] P. Brown, S. Della Pietra, V. Della Pietra, R. Mercer (1993). The mathematics of statistical machine translation: parameter estimation. Computational Linguistics, 19(2), s. 263–311.

[2] M. Junczys-Dowmunt, (2008). Wprowadzenie do metod statystycznych w tłumaczeniu automatycznym,. Investigationes Linguisticase vol. XVI,, s. 44-66.

[1]

[2]