Hybrid machine translation by combining output from multiple machine translation systems
Autor
Rikters, Matīss
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Skadiņa, Inguna
Datum
2019Metadata
Zur LanganzeigeZusammenfassung
Šis darbs pēta metodes un izstrādā rīkus, lai kombinētu tulkojumus no dažādām mašīntulkošanas (MT) sistēmām, uzlabojot kopējo tulkojuma kvalitāti. Tiek pētīta metožu piemērojamība mazajām, morfoloģiski bagātajām valodām, it īpaši latviešu un igauņu valodai. Analizētas esošās metodes un izstrādātas vairākas jaunas, kuras implementētas un novērtētas, izmantojot automātisko un cilvēka vērtēšanu. Radītas vairākas jaunas metodes, kas: sadala avotvalodas teikumu fragmentos un tos kombinē, izmantojot valodas modeli; kombinē neirontulkojumus, izmantojot neironu MT uzmanības sastatījumus; iteratīvi papildina apmācības datus ar vairākpakāpju tulkošanas pieeju. Galvenie rezultāti ir jaunu tulkojumu kvalitātes standartu sasniegušas angļu-igauņu MT sistēmas; metodes neironu MT uzmanības sastatījumu izmantošanai MT kombinēšanai un izpratnei; MT kombinēšanas sistēmas angļu-latviešu statistiskajām MT sistēmām. Atslēgvārdi: Mašīntulkošana, datorlingvistika This thesis aims to combine output from multiple machine translation (MT) systems to increase the translation quality. Applicability of the developed methods for small, morphologically rich languages is evaluated. Existing methods have been analysed, several combination methods have been proposed, which have been implemented and evaluated using automatic and human evaluation. Novel methods have been created that split source text into fragments and combine them using a language model; combine neural MT output by using attention alignments; use a multi-pass approach to produce additional incrementally improving training data. Key results are new state-of-the-art English-Estonian MT systems; approaches that use attention alignments for MT combination and comprehension of translations; systems for combining output from English-Latvian statistical MT. Keywords: Machine Translation, Natural Language Processing