Show simple item record

dc.contributor.advisorSkadiņa, Inguna
dc.contributor.authorRikters, Matīss
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2019-07-26T01:01:32Z
dc.date.available2019-07-26T01:01:32Z
dc.date.issued2019
dc.identifier.other69076
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/48853
dc.description.abstractŠis darbs pēta metodes un izstrādā rīkus, lai kombinētu tulkojumus no dažādām mašīntulkošanas (MT) sistēmām, uzlabojot kopējo tulkojuma kvalitāti. Tiek pētīta metožu piemērojamība mazajām, morfoloģiski bagātajām valodām, it īpaši latviešu un igauņu valodai. Analizētas esošās metodes un izstrādātas vairākas jaunas, kuras implementētas un novērtētas, izmantojot automātisko un cilvēka vērtēšanu. Radītas vairākas jaunas metodes, kas: sadala avotvalodas teikumu fragmentos un tos kombinē, izmantojot valodas modeli; kombinē neirontulkojumus, izmantojot neironu MT uzmanības sastatījumus; iteratīvi papildina apmācības datus ar vairākpakāpju tulkošanas pieeju. Galvenie rezultāti ir jaunu tulkojumu kvalitātes standartu sasniegušas angļu-igauņu MT sistēmas; metodes neironu MT uzmanības sastatījumu izmantošanai MT kombinēšanai un izpratnei; MT kombinēšanas sistēmas angļu-latviešu statistiskajām MT sistēmām. Atslēgvārdi: Mašīntulkošana, datorlingvistika
dc.description.abstractThis thesis aims to combine output from multiple machine translation (MT) systems to increase the translation quality. Applicability of the developed methods for small, morphologically rich languages is evaluated. Existing methods have been analysed, several combination methods have been proposed, which have been implemented and evaluated using automatic and human evaluation. Novel methods have been created that split source text into fragments and combine them using a language model; combine neural MT output by using attention alignments; use a multi-pass approach to produce additional incrementally improving training data. Key results are new state-of-the-art English-Estonian MT systems; approaches that use attention alignments for MT combination and comprehension of translations; systems for combining output from English-Latvian statistical MT. Keywords: Machine Translation, Natural Language Processing
dc.language.isoeng
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātnes
dc.subjectComputer Science
dc.subjectSoftware and Systems Engineering
dc.titleHybrid machine translation by combining output from multiple machine translation systems
dc.title.alternativeHibrīda mašīntulkošana, kombinējot vairāku mašīntulkošanas sistēmu rezultātus.
dc.typeinfo:eu-repo/semantics/doctoralThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record