Show simple item record

dc.contributor.advisorPaikens, Pēteris
dc.contributor.authorJasinovičs, Artis
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2023-09-06T01:03:44Z
dc.date.available2023-09-06T01:03:44Z
dc.date.issued2023
dc.identifier.other96177
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/64297
dc.description.abstractValodas modeļi (“GPT”, “Llama”, “LaMBDA”) ir dažu gadu laikā sasnieguši lieliskus rezultātus dabiskās valodas ģenerēšanas uzdevumos. Šāda attīstība ir radījusi iespējas uzlabot visdažādākās sabiedrības darbības jomas, bet līdzās uzlabojumiem tie arī tiek izmantoti ļaunprātīgiem nolūkiem (krāpšanai, propaganda). Modeļu izmantošanas uzplaukums un to sekas, ir radījis nepieciešamību pēc efektīvām metodē kā atšķirt šo valodas modeļu ģenerētu tekstu no īsta cilvēku rakstīta. Bakalaura darbā tika apskatītas, salīdzinātas un eksperimentāli novērtētas pašlaik pieejamākās un modernākās detektēšanas metodes (“OpenAI” klasifikators, “GPTZero”, u.c). Pašreiz pieejamās valodas modeļu detektēšanas metodes neuzrāda pārliecinošus rezultātus vispārīgai valodas modeļu detektēšanai uz dažādu izmēru, valodu un modeļu ģenerētiem tekstiem.
dc.description.abstractLanguage models (GPT, Llama, LaMBDA) in recent years have achieved surprising results in natural language generation tasks. These improvements have made it possible to improve various areas of society. Alongside these improvements there are also ways in which they can be used for nefarious purposes (scams, propaganda). There has emerged a need for effective ways to detect text generated by models and human written text. In this bachelor’s thesis we look at, compare, and experimentally measure the effectiveness of the currently most available and modern detecting methods like OpenAI text classifier and GPTZero. As a result of the experiments, it is clear that the currently available detection methods do not show convincing results of general language model detection on texts of assorted sizes, languages, and model generated texts.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectvalodas modeļi
dc.subjectvalodas modeļu detektori
dc.subjectsarunboti
dc.subjectGPT
dc.subjectGPTZero
dc.titleValodas modeļu ģenerēta teksta detektēšanas metodes
dc.title.alternativeMethods for detecting text generated by language models
dc.typeinfo:eu-repo/semantics/bachelorThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record