Valodas modeļu ģenerēta teksta detektēšanas metodes

Jasinovičs, Artis

dc.contributor.advisor	Paikens, Pēteris
dc.contributor.author	Jasinovičs, Artis
dc.contributor.other	Latvijas Universitāte. Datorikas fakultāte
dc.date.accessioned	2023-09-06T01:03:44Z
dc.date.available	2023-09-06T01:03:44Z
dc.date.issued	2023
dc.identifier.other	96177
dc.identifier.uri	https://dspace.lu.lv/dspace/handle/7/64297
dc.description.abstract	Valodas modeļi (“GPT”, “Llama”, “LaMBDA”) ir dažu gadu laikā sasnieguši lieliskus rezultātus dabiskās valodas ģenerēšanas uzdevumos. Šāda attīstība ir radījusi iespējas uzlabot visdažādākās sabiedrības darbības jomas, bet līdzās uzlabojumiem tie arī tiek izmantoti ļaunprātīgiem nolūkiem (krāpšanai, propaganda). Modeļu izmantošanas uzplaukums un to sekas, ir radījis nepieciešamību pēc efektīvām metodē kā atšķirt šo valodas modeļu ģenerētu tekstu no īsta cilvēku rakstīta. Bakalaura darbā tika apskatītas, salīdzinātas un eksperimentāli novērtētas pašlaik pieejamākās un modernākās detektēšanas metodes (“OpenAI” klasifikators, “GPTZero”, u.c). Pašreiz pieejamās valodas modeļu detektēšanas metodes neuzrāda pārliecinošus rezultātus vispārīgai valodas modeļu detektēšanai uz dažādu izmēru, valodu un modeļu ģenerētiem tekstiem.
dc.description.abstract	Language models (GPT, Llama, LaMBDA) in recent years have achieved surprising results in natural language generation tasks. These improvements have made it possible to improve various areas of society. Alongside these improvements there are also ways in which they can be used for nefarious purposes (scams, propaganda). There has emerged a need for effective ways to detect text generated by models and human written text. In this bachelor’s thesis we look at, compare, and experimentally measure the effectiveness of the currently most available and modern detecting methods like OpenAI text classifier and GPTZero. As a result of the experiments, it is clear that the currently available detection methods do not show convincing results of general language model detection on texts of assorted sizes, languages, and model generated texts.
dc.language.iso	lav
dc.publisher	Latvijas Universitāte
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Datorzinātne
dc.subject	valodas modeļi
dc.subject	valodas modeļu detektori
dc.subject	sarunboti
dc.subject	GPT
dc.subject	GPTZero
dc.title	Valodas modeļu ģenerēta teksta detektēšanas metodes
dc.title.alternative	Methods for detecting text generated by language models
dc.type	info:eu-repo/semantics/bachelorThesis

Files in this item

Name:: 302-96177-Jasinovics_Artis_aj1 ...
Size:: 917.3Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5488]

Show simple item record