Show simple item record

dc.contributor.advisorIvanovs, Maksims
dc.contributor.authorVītols, Andris
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2024-06-20T01:04:30Z
dc.date.available2024-06-20T01:04:30Z
dc.date.issued2024
dc.identifier.other102949
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/66138
dc.description.abstractLielo valodas modeļu izmantošana specifisku uzdevumu veikšanai var būt nepieciešams veikt papildus pielāgošanu. Gan izmantošana, gan pielāgošana prasa ievērojami daudz datorresursu. Abi šie ierobežojumi kavē lielo valodas modeļu tālāku pētniecību, attīstību un ieviešanu. Šī bakalaura darba mērķis ir apskatīt metodes un metodoloģijas, kas varētu atvieglot lielo valodas modeļu pielāgošanas procesu ar ierobežotiem datorresursiem. Tika veikti divi eksperimenti lietojot darbā apskatīto metodoloģiju. 1. eksperimentā tika veikta Mistral-7B-Instruct-v0.2 kvantēta modeļa tālāka pielāgošana instrukciju sekošanai, 2. eksperimentā Mistral-7B-v0.1. Abos eksperimentos metrikās tika iegūtu salīdzinoši labāki rezultāti. Atslēgas vārdi: kvantēšana, lielie valodas modeļi, metodoloģija, metrikas, pielāgošana
dc.description.abstractUsing large language models for specific tasks may require the model to be fine-tuned. Both the use and tuning require a significant amount of computer resources. These limitations hinder further research, development and implementation of large language models. The purpose of this bachelor's paper is to review methods and methodologies that could ease the process of fine-tuning large language models with limited computer resources. Two experiments were conducted using the methodology discussed in this work. In experiment 1, further adaptation of the Mistral-7B-Instruct-v0.2 quantized model for instruction following was performed, in experiment 2 it was done with Mistral-7B-v0.1. In both experiments, the metrics reflected relatively better results. Key words: benchmarks, fine-tuning, large language models, methodology, quantization
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectkvantēšana
dc.subjectlielie valodas modeļi
dc.subjectmetodoloģija
dc.subjectmetrikas
dc.subjectpielāgošana
dc.titleLielo valodas modeļu automātiska pielāgošana
dc.title.alternativeLarge language model self-alignment
dc.typeinfo:eu-repo/semantics/bachelorThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record