Efektīva balss atpazīšanas sistēma Android vides lietotnēm
Autor
Kozlovs, Niks
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Straujums, Uldis
Datum
2024Metadata
Zur LanganzeigeZusammenfassung
Šajā bakalaura darbā "Efektīva balss atpazīšanas sistēma Android vides lietotnēm" tiek pētīta un izstrādāta inovatīva balss atpazīšanas sistēma, kas paredzēta mobilajām ierīcēm. Mūsdienās balss atpazīšana ir uzlabojusies ļoti strauiji, ļaujot lietotājiem ātri un ērti mijiedarboties ar savām ierīcēm. Tomēr, nepieciešamība pēc augstas precizitātes un zema resursu patēriņa, apstrādājot datus uz pašas ierīces, ir vienmēr bijis izaicinājums izstrādātājiem. Darba mērķis ir izveidot balss atpazīšanas sistēmu, kas spēj nodrošināt augstu transkripcijas precizitāti un efektivitāti, vienlaikus darbojoties uz ierobežotiem mobilās ierīces resursiem. Sistēmas pamatā ir modernā OpenAI Whisper tehnoloģija, kas apvienota ar TFLite bibliotēku, lai nodrošinātu vieglu integrāciju un ātru darbību Android lietotnēs. Šī jaunā balss atpazīšanas sistēma ir izstrādāta ar uzsvaru uz pēc iespējas mazāku kļūdu skaitu un lietošanas ērtumu, nodrošinot, ka visi balss dati tiek apstrādāti lokāli uz ierīces. Tas ne tikai garantē lietotāju datu drošību, bet arī uzlabo sistēmas veiktspēju un samazina nepieciešamību pēc interneta savienojuma. In this bachelor's thesis, "Efficient Voice Recognition System for Android Environment Applications," an innovative voice recognition system designed for mobile devices is researched and developed. Today, voice recognition has significantly improved, allowing users to quickly and easily interact with their devices. However, the constant need for high accuracy and low resource consumption while processing data on the device itself has always been a challenge for developers. The aim of this work is to create a voice recognition system that can ensure high transcription accuracy and efficiency while operating on the limited resources of mobile devices. The system is based on the advanced OpenAI Whisper technology, combined with the TFLite library, to provide easy integration and fast performance in Android applications. This new voice recognition system is designed with an emphasis on minimizing errors and ease of use, ensuring that all voice data is processed locally on the device. This not only guarantees the security of user data but also improves system performance and reduces the need for a constant internet connection.