11 metru soda sitienu stratēģijas optimizācija futbolā, izmantojot mašīnmācīšanos
Author
Puriņš, Ritvars
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Afanasjevs, Iļja
Date
2024Metadata
Show full item recordAbstract
Futbols ir pasaulē populārākais sporta veids, kas spēļu laikā uz pasaules lielākās skatuves piesaista vairāk kā miljards skatītāju. Dotā pētījuma laikā tika analizēti arī citi saistīti pētījumi un statistika. Tie atklāj, ka gandrīz puse no futbola lielākā turnīra laikā aizvadītajām spēlēm tika izšķirtas ar 11 metru soda sitieniem. Kā liecina pētījumi, zaudējuma vai uzvaras cena var būt vairāki miljoni ASV dolāru. Tomēr, kad spēle nonāk līdz 11 metru soda sitieniem, izredzes gūt vārtus un atvairīt sitienu izrādās ne tuvu vienlīdzīgas. Šī pētījuma laikā analizētā literatūra liecina, ka soda sitienu izpildītājiem ir krietna priekšrocība. Tas, galvenokārt, ir saistīts ar spēju izmantot māņkustības un vārtsargu statistisko neiespējamību savlaicīgi reaģēt, sitienu ātruma un attāluma dēļ. Tāpēc vārtsargiem, lielā mērā, ir jāmin, lai viņiem būtu iespēja atvairīt sitienu. Šī pētījuma mērķis ir izveidot mašīnmācīšanās algoritmu, kas spēj paredzēt 11 metru soda sitienu novietojumu vārtos, kā arī vārtsarga pozīciju vārtos, lai optimizētu soda sitienu stratēģiju. Lai to paveiktu, vispirms autors izveidoja datu bāzi, kurā tika apvienoti dati no publiski pieejamas datu bāzes Transfermarkt, kā arī tika veikta papildus video analīze, izmantojot YouTube. Datubāze sastāv no 11 metru soda sitieniem, kurus izpildījuši pieci dažādi profesionāli vīriešu futbolisti no dažādām futbola līgām visā pasaulē. Kopumā datu bāze sastāv no 472 analizētiem 11 metru soda sitieniem. Pēc datu bāzes izveides autors izveidoja mašīnmācības risinājumu, izmantojot Python programmēšanas valodu. Autora izstrādātais risinājums izmanto vairākas bibliotēkas datu manipulācijām un datu vizualizēšanai. Datu manipulācijām autors izmantoja Pandas, Scikit-learn priekš mašīnmācīšanās rīkiem, bet vizualizācijām – Matplotlib un Seaborn. Kā dotā pētījuma mašīnmācīšanās pamatu, autors izmantoja Random Forest Classifier. Izstrādātais risinājums ietver arī savstarpēju validāciju, kas nozīmē, ka algoritms tika apmācīts, pamatojoties uz noteiktu daļu no datiem, un vēlāk tika pārbaudīts pret atlikušajiem datiem. Autora izstrādātais risinājums tika pārbaudīts uz nepilnīgiem datiem. Dotajā gadījumā, katram spēlētājam no datu bāzes tika izņemti 10 pēdējie izpildītie 11 metru soda sitieni. Tas tika darīts ar nolūku, lai vēlāk pārbaudītu risinājuma prognozes pret reālajiem rezultātiem. No 50 kopējiem 11 metru soda sitieniem, autora izstrādātais risinājums spēja pareizi paredzēt 22 soda sitienu novietojumu vārtos. Turklāt, autora izstrādātais risinājums spēja precīzi paredzēt vārtsargu pozīciju vārtos 26 reizes no 50. Binārās klasifikācijas precizitātes aprēķini atklāja, ka risinājuma precizitāte ir 44%, mēģinot paredzēt 11 metru soda sitienu novietojumu vārtos un 52%, mēģinot paredzēt vārstarga pozīciju. Tas nozīmē, ka atbilde uz izvirzīto pētījuma jautājumu: "Vai ir iespējams precīzi paredzēt 11 metru soda sitienu novietojumu vārtos vismaz pusei no gadījumu, izmantojot mašīnmācīšanos?" ir - nē. Lai gan atbilde uz izvirzīto pētījuma jautājumu ir negatīva, šo pētījumu joprojām var izmantot 11 metru soda sitienu prognozēšanai, lai gan citā jomā. Analizētie pētījumi liecina, ka sporta zinātnes un kinemātikas jomā tiek izstrādāti līdzīgi risinājumi 11 metru soda sitienu prognozēšanai. Risinājumi šajās jomās, galvenokārt, ir balstīti uz cilvēka ķermeņa kustībām pirms sitiena. Tomēr šis pētījums var kalpot par pamatu, lai uzlabotu minētajās jomās notiekošos pētījumus, tādējādi palīdzot izveidot efektīvu 11 metru soda sitienu stratēģijas optimizācijas risinājumu. Atslēgvārdi: Mašīnmācīšanās, futbols, 11 metru soda sitieni, prognozēšana Football is the world's most popular sport, attracting over a billion viewers during games on the world's most significant stage. Other research and statistics analyzed during this research reveal that nearly half of the games played during football's largest tournament have been decided by penalty kicks. Additionally, research shows that the cost of losing or winning can be a matter of millions of dollars going to a nation or a team. However, once the game goes to penalty kicks, the chances of scoring and saving the ball are rather one-sided. The literature analyzed during this research shows that the penalty kick takers have a severe advantage. This is due to the ability to use deceptive moves and the statistical improbability of goalkeepers to react in time due to the speed and distance of the kicks. Therefore, the goalkeepers are left mainly to guess in order to have a chance of saving the ball. This research aims to create a machine learning algorithm that can predict shot placement and goalkeeper positioning to optimize penalty kick strategy. In order to do this, the author created a database that combined data from a publicly available database, Transfermarkt, and conducted additional video analysis using YouTube. The database consists of penalty kicks taken by five professional male football players from different football leagues worldwide. Collectively, the database consists of 472 penalty kicks analyzed. After creating the database, the author created a machine-learning solution using Python programming language. The created solution consists of several libraries that were used for data manipulation and data visualization. The author used Pandas for data manipulations and Scikit-learn for machine- learning tools but for the visualizations – Matplotlib and Seaborn. From the machine learning side, the author used Random Forest Classifier to make the predictions for penalty kick placements and the predictions of goalkeeper positioning. The solution also involves cross- validation, meaning the created model was trained on some data and tested against the rest. The solution was tested on incomplete data, meaning that 10 latest penalty kicks were taken out of the database for each player. This was done purposefully to test the solution's prediction against the actual outcomes later. Out of 50 total penalty kicks, the solution was able to predict the shot placement of 22 penalty kicks correctly. However, the model was able to correctly predict the goalkeeper position 26 times. Calculations of precision for binary classification revealed that the accuracy of the solution is 44% and 52%, respectively. This means that the answer to the set research question: “Is it possible to predict the exact location of at least half of the penalties taken with the use of machine learning?” is - no. Although the answer to the set research question is negative, this research can still be used for penalty kick predictions in a different field. The analyzed research shows that the field of sports science and kinematics is developing similar solutions for penalty kick prediction. The solutions in those fields are mainly based on human body movements before the shot. However, this research can serve as a foundation to improve their ongoing research, thus ultimately helping to create an efficient penalty kick strategy optimization solution. Keywords: Machine learning, football, penalty kicks, prediction