Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
Visualizar/abrir
Data
2018Orientador
Nível acadêmico
Graduação
Resumo
A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realiz ...
A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates. ...
Abstract
The prediction of sport events through machine learning algorithms, especially in football, is a subject which has been in the spotlight lately, mainly because of the increase in the amount of data available and the popularity of the game. This work presents a study focused on the comparison of several classifiers when these are used to predict the result of football matches from the Premier League, an English tournament. Using data from the seasons comprised in the period of 2000-2017, a compa ...
The prediction of sport events through machine learning algorithms, especially in football, is a subject which has been in the spotlight lately, mainly because of the increase in the amount of data available and the popularity of the game. This work presents a study focused on the comparison of several classifiers when these are used to predict the result of football matches from the Premier League, an English tournament. Using data from the seasons comprised in the period of 2000-2017, a comparison between ten classifiers was made. A selection of features was conducted, allied with the optimization of the classifiers and the search for the optimal number of matches ignored at the beginning of each season. The best accuracy obtained was 54.73% ± 2.06% (Logistic Regression), 54.82% ± 2.01 (Linear Discriminant Analysis), 54.35% ± 2.12% (SVM with linear linear) and 54.34% ± 1.93% (K-Nearest Neighbors). An ensemble classifier was created using six different classifiers. The ensemble obtained 57% of accuracy when analyzing a new test data set. Comparing these results to the defined baselines (hometeam victory, with 46.56% of accuracy, and victory of the team with the biggest ELO, with 50.24% of accuracy) it was proved that the best classifiers surpassed all the baselines, scoring better than most of the related literature. It was possible to conclude that the majority of the classifiers presented few or zero predictions regarding the draw class. The classifier that better predicted draws was the Linear Discriminant Analysis. However, this classifier presented the worst accuracy among all the classifiers analysed (42.63% ± 2.33%). In this way, in order to achieve greater accuracy, it is necessary to study the problem related to draw predictions. ...
Instituição
Universidade Federal do Rio Grande do Sul. Escola de Engenharia. Curso de Engenharia Elétrica.
Coleções
-
TCC Engenharias (5882)
Este item está licenciado na Creative Commons License