Previsões de mercado através de notícias

O mercado de ações influencia economias em todo o globo. As variações dele podem impactar direta ou indiretamente áreas de negócios. A previsibilidade nesse ramo pode ser a diferença do lucro e prejuízo, seja para um pessoa física ou uma nação. Entretanto, há inúmeras variáveis e relações entre elas que dificultam em muito a construção de um modelo preditivo. Este trabalho apresenta um protótipo capaz de receber como entrada notícias divulgadas na Internet e dados históricos de ativos do mercado de ações para assim, treinar modelos preditivos e retornar predições sobre a variação do ativo de interesse. Os algoritmos utilizados para os modelos preditivos foram: Random Forest, K-Neighbors e SVM. As métricas utilizadas para verificar qual destes teve o melhor desempenho foram: MAPE (Mean Absolute Percentage Error) e MSE (Mean Square Error). O primeiro, mais voltado para o quanto, proporcionalmente, os valores de predição diferem do esperado. Já o segundo dá mais relevância aos pontos de divergência ou chamados pontos fora da curva do que o primeiro. Nos resultados obtidos é visto que o algoritmo Random Forest é em média 30% mais preciso que os demais. Entretanto, é necessário mencionar que há certa variação nas métricas dependendo da ação alvo de predição, Nos ativos que tiveram mais variações bruscas nos históricos, foram encontrados maiores erros de predição. Essa dificuldade na predição ocorre mesmo que um ativo tenha mais notícias ao seu respeito alimentando o modelo preditivo. Ou seja, vemos que as variáveis externas às notícias como, por exemplo, ações relacionadas podem impactar as ações. Um provável exemplo disso é visto nos dados da empresa Tesla, onde temos muitas notícias do respetivo acionista majoritário e de empresas relacionadas a esta pessoa. ...

Abstract

The stock market influences economies across the globe. Its variations can directly or indirectly impact business areas. Predictability in this segment can be the difference between profit and loss, whether for an individual or a nation. However, there are numerous variables and relationships between them that make building a predictive model very difficult. This work aims to build a predictive model based on news published on the Internet. This work presents a prototype capable of taking as input news published on the Internet and historical data of stock market assets to train predictive models and return predictions on the variation of the asset of interest. The algorithms used for the predictive models were Random Forest, K-Neighbors, and SVM. The metrics used to determine which of these performed best were MAPE (Mean Absolute Percentage Error) and MSE (Mean Square Error). The former is more focused on how much the prediction values differ proportionally from the expected ones. The latter gives more weight to divergence points or so-called outliers than the former. The results obtained show that the Random Forest algorithm is on average 30% more accurate than the others. However, it is necessary to mention that there is some variation in the metrics depending on the target prediction asset. For assets that had more drastic fluctuations in their histories, larger prediction errors were found. This prediction difficulty occurs even when an asset has more news about it feeding the predictive model. In other words, we see that variables external to the news, such as related stocks, can impact stocks. A probable example of this is seen in the data of the Tesla company, where we have much news about the respective majority shareholder and companies related to this person. ...

Instituição

Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Engenharia da Computação: Bacharelado.

Coleções

Trabalhos de Conclusão de Curso de Graduação (38354)

TCC Ciência da Computação (1074)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License