Um estudo utilizando-se de análise de sentimentos e aprendizado de máquina para a classificação de tweets sobre a vacinação no Brasil
Visualizar/abrir
Data
2022Autor
Orientador
Co-orientador
Nível acadêmico
Graduação
Outro título
A study using sentiment analysis and machine learning to classify tweets about vaccination in Brazil
Assunto
Resumo
Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina ...
Devido a atual situação de COVID-19 no mundo, cientistas e profissionais da área de saúde precisaram elaborar, criar, testar e lançar em tempo recorde uma vacina para tentar controlar a pandemia. E desde sempre a vacinação é um tópico muito discutido pelas pessoas. No ambiente da plataforma online Twitter, usuários expressam seus sentimentos, opiniões e crenças sobre diversos assuntos através de tweets, e o assunto da vacinação não ficaria de fora. Utilizando técnicas de aprendizado de máquina sobre um grande conjunto de dados, tweets, por exemplo, é possível gerar um modelo para tentar prever a opinião dos usuários sobre a vacinação. O estudo e trabalho realizado foi de utilizar-se destas técnicas de inteligência artificial, mais especificamente modelos supervisionados para classificação, para rotular e classificar os tweets de um grande conjunto de dados em classes a favor ou contra a vacinação. Em seguida, incorporar e utilizar-se de técnicas de análise de sentimento nestes tweets sobre vacina e vacinação, a fim de perceber se estes possuem sentimento muito positivo, positivo, neutro, negativo ou muito negativo, para então verificar se ao adicionar estes novos fatores melhoraria-se os resultados do modelo classificador de texto a determinar se estes tweets são favoráveis ou contrários à vacinação. Além de por fim analisar e tentar entender os principais motivos por tais sentimentos sobre o tópico em geral. Sendo assim, foi feita uma análise sobre o contexto e motivos dos sentimentos, mostrando-se como distribuem-se os cinco sentimentos em ambas as classes: anti-vacina e pró-vacina. Em especial, notou-se que a política está extremamente entrelaçada com o tópico de vacinas e vacinação. Que houve um aumento na positividade dos sentimentos em relação ao tópico ano 2021 quando comparado com o tópico ano 2020. E que os sentimentos mais expressados pelas classes pró-vacina é o positivo, já pela classe anti-vacina é o neutro. Finalmente, a partir dos experimentos realizados no trabalho, concluiu-se que a metodologia proposta em incorporar os scores da análise de sentimentos como uma das features em um modelo estado da arte Linear SVC, quando utilizando-se uma pontuação TF-IDF, não avança de forma significativa as suas classificações, entretanto demonstra a sua atual eficácia para o seu devido propósito. ...
Abstract
Due to the current situation of COVID-19 in the world, scientists and health professionals needed to develop, create, test and launch a vaccine in record time to try to control the pandemic. Vaccination has always been a topic much discussed by people. In the envi ronment of the online platform Twitter, users express their feelings, opinions and beliefs about different subjects through tweets, and the subject of vaccination would not be left out. Using machine learning techniques on a large set ...
Due to the current situation of COVID-19 in the world, scientists and health professionals needed to develop, create, test and launch a vaccine in record time to try to control the pandemic. Vaccination has always been a topic much discussed by people. In the envi ronment of the online platform Twitter, users express their feelings, opinions and beliefs about different subjects through tweets, and the subject of vaccination would not be left out. Using machine learning techniques on a large set of data, tweets, for example, it is possible to generate a model to try to predict the opinion of users about vaccination. The study and work carried out was to use these artificial intelligence techniques, more specif ically supervised models for classification, to label and classify tweets from a large set of data into classes for or against vaccination. Then, incorporate and use sentiment analysis techniques in these tweets about vaccine and vaccination, in order to see if they have a very positive, positive, neutral, negative or very negative sentiment, and then verify that if by adding these new factors it would improve the results of the text classifier model to determine whether these tweets are in favor or against vaccination. In addition, to analyze and try to understand the main reasons for such feelings about the topic in general. There fore, an analysis was made of the context and reasons for these sentiments, showing how the five sentiments are distributed in both classes: anti-vaccine and pro-vaccine. In par ticular, it was noted that the politics are extremely intertwined with the topic of vaccines and vaccination. That there was an increase in the positivity of sentiments in relation to the year 2021 topic when compared to the year 2020 topic. And that the sentiment most expressed by the pro-vaccine classe is positive, while the anti-vaccine class is neutral. Finally, from the experiments carried out in the work, it was concluded that the method ology proposed in incorporating the sentiment analysis scores as one of the features in a state-of-the-art Linear SVC model, when using a TF-IDF score, does not advance its classification ratings significantly, however it demonstrates its current effectiveness for its intended purpose. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Informática. Curso de Ciência da Computação: Ênfase em Ciência da Computação: Bacharelado.
Coleções
-
TCC Ciência da Computação (1024)
Este item está licenciado na Creative Commons License