Text Mining, um estudo a partir da rede social Twitter
Visualizar/abrir
Data
2013Orientador
Nível acadêmico
Graduação
Resumo
A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de in ...
A cada dia, mais dados são armazenados por computadores cada vez mais poderosos e capazes de processar muita informação. Com isso, cresce a necessidade de utilizar toda essa informação no processo de tomada de decisão. Estima-se que 80% da informação que uma organização dispõe esteja no formato de texto. Além disso, o advento das redes sociais na web possibilitou um ambiente virtual em que milhões de usuários publicam dados pessoais, opiniões e preferências, tornando-se uma fonte preciosa de informação. Diante desse cenário, a descoberta de conhecimento em texto torna-se uma ferramenta importante para extrair informação a partir de bases textuais sem a necessidade de leitura. Nesse sentido, o objetivo deste trabalho é apresentar a abordagem de Text Mining com as fases que compõem o processo, desde a extração até a análise dos dados, e mostrar uma aplicação da técnica com dados do Twitter. Utilizando o software R, foram extraídas as publicações do Twitter da Zero Hora – jornal local – num período de quase 3 meses, e foi construída uma nuvem de palavras com os termos mais frequentes. E, através da técnica de Clustering, os tweets foram agrupados conforme seus assuntos. ...
Instituição
Universidade Federal do Rio Grande do Sul. Instituto de Matemática. Departamento de Estatística. Curso de Estatística: Bacharelado.
Coleções
-
TCC Estatística (295)
Este item está licenciado na Creative Commons License