Mostrar registro simples

dc.contributor.advisorBecker, Karinpt_BR
dc.contributor.authorSouza, Vanessa Borba dept_BR
dc.date.accessioned2021-01-28T04:01:49Zpt_BR
dc.date.issued2020pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/217568pt_BR
dc.description.abstractA depressão tornou-se um problema de saúde pública mundial, que atinge cerca de 322 milhões de pessoas no mundo, a um custo aproximado de $2,5 trilhões de dólares. A taxa de comorbidade de depressão com ansiedade também é alta, acentuando o quadro clínico de indivíduos deprimidos. A identificação precoce desses distúrbios é um fator crítico para a triagem correta e a decisão apropriada sobre as linhas de tratamento adequadas. O uso das redes sociais como forma de os indivíduos exporem suas dificuldades anonimamente permitiu a ampliação de estudos em saúde mental com o apoio da área computacional. Trabalhos relacionados abordam a identificação automática de condições mentais específicas, com foco na depressão. O presente trabalho expande essas contribuições, propondo um classificador ensemble para a identificação automática de depressão, ansiedade e a comorbidade dessas desordens, utilizando um conjunto de dados de autodiagnóstico extraído da rede social Reddit. O uso do método ensemble visa superar as dificuldades de lidar com o problema de classificação multirrótulo envolvidas no cenário de comorbidade, onde os padrões distintos podem ser mais difíceis de identificar. O nível mais baixo ensemble é composto de classificadores fracos que geram previsões binárias de rótulo único em condições de treinamento específicas e que seguem uma arquitetura de aprendizado profundo. Para o nível meta-learning, uma rede neural densa explora esses classificadores fracos como um contexto para se chegar a uma decisão com vários rótulos. Um extenso conjunto de experimentos usando as arquiteturas de aprendizado profundo LSTM, CNN e sua combinação, word embeddings e topologias ensemble foi desenvolvido. Todos os classificadores fracos e o modelo ensemble superaram as linhas de base. Os classificadores binários baseados na CNN obtiveram o melhor desempenho, com medidas F de 0,79 para depressão, 0,78 para ansiedade e 0,78 para comorbidade. A topologia do conjunto que obteve o melhor desempenho (perda de Hamming de 0,27 e taxa de correspondência exata de 0,47) combina classificadores fracos de acordo com três arquiteturas e não inclui classificadores de comorbidade. Também realizamos uma análise qualitativa usando SHAP, e confirmamos que as características influentes estão relacionadas aos sintomas desses distúrbios.pt_BR
dc.description.abstractDepression has become a worldwide public health problem, affecting approximately 322 million people worldwide. The comorbidity rate of depression with anxiety is also high, accentuating the clinical picture of depressed individuals. The early identification of these disorders is a critical factor for the correct screening and appropriate decision on the proper lines of treatment. The use of social networks as a means for individuals to expose their difficulties anonymously allowed the expansion of studies in mental health with the support of the computational area. Related works address the automatic identification of specific mental conditions, with a focus on depression. The present work expands these contributions by proposing an ensemble classifier for the automatic identification of depression, anxiety, as well as the comorbidity, using a self-diagnosed dataset extracted from Reddit. The use of a stacking ensemble aims to overcome the difficulties of dealing with the multi-class, multi-label classification problem involved in the scenario of comorbidity, where the distinctive patterns may be harder to identify. The stacking is composed of specialized single label binary classifiers that distinguish between specific disorders and control users. A meta-learner explores these weak classifiers as a context for reaching a multi-label, multi-class decision. We developed extensive experiments using alternative architectures (LSTM, CNN, and their combination), word embeddings, and ensemble topologies. All weak classifiers and ensembles outperformed the baselines. The CNN-based binary classifiers achieved the best performance, with f-measures of 0.79 for depression, 0.78 for anxiety, and 0.78 for comorbidity. The ensemble topology that achieved the best performance (Hamming Loss of 0.27 and Exact Match Ratio of 0.47) combines weak classifiers according to three architectures, and do not include comorbidity classifiers. We also performed a qualitative analysis using SHAP, and confirmed the influential features are related to symptoms of these disorders.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoengpt_BR
dc.rightsOpen Accessen
dc.subjectEnsembleen
dc.subjectAprendizado profundopt_BR
dc.subjectWord embeddingsen
dc.subjectRedes sociaispt_BR
dc.subjectSaúde mentalpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectAnsiedadept_BR
dc.subjectDepressãopt_BR
dc.subjectComorbidadept_BR
dc.titleDAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidadept_BR
dc.title.alternativeA deep learning ensemble to classify anxiety, depression, and their comorbidity from texts of social networks en
dc.typeDissertaçãopt_BR
dc.identifier.nrb001121922pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.programPrograma de Pós-Graduação em Computaçãopt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2020pt_BR
dc.degree.levelmestradopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples