DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade

Souza, Vanessa Borba de

dc.contributor.advisor	Becker, Karin	pt_BR
dc.contributor.author	Souza, Vanessa Borba de	pt_BR
dc.date.accessioned	2021-01-28T04:01:49Z	pt_BR
dc.date.issued	2020	pt_BR
dc.identifier.uri	http://hdl.handle.net/10183/217568	pt_BR
dc.description.abstract	A depressão tornou-se um problema de saúde pública mundial, que atinge cerca de 322 milhões de pessoas no mundo, a um custo aproximado de $2,5 trilhões de dólares. A taxa de comorbidade de depressão com ansiedade também é alta, acentuando o quadro clínico de indivíduos deprimidos. A identificação precoce desses distúrbios é um fator crítico para a triagem correta e a decisão apropriada sobre as linhas de tratamento adequadas. O uso das redes sociais como forma de os indivíduos exporem suas dificuldades anonimamente permitiu a ampliação de estudos em saúde mental com o apoio da área computacional. Trabalhos relacionados abordam a identificação automática de condições mentais específicas, com foco na depressão. O presente trabalho expande essas contribuições, propondo um classificador ensemble para a identificação automática de depressão, ansiedade e a comorbidade dessas desordens, utilizando um conjunto de dados de autodiagnóstico extraído da rede social Reddit. O uso do método ensemble visa superar as dificuldades de lidar com o problema de classificação multirrótulo envolvidas no cenário de comorbidade, onde os padrões distintos podem ser mais difíceis de identificar. O nível mais baixo ensemble é composto de classificadores fracos que geram previsões binárias de rótulo único em condições de treinamento específicas e que seguem uma arquitetura de aprendizado profundo. Para o nível meta-learning, uma rede neural densa explora esses classificadores fracos como um contexto para se chegar a uma decisão com vários rótulos. Um extenso conjunto de experimentos usando as arquiteturas de aprendizado profundo LSTM, CNN e sua combinação, word embeddings e topologias ensemble foi desenvolvido. Todos os classificadores fracos e o modelo ensemble superaram as linhas de base. Os classificadores binários baseados na CNN obtiveram o melhor desempenho, com medidas F de 0,79 para depressão, 0,78 para ansiedade e 0,78 para comorbidade. A topologia do conjunto que obteve o melhor desempenho (perda de Hamming de 0,27 e taxa de correspondência exata de 0,47) combina classificadores fracos de acordo com três arquiteturas e não inclui classificadores de comorbidade. Também realizamos uma análise qualitativa usando SHAP, e confirmamos que as características influentes estão relacionadas aos sintomas desses distúrbios.	pt_BR
dc.description.abstract	Depression has become a worldwide public health problem, affecting approximately 322 million people worldwide. The comorbidity rate of depression with anxiety is also high, accentuating the clinical picture of depressed individuals. The early identification of these disorders is a critical factor for the correct screening and appropriate decision on the proper lines of treatment. The use of social networks as a means for individuals to expose their difficulties anonymously allowed the expansion of studies in mental health with the support of the computational area. Related works address the automatic identification of specific mental conditions, with a focus on depression. The present work expands these contributions by proposing an ensemble classifier for the automatic identification of depression, anxiety, as well as the comorbidity, using a self-diagnosed dataset extracted from Reddit. The use of a stacking ensemble aims to overcome the difficulties of dealing with the multi-class, multi-label classification problem involved in the scenario of comorbidity, where the distinctive patterns may be harder to identify. The stacking is composed of specialized single label binary classifiers that distinguish between specific disorders and control users. A meta-learner explores these weak classifiers as a context for reaching a multi-label, multi-class decision. We developed extensive experiments using alternative architectures (LSTM, CNN, and their combination), word embeddings, and ensemble topologies. All weak classifiers and ensembles outperformed the baselines. The CNN-based binary classifiers achieved the best performance, with f-measures of 0.79 for depression, 0.78 for anxiety, and 0.78 for comorbidity. The ensemble topology that achieved the best performance (Hamming Loss of 0.27 and Exact Match Ratio of 0.47) combines weak classifiers according to three architectures, and do not include comorbidity classifiers. We also performed a qualitative analysis using SHAP, and confirmed the influential features are related to symptoms of these disorders.	en
dc.format.mimetype	application/pdf	pt_BR
dc.language.iso	eng	pt_BR
dc.rights	Open Access	en
dc.subject	Ensemble	en
dc.subject	Aprendizado profundo	pt_BR
dc.subject	Word embeddings	en
dc.subject	Redes sociais	pt_BR
dc.subject	Saúde mental	pt_BR
dc.subject	Processamento de linguagem natural	pt_BR
dc.subject	Ansiedade	pt_BR
dc.subject	Depressão	pt_BR
dc.subject	Comorbidade	pt_BR
dc.title	DAC Stacking : Comitê de redes profundas para classificação de ansiedade, depressão e comorbidade	pt_BR
dc.title.alternative	A deep learning ensemble to classify anxiety, depression, and their comorbidity from texts of social networks	en
dc.type	Dissertação	pt_BR
dc.identifier.nrb	001121922	pt_BR
dc.degree.grantor	Universidade Federal do Rio Grande do Sul	pt_BR
dc.degree.department	Instituto de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Computação	pt_BR
dc.degree.local	Porto Alegre, BR-RS	pt_BR
dc.degree.date	2020	pt_BR
dc.degree.level	mestrado	pt_BR

Nome:: 001121922.pdf
Tamanho:: 2.122Mb
Formato:: PDF
Descrição:: Texto completo

Visualizar/abrir

Este item está licenciado na Creative Commons License

Ciências Exatas e da Terra (5043)

Computação (1735)

Mostrar registro simples