Impactos econômicos da covid-19 no mercado odontológico privado no Estado do RS : o desenvolvimento e avaliação de um app low code de data science no knime
dc.contributor.advisor | Hugo, Fernando Neves | pt_BR |
dc.contributor.author | Moreira, Rogério de Freitas | pt_BR |
dc.date.accessioned | 2023-12-29T03:22:35Z | pt_BR |
dc.date.issued | 2023 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/270551 | pt_BR |
dc.description.abstract | Introdução: Nesta pesquisa foi construída uma aplicação de Ciência de Dados na plataforma Knime, para a investigação e análise dos impactos econômicos da COVID-19 durante os seus primeiros 16 meses da pandemia, em consultórios odontológicos privados do Estado brasileiro do Rio Grande do Sul (RS). Objetivo: Desenvolver e avaliar um aplicativo na plataforma analítica Knime visando identificar e interpretar relações entre diferentes variáveis, presentes em diferentes DBs com dados da distribuição e severidade dos casos de COVID-19 no RS, para inferir se estas variáveis estão associadas com métricas específicas relacionadas ao impacto econômico da pandemia no mercado-alvo. Métodos: Todo o app foi construído no Knime, e todas as etapas foram executadas nele. Foram calculadas as seguintes métricas da COVID-19: a) Incidência, para mensurar a disseminação; b) Taxa de Hospitalização, para avaliar casos severos; e c) Taxa de Letalidade, para quantificar casos extremos. Os 497 municípios do Estado foram clusterizados segundo estas métricas mensais. Também foi aplicada em consultórios privados uma survey sobre retração do mercado. O cruzamento destas fontes de dados permitiu a seleção, configuração, aplicação e comparação da performance de 5 diferentes algoritmos de regressão (linear; polinomial de graus 2, 3 e 4; e logística) e 5 de classificação (k-NN; SVM; Naïve Bayes; MLP e AutoML) para avaliar quais deles tiveram os melhores desempenhos na predição dos efeitos econômicos em função das métricas da COVID-19. Mostrou-se o desenvolvimento de uma abordagem no Knime para um processo de Descoberta de Conhecimento em Bases de Dados (KDD) pelo cruzamento de dados de diferentes fontes (aparentemente não relacionadas). A comparação entre performances, para este dataset, indicou que nenhum algoritmo de regressão, e nem o k-NN ou o SVM alcançaram boas performances; Naïve Bayes teve previsões apenas medianas; porém os algoritmos MLP e AutoML tiveram excelentes níveis de acerto nas predições feitas, respectivamente de 98,18% e de 100%. Conclusão: O aplicativo foi construído com sucesso, porém a escassez de respostas à survey comprometeu a validade externa dos resultados da pesquisa, a qual permitiria predições amplamente acertadas e verificáveis no mercado-alvo. Não foi possível identificar associações estatísticas inequívocas entre as métricas da COVID-19 e dos fluxos nos consultórios. Porém ficou preservada a validade interna, legitimando a contento o objetivo da construção de todo um app no Knime, flexível e facilmente adaptável a outras questões de pesquisa e a outras bases de dados, mesmo por usuários sem treinamento formal em linguagens de programação. Outra meta atingida pela clusterização foi a de constatar a existência de 3 a 4 subgrupos a cujos membros pudessem ser aplicadas políticas similares no enfrentamento dos efeitos pesquisados. | pt_BR |
dc.description.abstract | Introduction: In this research a Data Science application was built on the Knime platform, for the investigation and analysis of the economic impacts of COVID-19 in the first 16 months of the pandemic, in private dental practices in the Brazilian state of Rio Grande do Sul (RS). Objective: To develop and evaluate an application on the Knime analytic platform aiming to identify and to interpret relationships between different variables, present in different DBs with data on the distribution and severity of COVID-19 cases in RS, to infer whether these variables are associated with specific metrics related to economic impact on the target market. Methods: The entire app was built in Knime, and all steps were run on it. The following COVID-19 metrics were calculated: a) Incidence, to measure dissemination; b) Hospitalization Rate, to assess severe cases; and c) Lethality Rate, to quantify extreme cases. The 497 municipalities in the State were clustered according to these monthly metrics. A survey on market shrinkage was also applied to private dental practices in RS. The cross-linking of these data sources allowed the selection, configuration, application, and performances comparison of 5 different regression algorithms (linear; polynomial of degrees 2, 3, and 4; and logistic) and 5 classification algorithms (k-NN; SVM; Naïve Bayes; MLP, and AutoML) to assess which of them had the best performance in predicting the economic effects as a function of the COVID19 metrics. Results: The research presents the workflow for constructing this application, and its use for: a) clustering the overall COVID-19 data, which generated only 3 to 4 subgroups that maximize intra-group similarities and inter-group dissimilarities; and b) predicting the hit levels in the predictions of the practices' metrics as a function of the COVID-19 metrics. It was shown the development of an approach in Knime for a Knowledge Discovery in Databases (KDD) process by cross-linking data from different (apparently unrelated) sources. The performance comparison for this dataset indicated that no regression algorithm, neither k-NN nor SVM achieved good performances; Naïve Bayes had only average predictions; but the MLP and AutoML algorithms had excellent hit levels on the predictions made, 98.18% and 100%, respectively. Conclusion: The application was successfully built, but the scarcity of survey responses has compromised the external validity of this research's results, which would allow for largely accurate and verifiable predictions in the target market. It was not possible to identify unequivocal statistical associations between COVID-19 metrics and dental offices' inflows. However, the internal validity was preserved, legitimating the goal of building an entire app in Knime, flexible and easily adaptable to other research questions and other databases, even by users with no formal training in programming languages. Another goal achieved by the clustering was to verify the existence of 3 to 4 subgroups to whose members similar policies could be applied to address the studied effects. | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Economic factors | en |
dc.subject | COVID-19 | pt_BR |
dc.subject | Fatores econômicos | pt_BR |
dc.subject | Dental offices, private | en |
dc.subject | Machine learning | en |
dc.subject | Consultórios odontológicos | pt_BR |
dc.subject | Setor privado | pt_BR |
dc.title | Impactos econômicos da covid-19 no mercado odontológico privado no Estado do RS : o desenvolvimento e avaliação de um app low code de data science no knime | pt_BR |
dc.title.alternative | Economic impacts of covid-19 on the private dental market in Brazilian State of RS : the development and evaluation of a data science low code app on knime | en |
dc.type | Dissertação | pt_BR |
dc.identifier.nrb | 001193234 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Faculdade de Odontologia | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Odontologia | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2023 | pt_BR |
dc.degree.level | mestrado | pt_BR |
Este item está licenciado na Creative Commons License
-
Ciências da Saúde (9127)Odontologia (760)