Tempo de carregamento de páginas web e fatores associados : aplicação de métodos de aprendizado de máquina supervisionados
View/ Open
Date
2022Author
Advisor
Academic level
Graduation
Subject
Abstract in Portuguese (Brasil)
Com a propagação de lojas de comércio eletrônico e a democratização tecnológica, as empresas estão buscando meios de aprimorar o conteúdo que disponibilizam online a fins de oferecer uma melhor experiência ao usuário final e, consequentemente, obter maior lucro. Neste contexto, a velocidade de carregamento das páginas é tida como fator relevante de retenção de clientes, sendo utilizada também como um dos critérios de colocação de um site perante os motores de pesquisa. Atualmente, diversas solu ...
Com a propagação de lojas de comércio eletrônico e a democratização tecnológica, as empresas estão buscando meios de aprimorar o conteúdo que disponibilizam online a fins de oferecer uma melhor experiência ao usuário final e, consequentemente, obter maior lucro. Neste contexto, a velocidade de carregamento das páginas é tida como fator relevante de retenção de clientes, sendo utilizada também como um dos critérios de colocação de um site perante os motores de pesquisa. Atualmente, diversas soluções computacionais foram criadas para capturar métricas de performance das sessões de navegação a fim de auxiliar no processo de otimização destas. Com isso em mente, este trabalho propõe-se a identificar os principais fatores vinculados ao tempo de carregamento de páginas web de um banco de dados de alta dimensionalidade extraído de uma destas soluções, composto por registros individuais de carregamento de páginas pertencentes ao domínio virtual de uma empresa multinacional de tecnologia. O banco em questão foi analisado através da Regressão Linear Múltipla e seus resultados foram posteriormente comparados à técnicas de Machine Learning como Redes Neurais Artificiais e o algoritmo xgBoost. Em termos preditivos, os resultados mostram que o modelo xgbDART, uma variação do algoritmo xgBoost apresentou melhor desempenho em todos os indicadores de avaliação. Contudo, o objetivo de encontrar as variáveis mais influentes foi plenamente atingido através da Regressão Linear Múltipla, que permite fácil interpretação dos resultados através da análise de seus coeficientes. ...
Abstract
With the spread of e-commerce stores and the technological democratization, companies are looking for ways to improve the content they make available online in order to offer a better user and end experience and, consequently, obtain greater profit. In this context, page loading speed is considered a relevant factor not only on customer retention, but it is also used as one of the criteria for placing a site before search engines. Currently, several computational solutions have been created to ...
With the spread of e-commerce stores and the technological democratization, companies are looking for ways to improve the content they make available online in order to offer a better user and end experience and, consequently, obtain greater profit. In this context, page loading speed is considered a relevant factor not only on customer retention, but it is also used as one of the criteria for placing a site before search engines. Currently, several computational solutions have been created to capture performance metrics of browsing sessions in order to assist in their optimization process. With that in mind, this work aims to identify the main factors linked to the loading time of web pages from a high-dimensional database extracted from one of these solutions, composed of individual page loading times belonging to to the virtual domain of a multinational technology company. The database was analyzed using Multiple Linear Regression and its results were later compared to Machine Learning techniques such as Artificial Neural Networks and the xgBoost algorithm. In predictive terms, the results show that the xgbDART model, a variation of the xgBoost algorithm, performed better in all evaluation indicators. However, the objective of finding the most influential variables was fully achieved through the Multiple Linear Regression, which allows easy interpretation of the results through the analysis of it’s coefficients. ...
Institution
Universidade Federal do Rio Grande do Sul. Instituto de Matemática e Estatística. Curso de Estatística: Bacharelado.
Collections
This item is licensed under a Creative Commons License