PRODUÇÃO ACADÊMICA Repositório Acadêmico da Graduação (RAG) TCC Ciência da Computação
Use este identificador para citar ou linkar para este item: https://repositorio.pucgoias.edu.br/jspui/handle/123456789/8126
Tipo: Trabalho de Conclusão de Curso
Título: Inovação em completação de dados climáticos: métodos baseados em vizinhos, regressão linear e redes neurais de camadas densas
Autor(es): Ricardo, Norton Pereira
Primeiro Orientador: Dantas, Maria José Pereira
metadata.dc.contributor.advisor-co1: Merelles, Leonardo Rodrigues de Oliveira
metadata.dc.contributor.referee1: Luz, Marta Pereira da
metadata.dc.contributor.referee2: Menezes, José Elmo de
Resumo: Esta pesquisa teve como objetivo desenvolver e avaliar métodos de completação de dados em bases climáticas. Após uma revisão de literatura na base de dados Web of Science com o uso das palavras-chave “missing data”, “data climate”, “climate” e “imputation” e equivalentes, identificou-se uma tendência no uso de métodos de machine learning (ML) para a obtenção de resultados mais acurados. Pesquisas se seguiram para um levantamento de artigos científicos que usam ML para o entendimento dos métodos e definições das escolhas dos métodos. Esta pesquisa teve como ponto de partida uma API que coleta dados do INMET em tempo real e já disponibiliza ao usuário escolhas de estações e períodos de dados para a obtenção de gráficos de linhas e boxplots de variáveis climáticas da base. A referida API foi iniciada em pesquisa anterior e finalizada no início da pesquisa em questão para receber os métodos de completação. Foram avaliadas abordagens como o Método do Vizinho Mais Próximo (Nearest Neighbor Method), Regressão Linear e Redes Neurais de Camadas Densas. A metodologia incluiu o pré-processamento dos dados, análise estatística exploratória, tratamento de outliers, normalização z-score e separação dos dados. Os resultados obtidos foram analisados e comparados usando a métrica RMSE (Root Mean Squared Error). Os resultados mostraram que a técnica baseada em aprendizado de máquina apresentou maior precisão na imputação dos dados faltantes em comparação com métodos tradicionais. As redes neurais de camadas densas apresentaram um desempenho superior na captura de padrões não lineares das variáveis climáticas. A pesquisa sugere que a integração desses métodos na API existente pode melhorar significativamente a qualidade dos dados climáticos fornecidos, beneficiando uma ampla gama de aplicações.
Abstract: This research aimed to develop and evaluate data completion methods for climatic databases. Following a literature review in the Web of Science database using the keywords "missing data," "data climate," "climate," and "imputation," a trend was identified in the use of machine learning (ML) methods for achieving more accurate results. Further research was conducted to survey scientific articles that use ML to understand the methods and define the research choices. The research started with an API that collects real-time data from INMET and already provides users with choices of stations and data periods to generate line graphs and box plots of climatic variables. This API was initiated in a previous study and finalized at the beginning of the current research to incorporate the completion methods. Approaches such as the Nearest Neighbor Method, Linear Regression, and Dense Layer Neural Networks were evaluated. The methodology included data preprocessing, exploratory statistical analysis, outlier treatment, normalization, and data separation. The results obtained were analyzed and compared using the RMSE (Root Mean Squared Error) metric. The findings showed that the ML-based technique achieved greater accuracy in imputing missing data compared to traditional methods. Dense layer neural networks demonstrated superior performance in capturing nonlinear patterns of climatic variables. The research suggests that integrating these methods into the existing API can significantly improve the quality of the climatic data provided, benefiting a wide range of applications.
Palavras-chave: API
Imputação
Machine learning
Dados faltantes
Bases climáticas
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Idioma: por
País: Brasil
Editor: Pontifícia Universidade Católica de Goiás
Sigla da Instituição: PUC Goiás
metadata.dc.publisher.department: Escola Politécnica
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.pucgoias.edu.br/jspui/handle/123456789/8126
Data do documento: 20-Jun-2024
Aparece nas coleções:TCC Ciência da Computação

Arquivos associados a este item:
Arquivo TamanhoFormato 
TCC2_norton_RAG_vf.pdf3,25 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.

Ferramentas do administrador