Use este identificador para citar ou linkar para este item:
https://repositorio.pucgoias.edu.br/jspui/handle/123456789/3059
Tipo: | Trabalho de Conclusão de Curso |
Título: | Efeitos da anonimização nos processos de mineração de dados |
Autor(es): | Paula, Felipe Silva |
Primeiro Orientador: | Vieira, Sibelius Lellis |
metadata.dc.contributor.referee1: | Vinhal, Gustavo Siqueira |
metadata.dc.contributor.referee2: | Martins, Rafael Leal |
Resumo: | Este trabalho propõe-se a aplicar técnicas de anonimização e mineração de dados em um conjunto de dados de crédito, com propósito de verificar a privacidade dos dados, segurança da informação e o cumprimento da Lei Geral de Proteção de Dados Pessoais (LGPD), além da viabilidade de continuar aplicando processos de tomada de decisão nos dados anonimizados. A mineração de dados apresenta-se como uma estratégia para auxiliar na tomada de decisões dos conjuntos de dados anonimizados. Uma pesquisa bibliográfica sobre a LGPD, anonimização e mineração dos dados foi realizada com objetivo de compreender e conceituar estes temas. Com a utilização do software Amnesia foram aplicadas as técnicas de anonimização no conjunto de dados de crédito (conjunto original), pois a anonimização pode ser utilizada com intuito de obter a privacidade e o cumprimento de leis e regulamentações de proteção de dados. Essa estratégia pode ser aplicada de modo que não permita a reidentificação dos dados e ainda contribuir com a segurança da informação e gestão de riscos. Para cada uma das técnicas de anonimização aplicadas, a mineração de dados foi empregada com auxílio da ferramenta Waikato Environment for Knowledge Analysis (WEKA) e os valores das acurácias obtidos. Como resultados, verifica-se que a anonimização baseada em supressão e generalização garantiu a privacidade necessária, bem como não impediu que técnicas de classificação baseadas em árvores de decisão pudessem ser usadas para tomada de decisão de forma adequada. |
Abstract: | This work proposes to apply anonymization and data mining techniques to a set of credit data, to verify data privacy, information security, and compliance with the General Data Protection Law (GDPL), in addition to the feasibility of continuing to apply decision-making processes to anonymized data. Data mining presents itself as a strategy to assist in decision-making on anonymized datasets. Bibliographical research on the GDPL, anonymization, and data mining was carried out to understand and conceptualize these themes. With the use of the amnesia software, anonymization techniques were applied to the credit dataset (original set), as data anonymization can be used to obtain privacy and compliance with protection laws and regulations of data. This strategy can be applied in a way that does not allow the re-identification of data and still contributes to information security and risk management. For each of the applied anonymization techniques, data mining was used with the help of the Waikato Environment for Knowledge Analysis (WEKA) tool and the accuracy values obtained. As a result, it appears that anonymization based on suppression and generalization ensured the necessary privacy, as well as did not prevent classification techniques based on decision trees from being used for adequate decision making. |
Palavras-chave: | Anonimização dos dados Mineração dos dados Data mining Privacidade de dados LGPD |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO |
Idioma: | por |
País: | Brasil |
Editor: | Pontifícia Universidade Católica de Goiás |
Sigla da Instituição: | PUC Goiás |
metadata.dc.publisher.department: | Escola Politécnica |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.pucgoias.edu.br/jspui/handle/123456789/3059 |
Data do documento: | 9-Dez-2021 |
Aparece nas coleções: | TCC Ciência da Computação |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
TCC_FELIPESILVA_assinado.pdf | 1,58 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
Ferramentas do administrador