Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/12237
Files in This Item:
File Description SizeFormat 
guilhermecoelhoneves.pdfGuilherme Coelho Neves1.83 MBAdobe PDFThumbnail
View/Open
Type: Trabalho de Conclusão de Curso
Title: Qualidade de dados através de árvores de decisão
Author: Neves, Guilherme Coelho
First Advisor: Bastos, Ronaldo Rocha
Referee Member: Bastos, Ronaldo Rocha
Referee Member: Souza, Augusto Carvalho
Referee Member: Faier, José Márcio
Resumo: Após a implementação de um programa baseado em redes neurais artificiais para a triagem de pacientes quanto ao diagnóstico de tuberculose em Unidades de Saúde do Brasil, foi identificado que os dados coletados poderiam estar “viesados”. Esta suspeita ocorreu ao comparar os dados e saídas obtidas pela rede neural com o diagnóstico dos médicos. Através de entrevistas e investigações feitas por parte dos responsáveis pelo software implantado, foi identificado que os usuários do programa, muitas vezes pressionados pelas condições de trabalho, poderiam estar alterando os dados de entrada dos pacientes para que obtivessem como possível diagnóstico pela triagem uma alternativa que não a tuberculose. Neste trabalho, é proposta uma metodologia que busca identificar a confiabilidade da informação processada pelo sistema, bem como aplicar técnicas que retardam e desmotivam o preenchimento tendencioso do questionário por parte do usuário. Utilizando de técnicas de agrupamento de dados (árvores de decisão) e de visualização de dados (Análise De Componentes Principais - para dados categóricos -Análise de Correspondência), pretende-se não só qualificar os dados, como também quantificar a confiabilidade dos mesmos.
Abstract: After the implementation of a program based on artificial neural networks for the screening of patients for the diagnosis of tuberculosis in Health Units of the Brazil, it was identified that the data collected could be “biased”. This suspicion occurred when comparing the data and outputs obtained by the neural network with the diagnosis of doctors. Through interviews and investigations by those responsible for the software implemented, it was identified that users of the program, often under pressure by working conditions, they could be altering patient input data so that they could obtain, as a possible diagnosis by screening, an alternative other than tuberculosis. In this work, a methodology is proposed that seeks to identify the reliability of the information processed by the system, as well as applying techniques that delay and demotivate the user's tendentious completion of the questionnaire. Using data grouping techniques (decision trees) and visualization analysis (Principal Component Analysis - for categorical data - Analysis of Correspondence), it is intended not only to qualify the data, but also to quantify the reliability.
Keywords: análise multivariada
árvores de decisão
qualidade de dados
análise de correspondência
Tuberculose
analyze multivariate
decision trees
data quality
correspondence analysis
Tuberculosis
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: ICE – Instituto de Ciências Exatas
Access Type: Acesso Aberto
Creative Commons License: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/12237
Issue Date: 3-Feb-2014
Appears in Collections:Estatística - TCC Graduação



This item is licensed under a Creative Commons License Creative Commons