Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis

A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva most...

Full description

Bibliographic Details
Main Authors: Maria Teresinha Arns Steiner, Nei Yoshihiro Soma, Tamio Shimizu, Júlio Cesar Nievola, Pedro José Steiner Neto
Format: Article
Language:Portuguese
Published: Universidade Federal de São Carlos 2006-05-01
Series:Gestão & Produção
Subjects:
Online Access:http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013
_version_ 1818855225839058944
author Maria Teresinha Arns Steiner
Nei Yoshihiro Soma
Tamio Shimizu
Júlio Cesar Nievola
Pedro José Steiner Neto
author_facet Maria Teresinha Arns Steiner
Nei Yoshihiro Soma
Tamio Shimizu
Júlio Cesar Nievola
Pedro José Steiner Neto
author_sort Maria Teresinha Arns Steiner
collection DOAJ
description A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.<br>Knowledge Discovery in Databases - KDD - is a process that consists of several steps, beginning with the collection of data for the problem under analysis and ending with the interpretation and evaluation of the final results. This paper discusses the influence of exploratory data analysis on the performance of Data Mining techniques with respect to the classification of new patterns, based on its application to a medical problem, and compares the performance of these techniques in order to identify the one with the highest percentage of successes. The results of this study lead to the conclusion that, providing this analysis is done properly, it can significantly improve the performance of these techniques and serve as an important tool to optimize the end results. For the problem under study, the techniques involving a Linear Programming model and Neural Networks were the ones showing the lowest percentages of errors for the test sets, presenting good generalization capacities.
first_indexed 2024-12-19T08:05:14Z
format Article
id doaj.art-90187fcb0c374a15a38a523f49d2f67f
institution Directory Open Access Journal
issn 0104-530X
1806-9649
language Portuguese
last_indexed 2024-12-19T08:05:14Z
publishDate 2006-05-01
publisher Universidade Federal de São Carlos
record_format Article
series Gestão & Produção
spelling doaj.art-90187fcb0c374a15a38a523f49d2f67f2022-12-21T20:29:46ZporUniversidade Federal de São CarlosGestão & Produção0104-530X1806-96492006-05-0113232533710.1590/S0104-530X2006000200013Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysisMaria Teresinha Arns SteinerNei Yoshihiro SomaTamio ShimizuJúlio Cesar NievolaPedro José Steiner NetoA "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.<br>Knowledge Discovery in Databases - KDD - is a process that consists of several steps, beginning with the collection of data for the problem under analysis and ending with the interpretation and evaluation of the final results. This paper discusses the influence of exploratory data analysis on the performance of Data Mining techniques with respect to the classification of new patterns, based on its application to a medical problem, and compares the performance of these techniques in order to identify the one with the highest percentage of successes. The results of this study lead to the conclusion that, providing this analysis is done properly, it can significantly improve the performance of these techniques and serve as an important tool to optimize the end results. For the problem under study, the techniques involving a Linear Programming model and Neural Networks were the ones showing the lowest percentages of errors for the test sets, presenting good generalization capacities.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013mineração de dadosprocesso KDDanálise exploratória dos dadosdata miningKDD processexploratory data analysis
spellingShingle Maria Teresinha Arns Steiner
Nei Yoshihiro Soma
Tamio Shimizu
Júlio Cesar Nievola
Pedro José Steiner Neto
Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
Gestão & Produção
mineração de dados
processo KDD
análise exploratória dos dados
data mining
KDD process
exploratory data analysis
title Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
title_full Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
title_fullStr Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
title_full_unstemmed Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
title_short Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
title_sort abordagem de um problema medico por meio do processo de kdd com enfase a analise exploratoria dos dados study of a medical problem using kdd with emphasis on exploratory data analysis
topic mineração de dados
processo KDD
análise exploratória dos dados
data mining
KDD process
exploratory data analysis
url http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013
work_keys_str_mv AT mariateresinhaarnssteiner abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis
AT neiyoshihirosoma abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis
AT tamioshimizu abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis
AT juliocesarnievola abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis
AT pedrojosesteinerneto abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis