Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis
A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva most...
Main Authors: | , , , , |
---|---|
Format: | Article |
Language: | Portuguese |
Published: |
Universidade Federal de São Carlos
2006-05-01
|
Series: | Gestão & Produção |
Subjects: | |
Online Access: | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013 |
_version_ | 1818855225839058944 |
---|---|
author | Maria Teresinha Arns Steiner Nei Yoshihiro Soma Tamio Shimizu Júlio Cesar Nievola Pedro José Steiner Neto |
author_facet | Maria Teresinha Arns Steiner Nei Yoshihiro Soma Tamio Shimizu Júlio Cesar Nievola Pedro José Steiner Neto |
author_sort | Maria Teresinha Arns Steiner |
collection | DOAJ |
description | A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.<br>Knowledge Discovery in Databases - KDD - is a process that consists of several steps, beginning with the collection of data for the problem under analysis and ending with the interpretation and evaluation of the final results. This paper discusses the influence of exploratory data analysis on the performance of Data Mining techniques with respect to the classification of new patterns, based on its application to a medical problem, and compares the performance of these techniques in order to identify the one with the highest percentage of successes. The results of this study lead to the conclusion that, providing this analysis is done properly, it can significantly improve the performance of these techniques and serve as an important tool to optimize the end results. For the problem under study, the techniques involving a Linear Programming model and Neural Networks were the ones showing the lowest percentages of errors for the test sets, presenting good generalization capacities. |
first_indexed | 2024-12-19T08:05:14Z |
format | Article |
id | doaj.art-90187fcb0c374a15a38a523f49d2f67f |
institution | Directory Open Access Journal |
issn | 0104-530X 1806-9649 |
language | Portuguese |
last_indexed | 2024-12-19T08:05:14Z |
publishDate | 2006-05-01 |
publisher | Universidade Federal de São Carlos |
record_format | Article |
series | Gestão & Produção |
spelling | doaj.art-90187fcb0c374a15a38a523f49d2f67f2022-12-21T20:29:46ZporUniversidade Federal de São CarlosGestão & Produção0104-530X1806-96492006-05-0113232533710.1590/S0104-530X2006000200013Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysisMaria Teresinha Arns SteinerNei Yoshihiro SomaTamio ShimizuJúlio Cesar NievolaPedro José Steiner NetoA "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.<br>Knowledge Discovery in Databases - KDD - is a process that consists of several steps, beginning with the collection of data for the problem under analysis and ending with the interpretation and evaluation of the final results. This paper discusses the influence of exploratory data analysis on the performance of Data Mining techniques with respect to the classification of new patterns, based on its application to a medical problem, and compares the performance of these techniques in order to identify the one with the highest percentage of successes. The results of this study lead to the conclusion that, providing this analysis is done properly, it can significantly improve the performance of these techniques and serve as an important tool to optimize the end results. For the problem under study, the techniques involving a Linear Programming model and Neural Networks were the ones showing the lowest percentages of errors for the test sets, presenting good generalization capacities.http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013mineração de dadosprocesso KDDanálise exploratória dos dadosdata miningKDD processexploratory data analysis |
spellingShingle | Maria Teresinha Arns Steiner Nei Yoshihiro Soma Tamio Shimizu Júlio Cesar Nievola Pedro José Steiner Neto Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis Gestão & Produção mineração de dados processo KDD análise exploratória dos dados data mining KDD process exploratory data analysis |
title | Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis |
title_full | Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis |
title_fullStr | Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis |
title_full_unstemmed | Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis |
title_short | Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados Study of a medical problem using KDD, with emphasis on exploratory data analysis |
title_sort | abordagem de um problema medico por meio do processo de kdd com enfase a analise exploratoria dos dados study of a medical problem using kdd with emphasis on exploratory data analysis |
topic | mineração de dados processo KDD análise exploratória dos dados data mining KDD process exploratory data analysis |
url | http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0104-530X2006000200013 |
work_keys_str_mv | AT mariateresinhaarnssteiner abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis AT neiyoshihirosoma abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis AT tamioshimizu abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis AT juliocesarnievola abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis AT pedrojosesteinerneto abordagemdeumproblemamedicopormeiodoprocessodekddcomenfaseaanaliseexploratoriadosdadosstudyofamedicalproblemusingkddwithemphasisonexploratorydataanalysis |