Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study

Este estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y C...

Full description

Bibliographic Details
Main Authors: SUSANA A. LEIVA-VALDEBENITO, FRANCISCO J. TORRES-AVILÉS
Format: Article
Language:English
Published: Universidad Nacional de Colombia 2010-01-01
Series:Revista Colombiana de Estadística
Subjects:
Online Access:http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512010000200009
_version_ 1811282389938208768
author SUSANA A. LEIVA-VALDEBENITO
FRANCISCO J. TORRES-AVILÉS
author_facet SUSANA A. LEIVA-VALDEBENITO
FRANCISCO J. TORRES-AVILÉS
author_sort SUSANA A. LEIVA-VALDEBENITO
collection DOAJ
description Este estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y Clara cuando los datos son multivariados y de tipo continuo. Adicionalmente, se efectúa un estudio de simulación con el fin de comparar algoritmos de partición para datos cualitativos, confrontando la eficiencia de los algoritmos PAM y k-modas. La eficiencia de los algoritmos se compara usando el índice de Rand ajustado y la tasa de correcta clasificación. Finalmente, se aplican los algoritmos a bases de datos reales, las cuales poseen clases predefinidas.<br>This study is oriented to compare several partition methods in the context of cluster analysis, which are also called non hierarchical methods. In this work, a simulation study is performed to compare the results obtained from the implementation of the algorithms k-means, k-medians, PAM and CLARA when continuous multivariate information is available. Additionally, a study of simulation is presented to compare partition algorithms qualitative information, comparing the efficiency of the PAM and k-modes algorithms. The efficiency of the algorithms is compared using the Adjusted Rand Index and the correct classification rate. Finally, the algorithms are applied to real databases with predefined classes.
first_indexed 2024-04-13T01:50:40Z
format Article
id doaj.art-5662242cb12e468996a57f4f09879522
institution Directory Open Access Journal
issn 0120-1751
language English
last_indexed 2024-04-13T01:50:40Z
publishDate 2010-01-01
publisher Universidad Nacional de Colombia
record_format Article
series Revista Colombiana de Estadística
spelling doaj.art-5662242cb12e468996a57f4f098795222022-12-22T03:07:53ZengUniversidad Nacional de ColombiaRevista Colombiana de Estadística0120-17512010-01-01332321339Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative StudySUSANA A. LEIVA-VALDEBENITOFRANCISCO J. TORRES-AVILÉSEste estudio está enfocado en comparar diversos métodos de partición del análisis de conglomerados, usualmente conocidos como métodos no jerárquicos. En este trabajo, se realizan estudios de simulación para comparar los resultados obtenidos al implementar los algoritmos k-medias, k-medianas, PAM y Clara cuando los datos son multivariados y de tipo continuo. Adicionalmente, se efectúa un estudio de simulación con el fin de comparar algoritmos de partición para datos cualitativos, confrontando la eficiencia de los algoritmos PAM y k-modas. La eficiencia de los algoritmos se compara usando el índice de Rand ajustado y la tasa de correcta clasificación. Finalmente, se aplican los algoritmos a bases de datos reales, las cuales poseen clases predefinidas.<br>This study is oriented to compare several partition methods in the context of cluster analysis, which are also called non hierarchical methods. In this work, a simulation study is performed to compare the results obtained from the implementation of the algorithms k-means, k-medians, PAM and CLARA when continuous multivariate information is available. Additionally, a study of simulation is presented to compare partition algorithms qualitative information, comparing the efficiency of the PAM and k-modes algorithms. The efficiency of the algorithms is compared using the Adjusted Rand Index and the correct classification rate. Finally, the algorithms are applied to real databases with predefined classes.http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512010000200009algoritmos de conglomeradosmedida de similaridadsimulaciónClustering algorithmSimilarity measureSimulation
spellingShingle SUSANA A. LEIVA-VALDEBENITO
FRANCISCO J. TORRES-AVILÉS
Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
Revista Colombiana de Estadística
algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
Similarity measure
Simulation
title Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
title_full Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
title_fullStr Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
title_full_unstemmed Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
title_short Una revisión de los algoritmos de partición más comunes en el análisis de conglomerados: un estudio comparativo A Review of the Most Common Partition Algorithms in Cluster Analysis: A Comparative Study
title_sort una revision de los algoritmos de particion mas comunes en el analisis de conglomerados un estudio comparativo a review of the most common partition algorithms in cluster analysis a comparative study
topic algoritmos de conglomerados
medida de similaridad
simulación
Clustering algorithm
Similarity measure
Simulation
url http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0120-17512010000200009
work_keys_str_mv AT susanaaleivavaldebenito unarevisiondelosalgoritmosdeparticionmascomunesenelanalisisdeconglomeradosunestudiocomparativoareviewofthemostcommonpartitionalgorithmsinclusteranalysisacomparativestudy
AT franciscojtorresaviles unarevisiondelosalgoritmosdeparticionmascomunesenelanalisisdeconglomeradosunestudiocomparativoareviewofthemostcommonpartitionalgorithmsinclusteranalysisacomparativestudy