Упрощенный показатель силуэта для определения качества кластерных структур
Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычи...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Altai State University
2022-09-01
|
Series: | Известия Алтайского государственного университета |
Subjects: | |
Online Access: | http://izvestiya.asu.ru/article/view/11827 |
_version_ | 1797565014420226048 |
---|---|
author | Вера Владимировна Журавлева Анастасия Станиславовна Маничева |
author_facet | Вера Владимировна Журавлева Анастасия Станиславовна Маничева |
author_sort | Вера Владимировна Журавлева |
collection | DOAJ |
description | Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычисления классического показателя силуэта на большом массиве данных требуется трудоемкая процедура полного перебора пар объектов. Предложена вариация данного показателя, удобная для оценки кластерных структур, построенных на больших массивах данных, — упрощенный показатель силуэта. Рассмотренный показатель протестирован на модельных данных, по которым было построено несколько вариантов кластерных структур, таких, что отдельные кластеры представляли совокупность мини-кластеров. В качестве объектов при вычислении внутрикластерных и межкластерных расстояний были выбраны центры мини-кластеров с учетом их «веса» (в качестве веса задавалось число объектов в мини-кластерах). По каждой кластерной структуре тестового набора данных был вычислен соответствующий показатель силуэта. Проведенное сравнение значений классического и упрощенного показателей силуэта для каждого набора модельных данных дало адекватную оценку качества кластеризации. |
first_indexed | 2024-03-10T19:06:02Z |
format | Article |
id | doaj.art-508dccbc655641369e2d1588c59f6146 |
institution | Directory Open Access Journal |
issn | 1561-9443 1561-9451 |
language | English |
last_indexed | 2024-03-10T19:06:02Z |
publishDate | 2022-09-01 |
publisher | Altai State University |
record_format | Article |
series | Известия Алтайского государственного университета |
spelling | doaj.art-508dccbc655641369e2d1588c59f61462023-11-20T04:07:59ZengAltai State UniversityИзвестия Алтайского государственного университета1561-94431561-94512022-09-014(126)11011410.14258/izvasu(2022)4-1711827Упрощенный показатель силуэта для определения качества кластерных структурВера Владимировна Журавлева0Анастасия Станиславовна Маничева1Алтайский государственный университет (Барнаул, Россия)Алтайский государственный университет (Барнаул, Россия)Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычисления классического показателя силуэта на большом массиве данных требуется трудоемкая процедура полного перебора пар объектов. Предложена вариация данного показателя, удобная для оценки кластерных структур, построенных на больших массивах данных, — упрощенный показатель силуэта. Рассмотренный показатель протестирован на модельных данных, по которым было построено несколько вариантов кластерных структур, таких, что отдельные кластеры представляли совокупность мини-кластеров. В качестве объектов при вычислении внутрикластерных и межкластерных расстояний были выбраны центры мини-кластеров с учетом их «веса» (в качестве веса задавалось число объектов в мини-кластерах). По каждой кластерной структуре тестового набора данных был вычислен соответствующий показатель силуэта. Проведенное сравнение значений классического и упрощенного показателей силуэта для каждого набора модельных данных дало адекватную оценку качества кластеризации.http://izvestiya.asu.ru/article/view/11827кластерный анализкластерная структуракачество кластеризациипоказатель силуэтакомпактностьотделимость |
spellingShingle | Вера Владимировна Журавлева Анастасия Станиславовна Маничева Упрощенный показатель силуэта для определения качества кластерных структур Известия Алтайского государственного университета кластерный анализ кластерная структура качество кластеризации показатель силуэта компактность отделимость |
title | Упрощенный показатель силуэта для определения качества кластерных структур |
title_full | Упрощенный показатель силуэта для определения качества кластерных структур |
title_fullStr | Упрощенный показатель силуэта для определения качества кластерных структур |
title_full_unstemmed | Упрощенный показатель силуэта для определения качества кластерных структур |
title_short | Упрощенный показатель силуэта для определения качества кластерных структур |
title_sort | упрощенный показатель силуэта для определения качества кластерных структур |
topic | кластерный анализ кластерная структура качество кластеризации показатель силуэта компактность отделимость |
url | http://izvestiya.asu.ru/article/view/11827 |
work_keys_str_mv | AT veravladimirovnažuravleva uproŝennyjpokazatelʹsiluétadlâopredeleniâkačestvaklasternyhstruktur AT anastasiâstanislavovnamaničeva uproŝennyjpokazatelʹsiluétadlâopredeleniâkačestvaklasternyhstruktur |