Упрощенный показатель силуэта для определения качества кластерных структур

Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычи...

Full description

Bibliographic Details
Main Authors: Вера Владимировна Журавлева, Анастасия Станиславовна Маничева
Format: Article
Language:English
Published: Altai State University 2022-09-01
Series:Известия Алтайского государственного университета
Subjects:
Online Access:http://izvestiya.asu.ru/article/view/11827
_version_ 1797565014420226048
author Вера Владимировна Журавлева
Анастасия Станиславовна Маничева
author_facet Вера Владимировна Журавлева
Анастасия Станиславовна Маничева
author_sort Вера Владимировна Журавлева
collection DOAJ
description Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычисления классического показателя силуэта на большом массиве данных требуется трудоемкая процедура полного перебора пар объектов. Предложена вариация данного показателя, удобная для оценки кластерных структур, построенных на больших массивах данных, — упрощенный показатель силуэта. Рассмотренный показатель протестирован на модельных данных, по которым было построено несколько вариантов кластерных структур, таких, что отдельные кластеры представляли совокупность мини-кластеров. В качестве объектов при вычислении внутрикластерных и межкластерных расстояний были выбраны центры мини-кластеров с учетом их «веса» (в качестве веса задавалось число объектов в мини-кластерах). По каждой кластерной структуре тестового набора данных был вычислен соответствующий показатель силуэта. Проведенное сравнение значений классического и упрощенного показателей силуэта для каждого набора модельных данных дало адекватную оценку качества кластеризации.
first_indexed 2024-03-10T19:06:02Z
format Article
id doaj.art-508dccbc655641369e2d1588c59f6146
institution Directory Open Access Journal
issn 1561-9443
1561-9451
language English
last_indexed 2024-03-10T19:06:02Z
publishDate 2022-09-01
publisher Altai State University
record_format Article
series Известия Алтайского государственного университета
spelling doaj.art-508dccbc655641369e2d1588c59f61462023-11-20T04:07:59ZengAltai State UniversityИзвестия Алтайского государственного университета1561-94431561-94512022-09-014(126)11011410.14258/izvasu(2022)4-1711827Упрощенный показатель силуэта для определения качества кластерных структурВера Владимировна Журавлева0Анастасия Станиславовна Маничева1Алтайский государственный университет (Барнаул, Россия)Алтайский государственный университет (Барнаул, Россия)Обсуждаются вопросы, связанные с оценкой качества построения кластерной структуры данных. Приведено описание показателя качества кластеризации, учитывающего характеристики компактности и отделимости кластеров, — показателя силуэта в двух вариантах: классического и упрощенного. Отмечено, что для вычисления классического показателя силуэта на большом массиве данных требуется трудоемкая процедура полного перебора пар объектов. Предложена вариация данного показателя, удобная для оценки кластерных структур, построенных на больших массивах данных, — упрощенный показатель силуэта. Рассмотренный показатель протестирован на модельных данных, по которым было построено несколько вариантов кластерных структур, таких, что отдельные кластеры представляли совокупность мини-кластеров. В качестве объектов при вычислении внутрикластерных и межкластерных расстояний были выбраны центры мини-кластеров с учетом их «веса» (в качестве веса задавалось число объектов в мини-кластерах). По каждой кластерной структуре тестового набора данных был вычислен соответствующий показатель силуэта. Проведенное сравнение значений классического и упрощенного показателей силуэта для каждого набора модельных данных дало адекватную оценку качества кластеризации.http://izvestiya.asu.ru/article/view/11827кластерный анализкластерная структуракачество кластеризациипоказатель силуэтакомпактностьотделимость
spellingShingle Вера Владимировна Журавлева
Анастасия Станиславовна Маничева
Упрощенный показатель силуэта для определения качества кластерных структур
Известия Алтайского государственного университета
кластерный анализ
кластерная структура
качество кластеризации
показатель силуэта
компактность
отделимость
title Упрощенный показатель силуэта для определения качества кластерных структур
title_full Упрощенный показатель силуэта для определения качества кластерных структур
title_fullStr Упрощенный показатель силуэта для определения качества кластерных структур
title_full_unstemmed Упрощенный показатель силуэта для определения качества кластерных структур
title_short Упрощенный показатель силуэта для определения качества кластерных структур
title_sort упрощенный показатель силуэта для определения качества кластерных структур
topic кластерный анализ
кластерная структура
качество кластеризации
показатель силуэта
компактность
отделимость
url http://izvestiya.asu.ru/article/view/11827
work_keys_str_mv AT veravladimirovnažuravleva uproŝennyjpokazatelʹsiluétadlâopredeleniâkačestvaklasternyhstruktur
AT anastasiâstanislavovnamaničeva uproŝennyjpokazatelʹsiluétadlâopredeleniâkačestvaklasternyhstruktur