Информационно - коммуникационные и химические технологии

№ 4 (25) - 2024 / 2024-12-31 / Кол. просмотров: 10

ПРИМЕНЕНИЕ АГЛОМЕРАТИВНОЙ КЛАСТЕРИЗАЦИИ ДЛЯ ФОРМИРОВАНИЯ СООБЩЕСТВ НАВЫКОВ ВАКАНСИЙ

Авторы

  • В.С. Рамазанова
  • М.А. Самбетбаева
  • А.Т. Тохметов
  • Ж.Б. Ламашева
  • С.К. Серикбаева

Ключевые слова

Трансформеры предложений, кластеризация навыков, агломеративная кластеризация, коэффициент силуэта, сообщества навыков

DOI ссылка:

https://doi.org/10.58805/kazutb.v.4.25-646

Как цитировать

Рамазанова V., Самбетбаева M., Тохметов A., Ламашева Z. ., и Серикбаева S. «ПРИМЕНЕНИЕ АГЛОМЕРАТИВНОЙ КЛАСТЕРИЗАЦИИ ДЛЯ ФОРМИРОВАНИЯ СООБЩЕСТВ НАВЫКОВ ВАКАНСИЙ». Вестник КазУТБ, т. 4, вып. 25, декабрь 2024 г., doi:10.58805/kazutb.v.4.25-646.

Аннотация

Одним из традиционных методов обнаружения сообществ в графах знаний является агломеративная кластеризация. Агломеративная иерархическая кластеризация – это широко используемый тип иерархической кластеризации для группировки объектов на основе их сходства. Этот метод следует подходу «снизу вверх», начиная с того, что каждая отдельная точка данных рассматривается как независимый кластер, которые затем непрерывно объединяются на основе порога сходства между кластерами. В данной статье основное внимание уделяется использованию агломеративной кластеризации для анализа навыков, извлеченных из объявлений о вакансиях на онлайн-платформе по подбору персонала. В ней описывается подход к сбору, обработке и последующей кластеризации данных, дается обзор методов связи между кластерами и примеры применения различных коэффициентов для количественной оценки качества кластера. Проводится анализ двуязычных кластеров на русском и английском языках, что позволяет оценить универсальность и адаптивность предлагаемого подхода к анализу многоязычного рынка труда в Казахстане. Было обнаружено, что методы агломеративной кластеризации обладают значительным потенциалом для выявления структурированных групп навыков, которые могут улучшить понимание тенденций и потребностей рынка труда. Анализ кластеров, сформированных на разных языках, подтвердил универсальность и адаптивность предлагаемого подхода к многоязычным данным.