Справочник от Автор24
Найди эксперта для помощи в учебе
Найти эксперта
+2

Разработка алгоритма нечеткой сегментации временных рядов

Определение 1

Алгоритм нечеткой сегментации временных рядов — это алгоритм нечеткой сегментации последовательности значений, которые описывают протекающий во времени процесс, измеренных через равные промежутки времени.

Общие сведения о сегментации временных рядов

Изменения переменных во временном ряде, как правило, являются неопределенными и не осуществляются в один и тот же временной момент. Однако выделение четких границ сегментов не является практичным вариантом. К примеру, если человек выполняет анализ визуальной информации о процессе, он применяет такие слова, как «данная точка принадлежит к данной операционной точке, а также к какой-либо еще». Хорошим примером нечеткой группировки такого типа может служить определение понятия раннего утра, то есть, никто не знает, когда точно оно начинается и когда заканчивается. Нечеткая логика широко применяется в разных приложениях, в которых необходима кластеризация нечетких и неопределенных компонентов. Также существует ряд удачных примеров совместного использования нечеткой логики и анализа временных рядов.

Процесс разбиения временных рядов на совокупность внутренних однородных сегментов является одной из важных проблем в совокупности задач интеллектуального анализа данных, поскольку позволяет фактически выделить из больших информационных объемов главные характеристики временных рядов в наиболее компактной форме. Изменения свойств многомерного временного ряда, как правило, являются слабо уловимыми и не могут быть сфокусированы на какой-либо определенной временной точке. Поэтому использование четких границ сегментов считается бессмысленным с практической точки зрения. Основной проблемой применения нечеткой кластеризации в проблемах, связанных с сегментацией временных рядов, считается выбор количества сегментов для кластеризации.

В обобщенном варианте задача сегментации временного ряда может быть представлена следующим образом. Требуется определить в определенном смысле наилучшее разбиение временного ряда на какое-то количество сегментов, являющихся внутренне однородными. Обычно в практических задачах требуется одновременно отслеживать большое количество параметров, а практически все алгоритмы сегментации применяются для анализа только какого-либо одного. 

«Разработка алгоритма нечеткой сегментации временных рядов» 👇
Помощь эксперта по теме работы
Найти эксперта
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти

Прежде, чем применять предполагаемый метод сегментации, данные следует сжать при помощи анализа основных элементов. Сегментация временных рядов может быть представлена как кластеризация с упорядоченной во времени структурой. Так как точки в кластере следуют друг за другом во времени, то необходимо учитывать во время кластеризации временную координату данных. То есть, кластеризация базируется на мере расстояния, которая состоит из следующих этапов:

  • Расстояние базируется на том, как данные определяются нечеткими множествами, которые заданы в данном временном интервале, в указанном сегменте.
  • Второй этап измеряет то, как далеко данные находятся от гиперплоскости модели сегментов PCA (Principal Component Analysis, то есть, метод главных компонент). Этот метод является статистической процедурой уменьшения размерности.

Разработка алгоритма нечеткой сегментации временных рядов

На текущий момент известно много широко используемых алгоритмов сегментации, таких как, «Скользящее окно», «Снизу-вверх», «Сверху-вниз». К примеру, алгоритм «Сверху-вниз» чаще всего применяется в задачах интеллектуального анализа данных. Алгоритм начинается созданием точной аппроксимации временного ряда. Далее необходимо найти стоимость слияния для каждой пары сегментов. Затем в итеративном режиме осуществляется поглощение пары сегментов, имеющих наименьшую функцией стоимости, до тех пор, пока не будут выполнены условия определенного критерия остановки. После объединения двух смежных сегментов $S_i$ и $S_{i+1}$ следует вычислить стоимость слияния нового сегмента со своим соседом справа и стоимость слияния сегмента $S_{i-1}$ со своим вновь сформированным соседом.

Тем не менее основным недостатком каждого широко используемого сегодня алгоритма сегментации считается тот факт, что хорошие результаты достигаются только при работе в пакетном режиме. Предлагаемый алгоритм сегментации для работы в режиме online подразумевает поочередное оценивание однородности сегментов, а также их формальное представление во времени.

Задача сегментации определяется как задача кластеризации, то есть, точки данных необходимо сгруппировать, опираясь на их подобие, но при условии, что все точки кластера следуют друг за другом во времени. По существу, такая процедура может считаться online модификацией метода нечеткой кластеризации Гата-Гевы, которая позволяет выполнять измерение однородности сегментов и выстраивать нечеткие множества для отображения сегментов во времени. Эффективность и точность предлагаемой процедуры определяется правильностью выбора количества основных компонентов и количества сегментов. В общем случае метод сегментации можно описать следующим образом:

  1. Следует задать количество сегментов «с».
  2. Далее необходимо задать количество главных компонент q.
  3. Осуществить выбор порога остановки £> 0.
  4. Реализовать инициализацию величины Wi, являющуюся матрицей весов, |iik, которая является уровнем принадлежности наблюдения i-му кластеру
  5. Инициализировать значение девиации о2х.
  6. Инициализировать значение центроида кластера cf.

Предложенная модификация алгоритма нечеткой кластеризации Гата-Гевы позволяет осуществлять измерение однородности сегментов и выстраивать нечеткие множества для отображения сегментов во времени. Данный алгоритм может работать в условиях, когда кластеры следуют один за другим во времени, а также способен определить изменения в структуре многомерного временного ряда.

Нечеткий метод PCA-Q считается чувствительным к количеству главных компонентов. С увеличением их числа ошибка реконструкции уменьшается.

Дата написания статьи: 09.12.2021
Получи помощь с рефератом от ИИ-шки
ИИ ответит за 2 минуты
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot