Классы систем интеллектуального анализа данных.

Предметно ориентированные аналитические системы очень разнообразны. Наиболее широкий подкласс таких систем, названный «технический анализ», представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка. Одни из этих методов весьма просты (например, методы, использующие вычитание трендового значения), а другие имеют довольно оригинальную математическую основу.

Хотя последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами элементы Data Mining, основное внимание в них уделяется классическим методам — корреляционному, регрессионному, факторному анализу и др. Недостатком систем этого класса считают требование специальной подготовки пользователя, а также отмечают, что мощные современные статистические пакеты являются слишком «тяжеловесными» для массового применения в финансах и бизнесе. Кроме того, большинство методов, входящих в состав пакетов, опирается на статистическую парадигму, в которой главными объектами служат усредненные характеристики выборки, а эти характеристики при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами.

Нейронные сети — большой класс систем, архитектура которых имитирует построение нервной ткани из нейронов. На нейроны самого нижнего слоя подаются входные параметры, на основе которых нужно принимать решения, прогнозировать развитие ситуации и т.д. Значения входных параметров рассматриваются как сигналы, передающиеся в вышележащий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается значение, которое рассматривается как ответ, реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо «натренировать» на полученных ранее данных, для которых известны значения входных параметров и правильные ответы на них. Эта тренировка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам.

Основными недостатками нейросетевой парадигмы являются, во-первых, необходимость в очень большом объеме обучающей выборки; во-вторых, даже натренированная нейронная сеть представляет собой черный ящик. Знания, зафиксированные как веса нескольких сотен межнейронных связей, не поддаются анализу и интерпретации человеком (известные попытки интерпретировать структуру настроенной нейросети неубедительны).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >