Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии в государственном и муниципальном управлении
Посмотреть оригинал

Разведочный анализ данных

Методы разведочного анализа данных являются традиционным инструментом исследования социально-экономических и политических процессов [21]. Такие методы применяются при отсутствии или недостаточности предварительной информации о природе связей, при необходимости учета и сравнения большого числа исходных данных. Разведочный анализ данных использует статистические методы анализа и предполагает использование средств математической статистики и анализа пространственных (территориальных) рядов данных. К наиболее используемым относятся корреляционный, линейнорегрессионный, факторный, дискриминантный анализ, исчисление индексов и коэффициентов, анализ временных рядов, деревья классификации и др. Эти методы позволяют в формальном виде получить зависимости в исследуемых данных, однако имеют достаточно сложный математический аппарат, который предъявляет высокие требования к квалификации пользователя.

Широкий набор мощных методов разведочного анализа данных представлен средствами графической визуализации данных. С их помощью можно находить зависимости, тренды и смещения, скрытые в неструктурированных наборах данных. Самыми распространенными методами являются закрашивание, подгонка и построение функций, сглаживание данных, наложение и объединение нескольких изображений, категоризация данных, расщепление или слияние подгрупп данных на графике, агрегирование данных и пр.

Классические методы анализа доступны в программных пакетах Statistica, SyStat, Stadia, программах электронных таблиц, например доступном и широко используемом табличном процессоре MS Excel.

Нейронные сети

Классические методы разведочного анализа данных хорошо работают при большом объеме априорных данных, на практике количество данных может быть ограниченно. Поэтому часто для целей анализа и прогнозирования применяют искусственные нейронные сети, которые обучают на имеющемся наборе данных [35].

Нейронные сети (в широком смысле) — класс аналитических методов, построенных на принципах обучения мыслящих существ и функционирования мозга и позволяющих прогнозировать значения некоторых переменных в новых наблюдениях по данным других наблюдений (для этих же или других переменных) после прохождения этапа обучения на имеющихся данных.

Нейронная сеть (в узком смысле) — компьютерная программа, результат работы которой зависит от результатов работы большого количества однотипных элементов — нейронов — подпрограмм, обладающих некоторыми свойствами и признаками.

Программу можно представлять себе как преобразователь информации: информация может как бы протекать через сеть. На вход в сеть подаются сигналы (признаки), а на выходе формируется выходной сигнал (исследуемый параметр). Существует множество нейронных сетей, отличающихся внутренней архитектурой нейронов и методами обучения. Обученная сеть выражает закономерности, связывающие данные. Далее ее можно использовать для построения прогнозов для новых данных.

Фрэнк РОЗЕНБЛАТТ

(1928-1971)

Американский ученый в области нейрофизиологии и искусственного интеллекта. В 1958 г. разработал однослойную нейронную сеть, названную персептроном, и построил первый нейрокомпьютер «Марк-1». Псрсептрон умел различать буквы алфавита, но был чувствителен к их написанию.

Например, есть информация о деятельности нескольких десятков банков (их открытая финансовая отчетность) за некоторый период времени. По окончании этого периода известно, какие из этих банков обанкротились, у каких отозвали лицензию, а какие продолжают стабильно работать (на момент окончания периода). Нейронная сеть, обученная на этой ситуации, может дать прогноз дальнейшего размещения средств в этих банках.

Поскольку на начальном этапе анализа природа явления обычно не бывает хорошо известна, выбор архитектуры является непростой задачей и часто связан с длительным процессом проб и ошибок. В последнее время стали появляться неиросетевые программы, в которых для решения этой трудоемкой задачи поиска «наилучшей» архитектуры сети применяются методы искусственного интеллекта [41].

Для практического применения нейросетей необходима разработка алгоритмов их обучения. Первые алгоритмы обучения многослойных нейронных сетей были предложены в СССР А.И. Галушкиным в 1973 г.

Одно из главных преимуществ нейронных сетей состоит в том, что они могут аппроксимировать теоретически любую непрерывную функцию, т.е. описать любой процесс, и поэтому исследователю нет необходимости заранее принимать какие-либо гипотезы относительно модели, и даже — в ряде случаев — какие переменные действительно важны. Однако существенным недостатком нейронных сетей является то обстоятельство, что окончательное решение зависит от начальных установок сети и, как уже говорилось, его практически невозможно «интерпретировать» в традиционных аналитических терминах, которые обычно применяются при построении теории явления.

Анализ данных с использованием нейросетевого подхода возможен в программных пакетах Neural Connection, NeuroOffice, NeuroBuilder, NeuroShell, NeuroWindows, SPSS и np.

 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы