Анализ данных в менеджменте качества

На данный момент не устоялось четкого варианта перевода понятия Data Mining на русский язык. Поэтому далее в тексте мы будем пользоваться англоязычным термином Data Mining.

Нередко наряду с Data Mining встречаются термины «обнаружение знаний в базах данных» (Knowledge Discovery in Databases) и «интеллектуальный анализ данных». Их можно считать синонимами Data Mining. Использование указанных терминов связано с новым витком развития средств и методов обработки данных.

Цель Data Mining состоит в выявлении скрытых правил и закономерностей в наборах данных. Дело в том, что человеческий разум не приспособлен для восприятия больших массивов разнородной информации. Кроме того, человек не способен улавливать более двух-трех взаимосвязей даже в небольших выборках. Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, также нередко пасует при решении задач из реальной сложной жизни. Она оперирует усредненными характеристиками выборки, которые часто являются фиктивными величинами (типа средней температуры пациентов по больнице, средней высоты дома на улице, состоящей из дворцов и лачуг, и т.п.). Поэтому методы математической статистики полезны главным образом для проверки заранее сформулированных гипотез.

Современные технологии Data Mining перебирают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких-либо фрагментов неоднородных многомерных данных.

В принципе в постановке задачи Data Mining нет ничего нового. Специалисты решали подобные задачи несколько последних десятилетий. Но только сейчас общество в целом созрело для понимания практической важности и широты этих задач. Во-первых, в связи с развитием технологий записи и хранения данных сегодня на людей обрушились колоссальные потоки информации в самых различных областях, которые без продуктивной переработки могут превратиться в никому не нужные свалки; во-вторых, средства и методы обработки данных стали доступны и удобны, а их результаты понятны любому человеку.

Сфера применения Data Mining не ограничена — она везде, где имеются какие-либо данные. Но сегодня методы Data Mining в первую очередь заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных баз данных. Опыт многих таких предприятий показывает, что отдача от использования Data Mining может достигать 1000 %. Например, опубликованы сообщения об экономическом эффекте, в 10—70 раз превысившем первоначальные затраты; сведения о проекте стоимостью 20 млн дол., который окупился всего за 4 месяца; данные о годовой экономии 700 тыс. дол. за счет внедрения Data Mining в сети универсамов в Великобритании. Data Mining представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов Data Mining они могут получить значительные преимущества в конкурентной борьбе.

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять методы Data Mining, такие, как:

  • • ассоциация, имеющая место в том случае, если несколько событий связано друг с другом. Например, исследование, проведенное в супермаркете, показывает, что 75 % купивших ку- курзные чипсы приобретают также «кока-колу», а при наличии скидки за такой комплект «колу» приобретают в 85 % случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка;
  • • последовательность — цепочка связанных во времени событий. Например, после покупки дома в 45 % случаев в течение месяца приобретается новая кухонная плита, а в пределах двух недель 70 % новоселов обзаводятся новым холодильником;
  • • классификация — формирование группы, к которой принадлежит тот или иной объект, по характерным признакам посредством анализа уже классифицированных объектов и формулирования некоторого набора правил;
  • • кластеризация, которая отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных;
  • • прогнозирование — метод Data Mining, основанный на исторической информации, хранящейся в базе данных в виде временных рядов. Если удастся построить математическую модель и найти шаблоны, адекватно отражающие эту динамику, есть вероятность, что с их помощью можно предсказать поведение системы в будущем.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >