ПРИНЯТИЕ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ

Принципы оптимальности (критерии выбора решений)

При принятии решений в условиях неопределенности используется информация только о множестве возможных состояний внешней среды. Наличие перечня возможных событий или сценариев при отсутствии статистических данных относительно их вероятностей является весьма распространенным случаем, обусловленным различными причинами: нестабильностью экономической ситуации, неизвестным покупательским спросом на товар, экологической обстановкой, стихийными бедствиями и др. В задачах такого рода выбор решения зависит от объективной действительности, называемой в модели «природой». Математическая модель подобных ситуаций называется иногда «игрой с природой» [6, 7].

Рассмотрим ситуацию, когда ЛПР, располагая информацией о возможных состояниях внешней среды (природы), обладает конечным числом стратегий (управлений) i = 1, ..., п, и набор возможных вариантов состояний внешней среды (значений неопределенного неконтролируемого фактора) также конечен j = 1, ..., т. Выигрыш от i-й стратегии при j-м состоянии внешней среды (/'-е значение неконтролируемого фактора) равен %. Матрица выигрышей (платежная матрица) при всевозможных стратегиях и состояниях внешней среды есть А = (ау)„хт? Например, ЛПР рассматривает инвестиции в п проектов и анализирует бизнес-планы этих проектов. При анализе каждого проекта ЛПР может проводить классификацию состояний внешней среды на макроэкономические, экологические, технологические. Так как будущее состояние внешней среды при выборе решения неизвестно, то задача ЛПР состоит в выборе такого проекта для инвестирования, который окажется в некотором смысле наиболее прибыльным и наименее рискованным.

Выбор стратегии (строки матрицы А) в условиях неопределенности можно осуществлять с использованием предлагаемых далее критериев.

Разность между выигрышем, который получает ЛПР, зная состояние внешней среды j, и выигрышем, который будет получен в ситуации, когда ЛПР выберет произвольную стратегию /, а состояние внешней среды окажется тем же j, называется риском (по Сэвиджу) при использовании стратегии / в условиях состояния j и обозначается г,у. Матрица R = (гу)„хт называется матрицей риска, ее элементы

Если ЛПР стремится избежать возможных потерь, то оно выберет ту стратегию, которая гарантирует минимальный риск, т.е. по критерию Сэвиджа:

Возможна ситуация, когда в результате накопленных статистических данных можно оценить вероятности состояний природы q, #2, тогда разумно использовать понятие оптимальности в среднем,

т.е. выбрать стратегию /'о, для которой . Использование вероятностных распределений здесь выигрыша не увеличивает.

Подход, связанный с оценкой вероятностей состояний природы, можно развить дальше. Имеет ли смысл принимать решение на основе накопленных статистических данных или следует провести эксперимент с целью уточнения этих данных?

Тут возможны различные математические постановки задач. Рассмотрим ситуацию, когда до эксперимента известны вероятности состояний природы q, qi, ..., qm, а в результате эксперимента можно точно выяснить, какое состояние имеет место в действительности. Проведение эксперимента всегда связано с затратами. Пусть эти затраты равны С. Стоит ли проводить эксперимент? Здесь у оперирующей стороны появились две дополнительные стратегии — проводит / не проводить, — одну из которых надо выбрать. Для того чтобы сделать это, надо сравнить выигрыши с экспериментом и без него. Выигрыш (максимальный в среднем) без эксперимента равен

В результате проведения эксперимента узнаем состояние природы у, поэтому максимальный выигрыш будет , но заранее

до проведения эксперимента это состояние неизвестно, а принимать решение надо заранее. Так как пользуемся вероятностными оценками, то надо взять математическое ожидание выигрыша после эксперимента,

которое равно . С учетом затрат на проведение эксперимента условие выгодности эксперимента имеет вид

Преобразуя соответствующим образом данное неравенство с учетом замены операции максимизации на минимизацию при выносе знака

«минус», получим

Величина представляет собой средний ожидаемый риск,

следовательно, эксперимент нужно проводить, если связанные с ним затраты меньше минимального среднего риска В противном

случае эксперимент не следует проводить и необходимо применить ту стратегию /*, для которой достигается минимум среднего риска.

Существуют и другие критерии, согласно которым ЛПР может сделать разумный выбор стратегии. Если предположить, что внешняя среда (природа) действует по отношению к ЛПР наихудшим образом, то используется критерий Вальда:

Максимаксный критерий основан на предположении, что природа благоприятствует ЛПР:

Если ЛПР не чистый пессимист, не чистый оптимист, то для выбора стратегии ЛПР может использовать критерий Гурвица:

где ае (0, 1) означает степень пессимизма ЛПР.

Чем ближе а к единице, тем ЛПР больше считает себя пессимистом и склонно получить гарантированный выигрыш, нежели рисковать.

Критерий Лапласа опирается на принцип недостаточного основания (недостаточно основания выделить какие-либо состояния природы как более вероятные). Согласно этому принципу все состояния природы полагаются равновероятными:

Если имеется информация, позволяющая получить оценки апостериорных вероятностей состояний природы, то возможно также использование критерия Байеса — Лапласа.

Отметим, что все критерии, кроме одного, связаны с матрицей выигрышей А и так или иначе максимизируют выигрыш. Критерий Сэвиджа связан с матрицей рисков R и предназначен для нахождения стратегии, минимизирующей потери в результате выбора стратегии, не обеспечивающей наибольший выигрыш при данном состоянии природы. Это говорит о принципиальном отличии критерия Сэвиджа от остальных критериев. Оптимальная стратегия, найденная, например, по критерию Вальда, может привести к большим потерям, чем та, которая найдена по критерию Сэвиджа, что ставит под сомнение удобство использования критерия, ориентированного на максимальный гарантированный результат. Аналогичные замечания можно высказать и по остальным критериям, использующим матрицу выигрышей. Оптимальная стратегия, найденная по критерию Сэвиджа, при этом может привести к выигрышу, значительно меньшему, чем, например, по критерию Вальда.

Пример 11.1. Дана матрица выигрышей А и соответствующая ей

матрица рисков R:

Если ЛПР склонно к осторожному поведению, то имеем значение игры W = 2 и оптимальную стратегию i° = 1 согласно критерию Вальда. Критерий Сэвиджа имеет значение S = 3 и дает оптимальную стратегию /° = 3. Максимальные потери при использовании стратеги /° = 1 равны пяти, а минимальный выигрыш составляет два. При использовании стратегии Р = 3 максимальные потери равны трем, а минимальный выигрыш составляет 0,1.

Пример 11.2. Возможны два состояния природы: Ш — поставщик надежный, Щ — поставщик не надежный. Лицо, принимающее решение — завод. Он может применять стратегии: Ai — не осуществлять дополнительных мероприятий, Аг — послать поставщику свой транспорт, Аз — послать представителя и транспорт, А» — купить материал-заменитель у другого. Матрица выигрышей (затрат со знаком «-») имеет вид:

Какую оптимальную стратегию рекомендует каждый из приведенных выше критериев? Оптимальной по критерию Вальда (W = = ^‘<4 ац — -260) является чистая стратегия Аз. Согласно максимаксному критерию (М = шах шах а,> = -100) оптимальной

А ГТ 1?й" 1 Л 0

является стратегия Ai. По критерию Гурвица (при а = 0,8) имеем

т.е. рекомендуется стратегия At.

Матрица рисков имеет вид:

Тогда оптимальными по критерию Сэвиджа

являются стратегии А2 и Аз. По критерию Лапласа (L = max

стратегия А2.

1<(<4

рекомендуется

Пример 11.3. Инвестор (ЛПР) имеет возможность выделить 10 д.е. на формирование портфеля акций. Ценные бумаги можно приобрести у компаний В, С и К, номинальная стоимость акции составляет соответственно 3, 2 и 5 д.е. На конец года рынок ценных бумаг может оказаться в одном из двух состояний. Эксперты установили, что дивиденды компании В для первого состояния на конец года составят 10% от номинальной стоимости акции, а для второго состояния — 15%; для компании С, соответственно, 8 и 12%; для компании К — 14 и 8%. Сформировать портфель акций инвестора, обеспечив ему возможно большую прибыль. Инвестор принимает решение о способах формирования портфеля акций; природа — совокупность внешних обстоятельств, обуславливающих то или иное состояние рынка ценных бумаг на конец года. Ограничимся для инвестора тремя возможностями, полностью использующими выделенную банком сумму в 10 д.е. на приобретение ценных бумаг. Тогда первая стратегия инвестора состоит в том, что он приобретает по одной акции каждой из компаний; вторая стратегия — банк приобретает по две акции компаний В и С; третья стратегия — приобретается две акции компании К. Природа может реализовать одно из двух состояний, которые характеризуются различными размерами дивидендов, выплачиваемых (в процентах) компаниями.

Элементы а,у платежной матрицы имеют смысл суммарной прибыли инвестора, получаемой им в различных ситуациях. Например, элемент а отвечает ситуации (R, Si) и ап = 3 0,10 + 2 х 0,08 + + 5 х 0,14 = 1,16. Аналогично считаем другие элементы. Платежная матрица имеет вид:

Оптимальной по критерию Вальда является

первая чистая стратегия. По критерию Гурвица (при а = 0,7) имеем

т.е. рекомендуется стратегия R. Оптимальной по критерию Сэвиджа (предлагается проверить читателю) является стратегия Ri.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >