Построение регрессионной модели.

Выбор вида модели

Мы говорили, что под моделью понимаем вид функции отклика

Выбрать модель — значит выбрать вид этой функции, записать ее уравнение. Тогда останется спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) этого уравнения.

Модели бывают разные. Моделей бывает много. Чтобы выбрать одну из них, надо понять, что мы хотим от модели, какие требования мы к ней предъявляем. Главное требование к модели — это способность предсказывать направление дальнейших опытов, причем предсказывать с требуемой точностью. Так как до получения модели мы не знаем, какое направление нам понадобится, то естественно требовать, чтобы точность предсказания во всех возможных направлениях была одинакова. Это значит, что в некоторой подобласти, в которую входят и координаты выполненных опытов, предсказанное с помощью модели значение отклика не должно отличаться от фактического больше, чем на некоторую заранее заданную всличину[9].

Если несколько различных моделей отвечают нужным требованиям, то следует предпочесть ту из них, которая является самой простой.

График логарифмической функции

Рис. 3. График логарифмической функции.

На рисунке 3 изображена логарифмическая функция. На некотором отрезке [xmin, Xmax] она с удовлетворительной точностью описывается двумя уравнениями:

В уравнении (5) b — коэффициент, который мы можем оценить, например, по результатам эксперимента.

Какое из уравнений — (4) или (5)— по вашему мнению, проще?

При прочих равных условиях мы всегда будем предпочитать степенные ряды. Точнее, отрезки степенных рядов — алгебраические полиномы. При таком соглашении можно сказать, что уравнение (5) проще, чем уравнение (4) [9].

Фактически был произведен выбор класса моделей. Всегда, когда это возможно, будем искать модель среди полиномов. Построение полинома возможно в окрестностях любой точки факторного пространства, поскольку мы предположили, что функция является аналитической.

Выпишем полиномы для случая двух факторов. Они будут различаться по максимальным степеням входящих в них переменных.

Полином нулевой степени: у =Ьо

Полипом первой степени: у =Ьо +Ь/Х/ +Ь2Х2

Полином второй степени: y-bo +bjX] + /ъ^2+ b/2* 1X2+b/iX/2+b22X22

Полипом первой степени с тремя факторами: у = bo +Ь/Х; + biX2+ b,ix,i+ b 12X1X2+ b 11X1X2 +b 2.1X2X2 +b 123X1X2X3

Представили неизвестную функцию отклика полиномом. Операция замены одной функции другой в каком-то смысле эквивалентной функцией называется аппроксимацией. Значит, мы аппроксимировали неизвестную функцию полиномом.

Но полиномы бывают разных степеней. Какой взять на первом шаге?

Эксперимент нужен только для того, чтобы найти численные значения коэффициентов полинома. Поэтому чем больше коэффициентов, тем больше опытов окажется необходимым. А мы стремимся сократить их число. Значит, надо найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявленным к модели. Чем ниже степень полинома при заданном числе факторов, тем меньше в нем коэффициентов.

Помимо этого мы хотим, чтобы модель хорошо предсказывала направление наискорейшего улучшения параметра оптимизации. Такое направление называется направлением градиента. Ясно, что движение в этом направлении приведет к успеху быстрее, чем движение в любом другом направлении (это значит, что будет достигнута экономия числа опытов).

Полином первой степени — линейная модель — это наиболее простая модель. С одной стороны, он содержит информацию о направлении градиента, с другой — в нем минимально возможное число коэффициентов при данном числе факторов.

Единственное опасение в том, что неясно, будет ли линейная модель всегда адекватной. Вопрос в том, как выбрать подобласть в факторном пространстве, чтобы линейная модель оказалась адекватной. Условие аналитичности функции отклика гарантирует нам эту возможность. Всегда существует такая окрестность любой точки (точнее: почти любой точки), в которой линейная модель адекватна.

Размер такой области заранее неизвестен, но адекватность, как вы помните, можно проверять по результатам эксперимента. Значит, выбрав сначала произвольную подобласть, мы, рано или поздно, найдем ее требуемые размеры. И как только это случится, воспользуемся движением по градиенту.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >