Построение регрессионных моделей прогнозирования затрат на перевозку грузов

Математические модели, построенные на основе методов многофакторного нелинейного регрессионного анализа по данным пассивного статистического эксперимента, позволяют с определенной степенью точности прогнозировать значение основных экономических показателей (обозначим их как у ), используют совокупность всего объема входной информации, определяющей каждый конкретный маршрут движения ТС, т.е. все входные и комплексные переменные (обозначим их как

Ниже в данном разделе для простоты изложения будем рассматривать в качестве входных переменных только вектор комплексных переменныхZ = (Z,,Z2,...,Z Z^j.

Наряду с линейными регрессионными моделями вида:

где bj, j = , - коэффициенты линейной модели, bQ- свободный член,

для которых разработаны эффективные методы расчета неизвестных значений коэффициентов для этих моделей на основе решения системы линейных алгебраических уравнений, предусмотрены возможности использования и нелинейных моделей вида:

Здесь Zj — некоторая произвольная функция от одной переменной или их совокупности.

При введении некоторых вспомогательных переменных построение нелинейных регрессионных зависимостей может быть преобразовано к линейному виду:

В качестве комплексных переменных могут быть рекомендованы следующие виды функций Z . = у/(хк ,xtxL ) , неизвестные коэффициенты (параметры) которых либо задаются экспертами, либо вычисляются из условий максимизации значения коэффициента корреляции или корреляционного отношения между комплексной переменной Z7 и выходной величиной у. Так, могут использоваться следующие виды функций:

Программным обеспечением предусмотрены возможности образования более сложных комплексных переменных в виде функций, содержащих как переменные Xi, так и полученные переменные Z7. В

качестве примеров могут рассматриваться, например, следующие функциональные зависимости:

в которых значения коэффициентов ц, и ту задаются экспертами.

В процессе построения математических моделей с целью прогнозирования объемов затрат на выполнение маршрутов должны быть произведены следующие работы:

  • - исследование влияния различных входных факторов на время выполнения маршрута и, следовательно, на переменную составляющую затрат;
  • - выражение некоторого подмножества входных переменных, оказывающих существенное влияние на выходные переменные и выраженных в виде булевых, лингвистических переменных или нечетких множеств, в виде некоторой комплексной переменной, представленной действительным числом;
  • - выполнение на предоставленном в распоряжение статистическом материале расчетов различных линейных и нелинейных регрессионных зависимостей выходной переменной от значений входных и введенных комплексных переменных;
  • - исследование точности прогнозирования значений выходной переменной для различных видов построенных регрессионных зависимостей, выбор среди них такого вида функциональной зависимости, который обеспечит наименьшую среднеквадратическую ошибку расчета, т.е. наиболее высокую степень точности получения результатов.

В процессе построения математических моделей в виде полиномов исследуются различные линейные или нелинейные формы влияния входных переменных, а также комплексных переменных в форме Zy и комбинации этих входных факторов. В качестве членов таких полиномов могут варьироваться линейные и нелинейные формы входных переменных xj и комплексных переменных Zy, корреляционные коэффициенты которых с выходной переменной Yp являются статистически значимыми и имеют достаточно высокое по абсолютной величине значение.

Основным показателем, определяющим адекватность математической модели, является коэффициент множественной корреляции [12-14, 16, 17]:

л г факт расчВ iВ ^

где 11 9 У/В — фактическое и расчетное значения выходной

переменной в ?-том комплекте информации;

К — количество комплектов информации;

факт _факт ^

, - соответственно среднее значение и корень квадратный из дисперсии фактического значения выходной переменной в К;

расч _расч ^

, <7 - соответственно среднее значение и корень квадратный

из дисперсии расчетного значения выходной переменной в К.

Адекватность полученной регрессионной модели тем выше, чем больше абсолютное значение этого коэффициента, т.е. величины

|RWI корр |. Это определяется проверкой выполнения нулевой гипотезы

по критерию Фишера [12-14, 16]. Кроме того, подлежит проверке значимость каждого из входных факторов и отдельных рассчитанных коэффициентов регрессионного уравнения.

Рекомендуется осуществлять анализ точности расчета по уравнениям математической модели не на том объеме исходных данных, которые использовались для построения регрессионных моделей, а на некоторой статистически представительной контрольной выборке, включающей R других и не участвовавших в расчете коэффициентов регрессии К [17].

В качестве критериев, определяющих точность расчета по построенным математическим моделям, рассматриваются следующие показатели [12-14, 16, 17, 25]:

1) корень от среднеквадратического значения ошибки расчета по уравнениям математической модели:

У- факт 1В ^В ~

г — фактическое значение выходной переменной в г-м комплекте информации;

/ расч ^В vy

Iг — расчетное значение выходной переменной в r-м комплекте информации;

R — количество комплектов информации;

2) показатель точности математической модели:

где А — корень квадратный от фактического значения дисперсии выходной переменной в рассматриваемых R;

3) среднее абсолютное отклонение ошибки расчета:

4) среднее абсолютное отклонение расчетных данных от фактических значений выходной переменной:

5) отношение диапазона изменения выходной переменной к корню от среднеквадратического значения ошибки расчета по уравнениям математической модели:

Вся входная информация сводится в таблицу, каждая строка которой содержит комплект информации, включающий объем фактических значений входных и выходных комплексных переменных, выраженных действительными числами и определяющих конкретный маршрут движения ТС. Если количество входных и комплексных переменных, входящих в уравнение регрессии, равно п, то для получения адекватной математической модели прогнозирования желательно, чтобы количество комплектов информации (число строк таблицы исходных данных N) удовлетворяло соотношению N > 20 х п. В качестве выходной переменной рассматривается переменная Т_М — суммарное время выполнения маршрута доставки грузов (в часах). Если значение этой переменной известно, то значения всех остальных переменных могут быть вычислены по формулам (1.1), (1.2) или (1.3). Свои виды этих зависимостей характерны для каждого конкретного транспортного предприятия. В ряде случаев для практического применения можно ограничиться рассмотрением линейных уравнений регрессии, которые в качестве входных факторов включают как входные переменные, представленные действительными числами, так и комплексные переменные Z Z2 и Z3, представляющие ряд важнейших факторов, выраженных лингвистическими и булевыми переменными. Первое приведенное ниже уравнение включает точные данные или данные, вычисленные по расстояниям между пунктами на основе спутниковых координат, о длине маршрута движения — S. Это уравнение имеет вид:

где Ьц,Ь, b$ — коэффициенты линейного уравнения регрессии.

Если точное значение переменной S, вычисленное по длине отдельных мелких участков пути, неизвестно, то оно может быть вычислено на основании линейного уравнения регрессии:

где qo,q,q2 — коэффициенты уравнения регрессии (1.14).

Второе уравнение регрессии включает в качестве важнейшей входной переменной значение Ds — длину маршрута, определяемую расчетом этого расстояния на основании спутниковой системы координат:

Для построения математических моделей прогнозирования фактических затрат времени и средств на перевозки грузов автомобильным транспортом необходимо выполнить следующий объем вычислений.

  • 1. Формируем выражения комплексных переменных Z Z2 и Z3 в виде линейных функций (1.4) от группы входных факторов, выраженных лингвистическими переменными. Коэффициенты этих уравнений определяем из условий максимизации критерия оптимальности (1.6).
  • 2. Если в регрессионной модели (1.13) в качестве входной переменной используется S — расчетная суммарная длина маршрута, точное значение которой неизвестно, то определяем значение этой переменной построением регрессионного уравнения S = fs (D, Z,).

В качестве частного случая этой зависимости может рассматриваться линейная зависимость вида:

Вычисляем значения 5/, / = 1, ..., N, по формуле (1.16) для каждого комплекта информации и вносим эти данные в таблицу исходных данных.

  • 3. Для всех входных факторов, входящих в уравнения регрессии (1.13) или (1.15), и выходной переменной вычисляем их средние значения, среднеквадратические отклонения, а также матрицу коэффициентов корреляции или корреляционные отношения между выходной переменной и каждым входным фактором. Входные факторы, для которых значения коэффициентов корреляции и/или корреляционные отношения с выходной переменной являются статистически незначимыми, исключаются из дальнейшего рассмотрения.
  • 4. Для оставшегося статистически значимого множества входных и комплексных переменных вычисляем матрицу значений корреляционных коэффициентов. Если найдутся входные факторы, значение коэффициента взаимной корреляции между которыми достаточно высоко (т.е. по абсолютной величине близко к 1), то оставляем из них только один фактор с наибольшим абсолютным значением коэффициента корреляции с выходной переменной. Формируем новую таблицу статистически независимых (или очень слабо зависящих) друг от друга входных факторов, значение коэффициентов корреляции с выходной переменной у которых статистически значимо и имеет достаточно высокое значение. Пусть количество таких факторов равно т.
  • 5. Формируем систему линейных алгебраических уравнений вида

Е = R х В, где Е = [lvy], j = 1, ..., т — вектор коэффициентов корреляции выходной переменной с каждым из статистически значимых и статистически независимых друг от друга входных факторов; В = [|3j], j = 1, ..., т — вектор коэффициентов нормированного уравнения регрессии;

— матрица коэффициентов корреляции

статистически значимых входных факторов, в которой значения статистически незначимых коэффициентов корреляции заменены на 0.

Определение коэффициентов регрессии В = [(37], j = 1, т,

сводится к решению системы линейных алгебраических уравнений (1.17 ) с нормированной корреляционной матрицей R:

После получения коэффициентов В = [|3j] возвращаемся к нормальному масштабу переменных

— соответственно математическое ожидание выходной переменной и входных факторов, ау и o[Z7] — соответственно среднеквадратические отклонения выходной переменной и входных факторов.

Разработанное по алгоритмам автора программное обеспечение нелинейного многофакторингого регрессионного анализа позволяет провести все необходимые преобразования для группы лингвистических, логических переменных и переменных, представленных в виде нечетких данных, в комплексные переменные, выраженные действительными числами, и использовать их при расчете коэффициентов модели. Различные группы входных факторов, выраженные действительными числами, также могут быть представлены в виде одной комплексной переменной с помощью различного вида из заданного в программе набора алгебраических выражений и включены в качестве линейного фактора в выражение регрессионной модели. В расчетах используются различные критерии оценки статистической значимости коэффициентов корреляции, регрессии, точности и адекватности регрессионной модели.

Описанные в работе алгоритмы и разработанное программное обеспечение были применены в 1997-1999 г.г. для расчета уравнений регрессии, определяющих зависимость транспортных расходов по доставке почтовых грузов для всех входных факторов по различным районам Германии. Они были также использованы для решения других прикладных задач прогнозирования стоимости грузовых перевозок в последующие годы. Полученные результаты получили положительную оценку заказчика (Deutsche Post AG) и использовались при планировании маршрутов перевозок автомобильным транспортом. Коэффициент множественной корреляции полученных уравнений регрессионной модели (1.9) был в пределах RMHKOpp е [0,82; 0,935], а показатель точности математической модели (1.11) - Gm е [9,5; 12,3].

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >