ПРИМЕНЕНИЕ ПАКЕТА STATISTICA В ЗАДАЧАХ ТУРИСТСКОЙ ИНДУСТРИИ

Пакет STATISTICA фирмы StatSoft Inc (США) является одним из самых математически строгих и надежных многофункциональных пакетов по обработке статистических данных. Именно поэтому, когда это возможно, рекомендуется в первую очередь применять данный пакет. В главе 6 он применяется с подробными пояснениями к задачам прогнозирования, кластеризации и проверки гипотез непараметрическими критериями.

Модуль Multiple Regression

Запуск пакета STATISTICA открывает типичное окно приложения Windows, показанное вместе с меню Statistics на рис. 6.1.

Рис. 6.1

Кнопка Q, как и опция New меню File, как и сочетание клавиш

Ctrl+N, открывает диалоговое окно Create New Document (Создание нового документа) (рис. 6.2).

Рис. 6.2

На вкладке Spreadsheet указываются размеры таблицы входных данных, variables (переменные) — столбцы, cases (случаи) — строки. Переключатель Placement (Местоположение) имеет две опции: In a new Workbook — в новой рабочей книге, As a standalone window — как самостоятельное окно. Сделанный выбор подтверждается командой О К.

Прогнозирование выполняется в модуле Multiple Regression (Множественная регрессия), диалоговое окно модуля показано на рис. 6.6. Зависимые и независимые переменные указываются в диалоговом окне, открываемом кнопкой Variable, для двух переменных это окно можно видеть на рис. 6.3.

Рис. 6.3

Пример 6.1. Согласно статистическим данным, динамика выезда российских туристов на отдых в Турцию с 2008 по 2012 г. (тыс. поездок) имеет следующий вид (табл. 6.1).

Таблица 6.1

Год

2008

2009

2010

2011

2012

Количество

2212,8

1966,7

2367,6

2681,7

2516,1

Найти по табл. 6.1 ожидаемое число российских туристов в 2013 г.

Открываем диалоговое окно Create New Document (см. рис. 6.2) и устанавливаем в нем параметр Number of variables на значении 2, параметр Number of cases на значении 5. Подтверждаем сделанный выбор кнопкой ОК, что открывает таблицу 5x2 для ввода данных, которую заполняем (рис. 6.4).

Рис. 6.4

Двойной щелчок по ячейке делает ее данные доступными для редактирования. Для заголовка строки (столбца) он открывает диалоговое окно ввода, показанное для заголовка переменной 1 на рис. 6.5.

Рис. 6.5

После ввода табличных данных переходим к диалоговому окну Multiple Linear Regression (рис. 6.6), кнопкой Variables открываем окно задания зависимых и независимых переменных (см. рис. 6.3), выбор подтверждаем кнопкой ОК:

Рис. 6.6

Кнопка ОК диалогового окна Multiple Linear Regression вызывает диалоговое окно Model Definition (Построение модели) (рис. 6.7).

Рис. 6.7

Поддерживаемые методы:

  • ? Standard — стандартный;
  • ? Forward stepwise — прямой пошаговый;
  • ? Backward stepwise — обратный пошаговый.

Значения параметра Intercept:

  • ? Include in model — включение свободного члена в модель;
  • ? Set to zero — принять равным нулю.

Кнопка ОК возвращает предварительные результаты (рис. 6.8), где:

  • ? Multiple R — коэффициент корреляции;
  • ? R-square — коэффициент детерминации;
  • ? Adjusted R2 — скорректированный коэффициент детерминации;
  • ? Standard error of estimate — стандартная ошибка оценки;
  • ? Intercept = -263 292,6200 — оценка свободного члена;
  • ? Std.Error — стандартная ошибка оценки свободного члена;
  • ? t = -1,998 — значение t-критерия;
  • ? р = 0,1396 — уровень значимости.

Рис. 6.8

Кнопка Summary Regression results возвращает более детальную статистику, где через контекстное меню устанавливаем нормальный формат (рис. 6.9).

Рис. 6.9

Отсюда следует, что уравнение прямолинейной регрессии у = 132, 16х —263293, все входящие величины значимы.

Переход в диалоговом окне Multiple Regression Results на вкладку Residuals/assumptions/prediction (см. рис. 6.8) дает возможность получить прогнозируемое значение (блок Predict values) и доверительный интервал, покрывающий это значение (см. рис. 6.12). Для этого устанавливается уровень значимости а и выбирается положение переключателя (рис. 6.10).

(* Compute confidence limits

Alpha:

Г4 Compute prediction limits

Рис. 6.10

Выбирая первое положение переключателя, кнопкой Predict dependent variable получаем окно ввода значения независимой переменной (рис. 6.11).

Рис. 6.11

Кнопка ОК возвращает предсказанное значение 2745 и границы доверительного интервала (рис. 6.12).

Рис. 6.12

Можно воспользоваться также инструментом «Добавить линию тренда» пакета MS Excel, полученные им результаты показаны на рис. 6.13.

Рис. 6.13

Пример 6.2. В таблице 6.2 приведены динамика ВВП России (млрд руб.) и динамика выезда российских туристов (тыс. человек) за границу.

Найти зависимость между ВВП и числом российских граждан, выезжающих за границу с целью туризма, и дать прогноз на текущий год.

Таблица 6.2

Год

2008

2009

2010

2011

2012

ВВП

41 277

38 043

39 659

41 384

42 791

Число выездов

11 313,7

9 555,2

12 605

14 495,9

15 332,1

Входные данные (рис. 6.14).

Рис. 6.14

Возвращаемые результаты (рис. 6.15, 6.16).

Рис. 6.15

Рис. 6.16

Отсюда следует, что уравнение прямолинейной регрессии у = 1,08х - 31273,7. Сделаем с помощью полученного уравнения прогноз, считая, что официальный прогноз на рост ВВП составляет 3,6%. Вводим данные (рис. 6.17).

Рис. 6.17

Получаем прогноз 16 661,9 тыс. туристов (рис. 6.18).

Рис. 6.18

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >