Меню
Главная
Авторизация/Регистрация
 
Главная arrow Социология
Посмотреть оригинал

СТАТИСТИЧЕСКИЕ МЕТОДЫ ИЗУЧЕНИЯ ВЗАИМОСВЯЗЕЙ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ

10.1. МЕТОДИЧЕСКИЕ УКАЗАНИЯ

Любое явление формируется под воздействием множества причин (факторов). Одни причины (факторы) являются главными, определяющими в основном уровень явления, другие — второстепенными, незначительно влияющими на него.

Изучение причинно-следственных связей между явлениями дает возможность лучше их понять, а следовательно, целенаправленно на них воздействовать.

Статистика ставит перед собой следующие задачи:

  • 1) выявить наличие или отсутствие причинно-следственных связей между социально-экономическими явлениями;
  • 2) определить направление связи;
  • 3) измерить количественно тесноту связи;
  • 4) выразить математически форму связи.

Информацию, полученную в ходе статистического анализа причинно-следственных связей, можно использовать:

  • 1) для глубокого анализа социально-экономических явлений и процессов, в том числе финансово-хозяйственной деятельности предприятия;
  • 2) для выявления неиспользованных резервов;
  • 3) в планировании;
  • 4) в прогнозировании;
  • 5) в ходе разработки норм, нормативов.

Количественному анализу связей между явлениями должен предшествовать глубокий анализ сущности изучаемых явлений — качественный анализ.

Типы зависимостей между явлениями многообразны (табл. 10.1).

Для выявления и изучения стохастических связей используются различные методы (табл. 10.2).

Регрессионно-корреляционный анализ (РКА) — наиболее глубокий метод изучения стохастических связей. Он заключается в построении и анализе экономико-математической модели в виде уравнения регрессии, выражающего зависимость явления Yот определяющих его факторов Х, Х2 ... Хп.

Выделяют следующие этапы РКА.

  • 1) предварительный (априорный) анализ;
  • 2) сбор информации, ее первичная обработка;
  • 3) построение модели (уравнения) регрессии;
  • 4) оценка и анализ модели.

Этап I. Формулируют цель, задачи исследования, определяют результативный признак Y и показатель, его отражающий, выявляют признаки-факторы Х, Х2 ... Хп, оказывающие наиболее существенное влияние на формирование результативного признака, методику их измерения. Желательно, чтобы факторные признаки имели количественное выражение и не дублировали друг друга.

Таблица 10.1

Характеристика взаимосвязей между явлениями

Статистическая

категория

Содержание категории

Виды статистических признаков

Факторный признак (X)

Независимый признак, влияющий на другие признаки и определяющий их значения

Результативный признак (Y)

Зависимый признак, изменяющийся под влиянием факторных признаков Xi, Х2 ... Хп

Типы взаимосвязей

Функциональная

зависимость

Каждому значению признака-фактора (X) соответствует одно строго определенное значение Y

Стохастическая

(вероятностная)

зависимость

Каждому значению X соответствует ряд значений Y (Yi, Y2,... Yn). Связь проявляется для совокупности в целом, а не для каждой единицы совокупности в отдельности

Корреляционная

зависимость

Частный случай стохастической связи: каждому значению X соответствует среднее значение Y (Y).

Виды взаимосвязей по направлению

Прямая связь

Если значения X растут, значения Y тоже растут (и наоборот). Например, если растет численность рабочих — растет и количество произведенной продукции (при прочих равных условиях)

Обратная связь

Если значения X растут, значения Y уменьшаются (и наоборот). Например, если растет себестоимость продукции — снижается прибыль (при прочих равных условиях)

Виды взаимосвязей по аналитическому выражению (уравнению)

Линейная связь

Зависимость между признаками X и Y выражается в виде уравнения прямой линии (прямолинейная связь)

Нелинейная связь

Зависимость между X и Y выражается в виде уравнения кривой линии: параболы, гиперболы, показательной функции, др.

Методы выявления стохастической связи

Таблица 10.2

Метод

Содержание

Метод параллельных рядов

Сопоставление рядов статистических показателей. Один ряд отражает значения признака-фактора X, перечисленные в порядке возрастания либо убывания (ранжированный ряд). Второй параллельный ряд — соответствующие первому ряду значения результативного показателя Y. Определяют наличие или отсутствие связи и ее направление

Графический метод

Значения X и Y изображают на графике в форме корреляционного поля. По форме корреляционного облака определяют наличие или отсутствие связи и ее форму

Аналитическая

группировка

Производят группировку единиц совокупности по факторному признаку X. Для каждой группы исчисляют среднее значение результативного показателя Y. Определяют наличие или отсутствие связи и ее направление

Корреляционный

анализ

Количественное определение тесноты и направления связи между признаками

Регрессионный

анализ

Определение формы связи, т.е. ее аналитического выражения (формулы, уравнения)

Этап II. Собирают достаточно большой массив качественно однородных данных для обеспечения надежных результатов исследования.

Совет бывалого статистика. Объем совокупности (число единиц) должен быть в 6—8 раз больше количества включаемых в модель факторов.

Далее проводят оценку однородности совокупности, проверку соответствия распределения факторных признаков критериям нормального распределения, исключают при необходимости аномальные единицы.

Качественная однородность собранных данных предполагает существование близких условий формирования результативного и факторных признаков. Например, при изучении факторов, определяющих успеваемость студентов колледжа, не следует объединять в одну совокупность студентов дневного и заочного отделений.

Для количественной оценки однородности совокупности используют коэффициент вариации по факторным признакам:

где х — среднее квадратическое отклонение факторного признака; щ— среднее значение факторного признака.

Совокупность считается однородной, если коэффициент вариации Vx меньше 33%.

Проверка первичных данных на нормальность распределения проводится с помощью правила «трех сигм»: (задача 10.1).

Из совокупности исключают (при необходимости) аномальные единицы — единицы наблюдения, у которых значение признака-фактора не удовлетворяет неравенству:

Этап III. При построении уравнения регрессии (модели) устанавливают наличие корреляционной связи между результативным показателем и факторами, определяют ее форму, направление, измеряют степень тесноты и существенности связи.

Форма связи — это тип аналитической функции, характеризующей механизм взаимосвязи между результативным признаком и признаками-факторами. Например, прямая линия, парабола второго порядка, гипербола и др.

Выбор формы связи производят на основе теоретического и эмпирического анализа.

Сделать обоснованный выбор уравнения регрессии только на основе теоретического анализа очень трудно, так как изучаемые социально-экономические явления сложны по своей структуре, внутренняя логика их связей не всегда ясна, факторы взаимодействуют не только с результативным показателем, но и друг с другом, информация о них неполная.

Поэтому теоретический анализ дополняется эмпирическим.

Если нанести в виде точек исходные данные, отражающие стохастическую зависимость между результативным показателем У и признаком-фактором X на график в прямоугольной системе координат, то получится совокупность точек, которая представляет собой не линию, а «облако», так как каждому значению X соответствует не одно (как при функциональной связи), а несколько значений У. Это «облако», или поле корреляции, помогает определить направление связи (прямая, обратная), форму связи и др.

Эмпирическая линия регрессии графически отображает изменение групповых средних результативного признака (F,) в зависимости от изменения признака-фактора (X) и предоставляет дополнительную информацию для РКА.

Обоснованно выбрав форму корреляционной связи, исчисляют параметры модели (уравнения регрессии).

Этап IV. Осуществляется оценка и анализ построенной модели.

На основании уравнения регрессии определяются теоретические значения результативного признака (Ух), т.е. значения У при условии, что на него влияет только один фактор Х, а другие факторы Х2, Х% ... Хп остаются на неизменном уровне.

Расчет параметров уравнения регрессии основан на методе наименьших квадратов, согласно которому сумма квадратов отклонений эмпирических значений У от теоретических Ух минимальна (для всех кривых одного вида):

В случае выравнивания по прямой: Y= aQ + а^х, метод наименьших квадратов приводит к следующей системе нормальных уравнений:

Параметры aQ и я у определяют по формулам:

Для определения параметров параболы второго порядка: система нормальных уравнений такова:

Для оценки степени точности отражения изучаемой взаимосвязи между X и У исчисляют следующие показатели:

где Se — средняя квадратическая ошибка уравнения;

у~— средний уровень результативного признака;

у — фактические значения результативного признака;

у~х значения результативного признака, рассчитанные но уравнению регрессии;

п — количество единиц наблюдения;

/ — число параметров в уравнении регрессии.

Если отношение не превышает 10—15%, то уравнение регрессии хорошо отображает изучаемую стохастическую взаимосвязь.

Теснота корреляционной связи между социально-экономическими явлениями изучается с помощью таких показателей, как линейный коэффициент корреляции, эмпирическое корреляционное отношение и др. (табл. 10.3).

Таблица 10.3

Методика определения степени тесноты корреляционной

связи

Показатель

Формула расчета

Условие

применения

Линейный

коэффициент

корреляции

где х-х — отклонения вариантов значений признака- фактора от их средней величины; х-у — отклонения вариантов значений результативного признака от их средней величины; л — число единиц в совокупности; ох, оу среднее квадратическое отклонение признака-фактора и результативного признака соответственно.

Парная линейная зависимость между Yи X

Эмпирическое корреляционное отношение

где <52 — межгрупповая дисперсия результативного признака, вызванная влиянием признака-фактора; оу2 общая дисперсия результативного признака.

Парная нелинейная (криволинейная) зависимость между Y иХ

Коэффициент

Фехнера

где С, И — соответственно количество совпадений и несовпадений знаков отклонений индивидуальных величин факторного признака X и результативного признака Y от их средней арифметической величины соответственно.

При небольшом объеме исходной информации

Коэффициент

корреляции

рангов

Спирмэна

где dj — разность между величинами рангов признака-фактора и результативного признака; л — число показателей (рангов) изучаемого ряда.

Для количественных и качественных признаков, значения которых могут быть проранжиро- ваны

Окончание

Показатель

Формула расчета

Условие

применения

Коэффициент ассоциации Д. Юла

где о, Ь, с, d — частоты взаимного сочетания двух альтернативных признаков А и В.

Для качественных альтернативных признаков.

Коэффициент контингенции К. Пирсона

где о, Ь, с, d — частоты взаимной комбинации двух альтернативных признаков А и В.

Совет бывалого статистика. Для расчета коэффициентов ассоциации и контингенции удобно составлять таблицу:

Признак

А (да)

А'(нет)

Итого:

В (да)

а

Ь

а + b

В'(нет)

с

d

c + d

Итого:

а + с

b + d

п

Характеристика корреляционного анализа

Таблица10.4

Статистическая

категория

Содержание категории

Парная корреляция

Это связь между двумя количественными переменными

Множественная

корреляция

Это связь между результативным показателем (Y) и несколькими признаками-факторами ь Х2 ... Хп)

Частная корреляция

Это зависимость между результативным показателем (Y) и одним признаком-фактором (Xx), при устранении (элиминировании) влияния другого фактора (Х2)

Парный коэффициент корреляции

Характеризует тесноту и направление связи между двумя количественными переменными

Линейный коэффициент корреляции (г)

Характеризует тесноту и направление связи между двумя признаками в случае наличия между ними линейной зависимости

Множественный коэффициент корреляции (/?)

Вычисляется при наличии линейной связи между результативным (Y) и несколькими факторными ь Х2... Хп) признаками, а также между каждой парой факторных признаков (Xi, Х2). 0

Частные коэффициенты корреляции (г)

Характеризуют степень тесноты связи между двумя признаками Х1 и Х2 при фиксированном значении других факторных признаков

Для определения тесноты связи между альтернативными признаками, имеющими любое число вариантов значений, используются коэффициент взаимной сопряженности К. Пирсона и коэффициент взаимной сопряженности А.А. Чупрова.

В таблице 10.4 отражено содержание основных категорий корреляционного анализа.

В таблице 10.5 представлены значения линейного коэффициента корреляции, поясняется их смысл.

Таблица10.5

Линейный коэффициент корреляции и его характеристика

Значение линейного коэффициента связи

Характеристика

связи

Пояснения

г = 0

Отсутствует

-

0 < г < 1

Прямая

С увеличением X увеличивается Y и наоборот

-1< г< 0

Обратная

С увеличением X уменьшается Y и наоборот

г=1

Функциональная

Каждому значению X строго соответствует одно значение Y

Характеристика величины коэффициента корреляции дана в табл.

10.6.

Таблица 10.6

Количественные критерии оценки тесноты связи

Величина коэффициента корреляции

Сила связи

До ± 0,3

Практически отсутствует

От ± 0,3 до ± 0,5

Слабая

От ± 0,5 до ± 0,7

Умеренная

От ± 0,7 до ± 1,0

Сильная

В таблице 10.7 представлено содержание основных категорий регрессионного анализа.

На практике чаще всего применяют линейную регрессию.

Совет бывалого статистика. Линейную форму связи выбирают, если результативный и факторный признаки растут приблизительно одинаково.

Параболическую форму связи — если с увеличение значений фактора, результативный признак сначала растет, а потом снижается.

Гиперболическую форму связи — если один признак увеличивается, а другой неравномерно уменьшается.

Характеристика регрессии

Статистическая категория

Содержание категории

Регрессия

Это зависимость среднего значения случайной величины Y от других величин Хь Х2... Хп

Парная регрессия

Это форма связи между двумя признаками (Y, XJ

Многофакторная регрессия

Это изучение связи между тремя и более связанными между собой признаками (Y, Хг, Х2 ... Хп)

Парная линейная регрессия

Множественная линейная регрессия

Параболическая регрессия

Показательная

регрессия

Гиперболическая

регрессия

Степенная регрессия

В таблице 10.8 дается характеристика коэффициентам (параметрам) уравнения регрессии.

Характеристика коэффициентов регрессии

Таблица 10.8

Статистическая

категория

Содержание категории

Величина коэффициента регрессии (о,)

Чем больше величина коэффициента регрессии, тем значительнее влияние факторного признака на результативный признак

Знак коэффициента

регрессии

«+» или «-»

Знак плюс свидетельствует о прямой связи между X и Y, т.е. с увеличением фактора X результативный признак Y возрастает. Знак минус свидетельствует об обратной связи: с увеличением Xуменьшается Y

Коэффициенты (параметры) уравнения регрессии показывают:

«0

Свободный член уравнения регрессии. Отражает: 1) усредненное влияние на результативный признак (Y) неучтенных в уравнении факторных признаков (X); 2) значение Y при X = 0; 3) не имеет экономической интерпретации, если X не принимает нулевых значений

OJ

На сколько в среднем изменяется значение Y, при изменении Хх на единицу собственного измерения

°2

На сколько единиц изменится Y, если Х2 изменится на единицу

оп

На сколько единиц изменится Y, если Хп изменится на единицу

Кроме парной регрессии рассмотрим множественную регрессию.

Совет бывалого статистика. Число факторов, включаемых в модель

множественной зависимости, должно быть в 5—6 раз меньше числа

единиц, входящих в совокупность.

Линейное уравнение множественной зависимости Y от Х, Х2,...

...Хп:

Линейное уравнение множественной зависимости Y от Аф X2'.

Система нормальных уравнений:

Коэффициент множественной (совокупной) корреляции применяется для измерения тесноты связи между изменениями величины результативного признака Y и изменениями значений факторных признаков Х, Х2'.

Если число факторов-признаков более двух, то совокупный коэффициент корреляции (детерминации) определяется по формуле:

где — коэффициент детерминации;

А — матрица парных коэффициентов корреляции;

А — матрица парных коэффициентов корреляции (А) без верхней строки и первого столбца.

Чем ближе коэффициент детерминации к единице, тем меньше роль неучтенных факторов в модели, тем больше оснований считать, что параметры регрессионной модели отражают степень эффективности включенных в нее факторов.

Частные коэффициенты корреляции дополняют совокупный коэффициент и позволяют установить степень тесноты связи между результативным признаком и каждым из факторных признаков при исключении искажающего влияния других факторных признаков.

Коэффициенты частной корреляции отражают степень чистого влияния факторного признака на результативный признак.

Если рассматривается зависимость результативного признака от двух факторных, то определяется два коэффициента частной корреляции:

1) между результативным признаком и признаком-фактором Х при элиминировании (устранении влияния) фактора Х2:

2) между результативным признаком и признаком-фактором Х2 при элиминировании фактора Х.

Коэффициенты частной корреляции находятся в пределах от нуля до единицы (по модулю).

Чтобы сравнить роль различных факторов в формировании моделируемого показателя исчисляются:

1) коэффициент эластичности (3j):

где flj — коэффициент регрессии при/-м факторе.

Частный коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак Y с изменением признака-фактора X на 1%.

2) р- коэффициент (/?;):

/^-коэффициент показывает, на какую часть среднего квадратического отклонения изменится результативный признак У при изменении соответствующего признака-фактора X на величину его среднего квадратического отклонения.

В настоящее время для обработки экономической информации широко используются возможности компьютерной техники. Специально разработанные программы позволяют значительно облегчить труд экономиста, ускорить процесс расчетов, что позволяет принимать оперативные и обоснованные управленческие решения.

10.2. РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ

Задача 10.1. Проведите РКА взаимосвязи между квалификацией и производительностью труда рабочих, если имеются следующие данные о тарифных разрядах и сменной выработке рабочих бригады (табл. 10.9):

Таблица 10.9

Тарифные разряды и сменная выработка рабочих бригады

N9 п/п

1

2

3

4

5

6

7

8

9

10

Тарифный разряд рабочего

6

5

3

4

6

2

5

4

5

3

Выработка рабочего, шт./чел.

40

38

34

36

38

30

36

34

39

32

Решение. Проведем РКА по отдельным шагам.

Шаг 1. На основании предварительного теоретического анализа предположим наличие прямой стохастической связи между квалификацией рабочих (X — признак-фактор) и производительностью труда рабочих (У— результативный признак), т.е. с повышением уровня квалификации рабочих увеличивается их производительность труда.

Показателем квалификации (А) будет тарифный квалификационный разряд рабочих бригады. Показателем производительности труда (У) — сменная выработка рабочих бригады.

Шаг 2. Проверим однородность первичных данных по признаку- фактору X, для чего рассчитаем коэффициент вариации Vx, представив расчеты в табл. 10.10:

Таблица 10.10

Расчет коэффициент вариации Vx

X

х-х

(Х-х)2

X

х-х

(х-х)2

1

6

+1,7

2,89

6

2

-2,3

+5,29

2

5

+0,7

0,49

7

5

+0,7

0,49

3

3

-1,3

1,69

8

4

-0,3

0,09

4

4

-0,3

0,09

9

5

+0,7

0,49

5

6

+1,7

2,89

10

3

-1,3

1,69

X

X

X

X

Итого:

43

X

16,1

Вывод. Исчисленный коэффициент вариации (29,5%) меньше 33%, что свидетельствует об однородности совокупности по признаку- фактору X.

Шаг 3. Проверим (с помощью правила «трех сигм») распределение первичных данных на соответствие нормальному распределению. Расчеты представлены в табл. 10.11.

Таблица 10.11

Проверка данных на соответствие нормальному распределению

Интервалы значений признака х х = 4,3 ах=1,27

Значения интервалов признака х

Количество единиц, входящих в интервал

Удельный вес единиц, входящих в интервал, в общем их числе,

%

Удельный вес единиц, входящих в интервал, при нормальном распределении,%

Х±Ох

3,03—5,57

7

70

68,3

х± 2ох

1,76-6,84

10

100

95,4

Вывод. Распределение первичных данных (X) подчиняется закону нормального распределения.

Следует отметить, что на практике РКА применяют даже в тех случаях, когда нарушаются требования нормальности распределения и однородности совокупности.

Шаг 4. Исключим из массива первичных данных аномальные единицы, т.е. единицы, которые не попадают в интервал:

Вывод. Таких единиц в первичных данных нет (табл. 10.11).

Шаг 5. Проверим наличие связи между Хи У методом аналитической группировки. Расчеты представлены в табл. 10.12.

Вывод. Результаты аналитической группировки подтверждают теоретическое предположение о наличии прямой стохастической связи между факторами А и У: из таблицы видно, что с увеличением тарифного разряда (Xj) выработка рабочих ) также растет.

Таблица 10.12

Аналитическая группировка рабочих по тарифному разряду

Тарифный

разряд

х;

Количество рабочих, человек л,-

Сумма

выработки

I У/

Средняя

выработка

У/

у-У

(у, - У)Ч

2

1

30

30,0

-5,7

32,49

3

2

34 + 32 = 66

66:2 = 33,0

-2,7

7,29 х 2 = 14,58

4

2

36 + 34 = 70

70:2 = 35,0

-0,7

0,49 х 2 = 0,98

5

3

ИЗ

113 : 3 = 37,7

+2,0

12,0

6

2

78

39,0

+3,3

21,78

Итого:

10

357

35,7 = у

X

81,83

Шаг 6. Если данные X и Yнанести на график (по оси ОХ — тарифный разряд, по оси О У — выработку), то эмпирическая линия связи по своей форме приближается к прямой линии (рис. 10.1). Следовательно, можно принять наличие прямолинейной корреляционной связи между X и Y и в дальнейшем рассчитать параметры линейного уравнения регрессии.

Корреляционное поле

Рис. 10.1. Корреляционное поле

Шаг 7. Измерим тесноту корреляционной связи между X и Fc помощью линейного коэффициента корреляции (г). В таблице 10.13 произведем необходимые вычисления.

Таблица 10.13

Расчет коэффициента корреляции и параметров уравнения линейной регрессии

У

X

X2

ху

У2

у-у

(У-у)2

У

У-У

(у-у)2

д

1

2

3

4

6

7

8

9

10

11

1

40

6

36

240

1 600

+4,3

18,49

39,492

0,508

0,2581

2

38

5

25

190

1444

+2,3

5,29

37,262

0,738

0,5446

3

34

3

9

102

1 156

—1,7

2,89

32,802

1,198

1,4352

4

36

4

16

144

1 296

+0,3

0,09

35,032

-0,032

0,0010

5

38

6

36

228

1444

+2,3

5,29

39,492

-1,492

2,2261

6

30

2

4

60

900

-5,7

32,49

30,572

-0,572

0,3272

7

36

5

25

180

1 296

+0,3

0,09

37,262

-1,252

1,5675

8

34

4

16

136

1 156

—1,7

2,89

35,032

-1,032

1,0650

9

39

5

25

195

1 521

+3,3

10,89

37,262

1,738

3,0206

10

32

3

9

96

1024

-3,7

13,69

32,802

-0,802

0,6432

Итого:

357

43

201

1 571

12 837

X

92,10

X

X

11,0885

Вывод. Положительный знак исчисленного коэффициента корреляции свидетельствует о наличии прямой связи между факторами X и У. Связь между факторами X и У сильная, так как величина коэффициента корреляции находится в интервале от 0,7 до 1,0 (табл. 10.6).

Рассчитаем коэффициент детерминации, который равен квадрату коэффициента корреляции:

Вывод. 86% вариации У обусловлено вариацией X, т.е. изменение производительности труда рабочих бригады (их выработки) на 86% объясняется изменением их квалификации (тарифного разряда).

Шаг 8. Проверим существенность исчисленного линейного коэффициента корреляции, для чего рассчитаем среднюю квадратическую ошибку (ну) и значение ?-критерия (?раСч.)> сравнив последнее с табличным значением t-критерия Стьюдента:

Табличное значение t-критерия Стыодента равно 2,306. Оно определяется по таблицам для распределения Стыодента при числе степеней свободы & = п- 2=10-2 = 8ис вероятностью Р = 0,95 (уровне значимости а = 0,05).

Вывод. Расчетное значение t-критерия (7,281) больше табличного (2,306), что свидетельствует о существенности линейного коэффициента корреляции.

Шаг 9. Рассчитаем параметры линейного уравнения регрессии (методом наименьших квадратов):

Вывод. При увеличении тарифного разряда на один квалификационный разряд выработка рабочих увеличивается на 2,23 шт.

Шаг 10. Проверим возможность использования линейной функции, для чего рассчитаем со2 и сравним с табличным значением Е-критерия. Если со2 будет меньше табличного значения Е-критерия, то гипотеза о возможности использования в качестве уравнения регрессии линейной функции не опровергается.

Произведем подстановку в формулы, используя данные табл. 10.12 и 10.13:

Вывод. 88,9% вариации выработки рабочих бригады объясняется вариацией тарифного разряда, а оставшиеся 11,1% — другими факторами. Это еще раз подтверждает высокую степень тесноты связи между анализируемыми признаками.

Рассчитаем эмпирическое корреляционное отношение:

По таблице значений Fдля доверительной вероятности Р = (1 - а) = 0,95 и степеней свободы k=m-2 = A- 2 = 2nk2=n-m = lQ-A = 6 Т-табличное составляет 5,14, что превышает исчисленный показатель со2 = 0,519.

Вывод. Гипотеза о возможности использования в качестве уравнения регрессии линейной функции не опровергается.

Шаг 11. Проверим достоверность уравнения регрессии, т.е. оценим степень точности отражения взаимосвязи между X и У, для чего рассчитаем следующие показатели:

где Se — средняя квадратическая ошибка уравнения регрессии; средний уровень результативного признака (табл. 10.12);

у — фактические значения результативного признака;

у — значения результативного признака, рассчитанные по уравнению регрессии# = +26,112 + 2,230х(табл. 10.13);

где п количество единиц наблюдения;

/ — число параметров в уравнении регрессии.

Вывод. Так как отношение меньше 10—15%, следовательно, уравнение регрессии достаточно хорошо отображает изучаемую стохастическую взаимосвязь между квалификацией рабочих (тарифным разрядом) X и производительностью труда (выработкой) рабочих Y.

Следует отметить, что в задаче рассматривался небольшой объем совокупности (10 наблюдений).

Совет бывалого статистика. Для повышения надежности и достоверности результатов РКА необходимо использовать значительно больший массив первичных данных. Только в этом случае регрессионная модель будет иметь практическое значение для проведения глубокого анализа финансово-хозяйственной деятельности предприятия, выявления неиспользованных резервов, принятия обоснованных и эффективных управленческих решений.

Задача 10.2. Используя данные задачи 10.1, рассчитайте коэффициент Фехнера. Сделайте вывод о степени тесноты связи между уровнем квалификации и производительностью труда рабочих.

Решение. Как известно, при небольшом объеме исходной информации для определения степени тесноты корреляционной связи можно использовать коэффициент Фехнера:

где С, Н — соответственно количество совпадений и несовпадений знаков отклонений индивидуальных величин факторного признака X и результативного признака Yот их средней арифметической величины соответственно;

X — тарифный разряд рабочих бригады;

Y — выработка рабочих бригады.

Воспользуемся исчисленными в задаче 10.1 показателями: X = 4,3 и Y = 35,7 шт.

Для удобства расчетов составим таблицу:

Таблица 10.14

Расчет коэффициента Фехнера

X

У

Х-Х

Y-Y

С или Н

X

Y

Х-Х

Y-Y

С или Н

1

6

40

+1,7

+4,3

С

6

2

30

-2,3

-5,7

С

2

5

38

+0,7

+2,3

С

7

5

36

+0,7

+0,3

С

3

3

34

-1,3

—1,7

с

8

4

34

-0,3

-1,07

с

4

4

36

-0,3

+0,3

н

9

5

39

+0,7

+3,3

с

5

6

38

+1,7

+2,3

с

10

3

32

-1,3

-3,7

с

Итого:

X

X

X

X

X

Итого:

43

357

X

X

X

Вывод. Теснота связи между тарифным разрядом X и сменной выработкой рабочих бригады Y (т.е. уровнем квалификации и производительностью труда) прямая, так как знак коэффициента Фехнера положительный, и достаточно сильная, так как максимальное значение коэффициента — единица, а в нашем случае — 0,80.

Итак, вывод, сделанный по коэффициенту Фехнера, совпадает с выводом о наличии прямой и достаточно сильной корреляционной связи, сделанным в задаче 10.1 по коэффициенту корреляции.

Задача 10.3. Используя коэффициент корреляции рангов Спир- мэна, определите степень тесноты связи между стажем и заработной платой работников подразделения организации по данным табл. 10.15.

Таблица 10.15

Общий стаж и заработная плата работников организации

N9 п/п

1

2

3

4

5

6

7

8

9

10

Общий стаж, лет

3

10

25

18

4

9

15

14

7

20

Заработная плата в месяц, тыс. руб.

18

45

49

36

20

27

29

30

25

44

Решение. Коэффициент Спирмэна исчисляется по формуле:

где dj — разность между величинами рангов признака-фактора и результативного признака;

п — число показателей (рангов) изучаемого ряда.

Составим таблицу 10.16 для расчета коэффициента Спирмэна.

Таблица 10.16

Расчет коэффициента корреляции рангов Спирмэна

Стаж,

летХ

Заработная плата за месяц, тыс. руб. У

«х

Ry

d = Rx- Ry

d2

1

3

18

1

1

0

0

2

10

45

5

9

-4

16

3

25

49

10

10

0

0

4

18

36

8

7

+1

1

5

4

20

2

2

0

0

6

9

27

4

4

0

0

Окончание

Стаж,

летХ

Заработная плата за месяц, тыс. руб. Y

«х

Ry

d-Rx-Ry

d2

7

15

29

7

5

+2

4

8

14

30

6

6

0

0

9

7

25

3

3

0

0

10

20

44

9

8

+1

1

Итого:

X

X

X

X

X

22

Во-первых, проранжируем рабочих организации по общему стажу работы, затем по величине зарплаты, присвоив каждому рабочему соответствующий ранг от первого до десятого.

Первый ранг присвоим работнику с самым маленьким стажем работы (Rx) или с самой маленькой заработной зарплатой (Ry), высший десятый ранг — с самым большим стажем или зарплатой.

Во-вторых, рассчитаем коэффициент Спирмэна по формуле:

Коэффициент Спирмэна находится в пределах:

Вывод. Коэффициент Спирмэна подтверждает сильную зависимость между стажем работы и величиной заработной платы работников организации.

Совет бывалого статистика. Коэффициент Спирмэна более точный

показатель тесноты связи, чем коэффициент Фехнера.

Задача 10.4. Рассчитайте коэффициент ассоциации Д. Юла, сделайте выводы на базе данных отдела кадров предприятия (табл. 10.17), определив тесноту связи между степенью удовлетворенности рабочих предприятия своей работой и стремлением поменять работу в ближайшее время.

Таблица 10.17

Расчет коэффициента ассоциации Д. Юла

Степень удовлетворенности работой

Планируете ли сменить работу в ближайшее время?

Итого:

Да

Нет

Удовлетворен

а = 2

b = 59

а + b = 61

Не удовлетворен

с = 6

о_

II

с + d = 10

Итого:

а + с = 8

b + d = 63

п = 71

Решение. Для расчета коэффициента ассоциации Д. Юла воспользуемся данными табл. 10.3 и пояснениями к ней.

Исчислим коэффициент ассоциации Д. Юла по формуле:

где a, b,c,d — частоты взаимного сочетания двух альтернативных признаков Ли В.

Вывод. Между степенью удовлетворенности рабочих предприятия своей работой и стремлением поменять работу в ближайшее время наблюдается достаточно сильная связь: коэффициент близок к -1. Связь обратная, так как знак у коэффициента «минус», т.е. чем выше степень удовлетворенности работой, тем меньше у работника предприятия желание сменить работу в ближайшее время.

Задача 10.4. Используя данные задачи 10.1, рассчитайте коэффициент корреляции рангов Спирмэна, определив степень тесноты связи между квалификацией и производительностью труда рабочих.

Решение. Для расчета коэффициента Спирмэна составим таблицу 10.18.

Таблица 10.18

Расчет коэффициента корреляции рангов Спирмэна

Тарифный

разряд

X

Выработка рабочего, шт./чел.

Y

«х

Ry

d = Rx- Ry

d2

1

2

30

1

1

0

0

2

3

32

2,5

2

+0,5

0,25

3

3

34

2,5

3,5

-i,o

1,00

4

4

34

4,5

3,5

+1,0

1,00

5

4

36

4,5

5,5

-i,o

1,00

6

5

36

7,0

5,5

+1,5

2,25

7

5

38

7,0

7,5

-0,5

0,25

8

5

38

7,0

7,5

-0,5

0,25

9

6

39

9,5

9

+0,5

0,25

10

6

40

9,5

10

-0,5

0,25

Итого:

X

X

X

X

X

6,50

Расположим значения тарифных разрядов X и выработки рабочих Y в порядке их возрастания. Присвоим каждому значению X и Y соответствующий ранг.

Как видно из таблицы, у некоторых рабочих совпадают по значению тарифные разряды (или выработка).

Как в этом случае ранжировать ряд, т.е. присваивать ранги?

Совет бывалого статистика. В случае наличия одинаковых значений у признака X (или Y) каждому из них присваиваются не одинаковые, а разные ранги, а именно среднее арифметическое значение, исчисленное из их рангов.

Например, ранга «2» в ряду значений X не будет, а будет ранг «2,5»:

Аналогично будут исчислены ранги «4,5», «7,0» и «9,5»:

По ряду значений Y расчет осуществляется аналогично.

Далее рассчитаем коэффициент рангов Спирмэна:

Коэффициент Спирмэна находится в пределах:

Вывод. Коэффициент Спирмэна свидетельствует о сильной и прямой зависимости между квалификацией рабочих и производительностью труда, что подтверждает вывод о тесноте и направлении связи, сделанный ранее в задаче 10.1 (на базе коэффициента корреляции).

10.3. ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ

Мало желать: за дело примись, чтоб свершилось желанье.

Овидий

Задание 10.1. Назовите функциональные и стохастические зависимости из приведенного списка:

  • 1) успеваемость и посещаемость студентов колледжа;
  • 2) грузооборот, длина пути и масса груза при перевозке;
  • 3) срок использования станков и фактическая степень их износа;
  • 4) торговая площадь и товарооборот магазина;
  • 5) доход семьи и желание иметь детей;
  • 6) процент брака и уровень квалификации рабочих.

Укажите признак-фактор и результативный признак. Аргументируйте свой выбор.

Задание 10.2. Самостоятельно приведите примеры функциональных и стохастических зависимостей. По каждому примеру укажите факторный и результативный признаки, вид взаимосвязи.

Задание 10.3. Проведите пошаговый РКА взаимосвязи между возрастом оборудования и количеством его поломок по данным цеха за отчетный период (табл. 10.19).

Таблица 10.19

Возраст оборудования цеха и количество его поломок

№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

Возраст оборудования, лет

10

7

15

3

20

16

1

10

7

5

9

6

8

Количество поломок, ед.

3

2

6

1

8

3

0

2

1

1

2

1

2

Сделайте выводы.

Задание 10.4. Используя данные задачи 10.3, рассчитайте коэффициент Фехнера. Сделайте вывод.

Задание 10.5. По результатам анкетирования посетителей музея всем экскурсоводам были выставлены определенные ранги в зависимости от качества проведенных экскурсий (табл. 10.20).

Используя коэффициент корреляции рангов Спирмэна, проанализируйте степень тесноты связи между качеством проведенной экскурсии и стажем работы экскурсовода.

Таблица 10.20

Информация о качестве экскурсий и стаже работы экскурсоводов музея

N9 п/п

1

2

3

4

5

6

7

8

9

10

11

12

Ранг по качеству экскурсии

3

6

12

7

10

1

4

11

8

2

5

9

Стаж экскурсовода, лет

18

16

20

5

3

7

9

4

6

15

11

2

Решение оформите в таблице. Какие выводы может сделать руководство музея?

Задание 10.6. Были получены следующие данные по результатам анкетирования студентов экономического факультета вуза:

Таблица 10.21

Распределение студентов по полу и отношению к гражданскому браку

Пол

Отношение к гражданскому браку

Итого:

скорее положительное

скорее отрицательное

Мужской

28

12

40

Женский

26

59

85

Итого:

54

71

125

Проанализируйте тесноту связи между полом опрашиваемых молодых людей и их отношением к вступлению в гражданский брак, для чего рассчитайте коэффициент ассоциации Д. Юла. Сделайте выводы.

Задание 10.7. Дайте интерпретацию параметрам уравнения регрессии:

где Y — прочность бетона, кг/см2;

содержание воды в замесе, %;

Х2 содержание песка в замесе, %;

хз — содержание цемента в замесе, %;

Х4 температура смеси,°С;

Х5 — температура среды хранения, °С.

 
Посмотреть оригинал
 

Популярные страницы