Теоретические основы проведения корреляционного анализа
Зависимость между двумя наборами данных может быть представлена линейной или нелинейной. Визуально это можно оцепить на графике разброса. В то же время при использовании графика наличие или отсутствие зависимости между данными определяется субъективно, то есть исходя из личного мнения. Например, на рисунке 2.1 можно наблюдать определённую зависимость между данными: большие значения одной переменной соответствуют большим значениям другой, и, наоборот, малые значения одной переменной соответствуют малым значениям другой.

Рис. 2.1. График разброса двух переменных
Однако зависимость, представленная на графике, не идеальна. Можно предположить, что если нанести ещё несколько точек, то получится больший разброс. И наоборот, дополнительные точки па графике могут указывать на большую зависимость. Таким образом, график разброса не даёт чёткого ответа на вопрос, есть ли зависимость между переменными. Более объективный подход в определении зависимости между переменными заключается в проведении корреляционного анализа — в частности, в вычислении коэффициента корреляции между переменными.
Корреляционный анализ применяют, когда данные наблюдений или эксперимента можно считать случайными и выбранными из генеральной совокупности, распределённой по многомерному нормальному закону.