Що таке кореляція і як трактувати значення коефіцієнта
У нашому світі все взаємопов`язано, десь це видно неозброєним оком, а десь люди навіть і не підозрюють про існування такої залежності. Проте в статистиці, коли мають на увазі взаємну залежність, часто вживають термін "кореляція". Його нерідко можна зустріти і в економічній літературі. Давайте спробуємо разом розібратися, в чому полягає суть цього поняття, які бувають коефіцієнти і як трактувати отримані значення.
Відео: STATISTICA Лаб 08 - Коефіцієнти кореляції
поняття
Отже, що таке кореляція? Як правило, під цим терміном мають на увазі статистичну взаємозв`язок двох або кількох параметрів. Якщо змінюється значення одного або декількох з них, це неминуче позначається на величині інших. Для математичного визначення сили такої взаємозалежності прийнято використовувати різні коефіцієнти. Слід зазначити, що в разі, коли зміна одного параметра не приводить до закономірного зміни іншого, але впливає на будь-яку статистичну характеристику даного параметра, такий зв`язок є не кореляційної, а просто статистичної.
Історія терміна
Для того щоб краще розібратися, що таке кореляція, давайте трохи зануримося в історію. Даний термін з`явився в XVIII столітті завдяки старанням французького палеонтолога Жоржа Кюв`є. Цей вчений розробив так званий «закон кореляції» органів і частин живих істот, який дозволяв відновити вигляд стародавнього викопної тварини, маючи в наявності лише деякі його останки. У статистиці це слово увійшло в побут з 1886 року з легкої руки англійського статистика і біолога Френсіса Гальтона. У самій назві терміна вже міститься його розшифровка: не просто і не тільки зв`язок - «relation», а відносини, які мають між собою щось спільне - «co-relation». Втім, чітко пояснити математично, що таке кореляція, зміг тільки учень Гальтона, біолог і математик К. Пірсон (1857 - 1936). Саме він вперше вивів точну формулу для розрахунку відповідних коефіцієнтів.
Відео: 2. Лінійна кореляція в Excel
парна кореляція
Так називають відносини між двома конкретними величинами. Наприклад, доведено, що щорічні витрати на рекламу в Сполучених Штатах дуже тісно пов`язані з величиною внутрішнього валового продукту. Підраховано, що між цими величинами в період з 1956 по 1977 рік коефіцієнт кореляції склав 0,9699. Інший приклад - число відвідувань інтернет-магазину і обсяг його продажів. Тісний зв`язок виявлено між такими величинами, як об`єм продажу пива і температура повітря, середньомісячна температура для конкретного місця в поточному і попередньому році і т. д. Як трактувати коефіцієнт парної кореляції? Відразу відзначимо, що він приймає значення від -1 до 1, причому негативне число позначає зворотну, а позитивне - пряму залежність. Чим більше модуль результату підрахунків, тим сильніше величини впливають один на одного. Нульове значення означає відсутність залежності, величина менше 0,5 говорить про слабку, а в іншому випадку - про яскраво вираженою взаємозв`язку.
Відео: Матриця парних коефіцієнтів кореляції
кореляція Пірсона
Відео: Коефіцієнт кореляції
Залежно від того, за якою шкалою виміряні змінні, для розрахунків застосовують той чи інший показник (коефіцієнт Фехнера, Спірмена, Кендалла і т. Д.). Коли досліджують інтервальні величини, найчастіше використовують індикатор, придуманий Карлом Пірсоном. Цей коефіцієнт показує ступінь лінійних зв`язків між двома параметрами. Коли говорять про корреляционном відношенні, найчастіше його і мають на увазі. Даний показник став настільки популярним, що його формула є в Excel і при бажанні можна самому на практиці розібратися, що таке кореляція, не вдаючись у тонкощі складних формул. Синтаксис цієї функції має вигляд: PEARSON (массив1, массів2). В якості першого і другого масивів зазвичай підставляють відповідні діапазони чисел.