Лінійна регресія
Відео: Лекція 14: Лінійна регресія і кореляція
регресійний аналіз може бути зарахований до статистичних методів дослідження залежності між певними змінними (залежними і незалежними). При цьому незалежні змінні мають назву «регресорів», а залежні - «критеріальні». При проведенні лінійного регресійного аналізу уявлення залежною змінною здійснюється у вигляді інтервального шкали. Існує ймовірність наявності нелінійних зв`язків між змінними, що мають відношення до інтервального шкалою, але ця задача вже вирішується методами нелінійної регресії, що не є темою даної статті.
Лінійна регресія досить успішно використовується як при математичних розрахунках, так і в економічних дослідженнях, заснованих на статистичних даних.
Відео: Лінійна регресія таємна зброя програміста і розробника частина 2
Отже, розглянемо таку регресію докладніше. З точки зору математичного методу визначення лінійної залежності між деякими змінними лінійна регресія може бути представлена у вигляді такої формули: y = a + bx. Розшифровку даної формули можна знайти в будь-якому підручнику з економетрики.
При розширенні кількості спостережень (до n-го кількості разів) виходить проста лінійна регресія, представлена у вигляді формули:
Відео: Парна регресія: лінійна залежність
yi = A + bxi + ei,
де ei - незалежні, розподілені однаково, випадкові величини.
У даній статті хотілося б більше уваги приділити даному поняттю з позиції здійснення прогнозування цін на майбутнє на підставі попередніх даних. В цій області обчислень лінійна регресія активно використовує метод найменших квадратів, який допомагає збудувати «найбільш підходящу» пряму лінію через певний ряд точок цінових значень. В якості вхідних даних використовуються цінові точки, які означають максимум, мінімум, закриття або відкриття, а також середні показники від цих значень (наприклад, сума максимуму і мінімуму, розділена на два). Також ці дані перед побудовою відповідної лінії можуть бути довільно згладжені.
Як вже зазначалося вище, лінійна регресія досить часто використовується в аналітиці для визначення тренда на підставі даних про ціну і час. В цьому випадку індикатор нахилу регресії дозволить визначити величину змін цін за одиницю часу. Одним з умов прийняття правильного рішення при використанні даного індикатора є застосування в вигляді генератора сигналів, що настають за трендом нахилу регресії. При позитивному нахилі (зростаючої лінійної регресії) покупка здійснюється, якщо значення індикатора більше за нуль. Під час негативного нахилу (спадної регресії) продаж має здійснюватися при негативних значеннях індикатора (менше нуля).
Який використовується для визначення кращої лінії, що відповідає певному ряду цінових точок, метод найменших квадратів передбачає виконання наступного алгоритму:
- знаходиться сумарне вираз квадратів різниці ціни і лінії регресії;
Відео: Лекція 5: Лінійна регресія і метод найменших квадратів
- знаходиться відношення отриманої суми і числа барів в діапазоні регресійного ряду даних;
- від отриманого результату обчислюється квадратний корінь, який і відповідає стандартному відхиленню.
Рівняння парної лінійної регресії має таку модель:
y (x) = f ^ (x),
де у - результативний ознака, представлений залежною змінною;
х - пояснює або незалежна змінна;
^ Показує відсутність суворої функціональній залежності між змінними х і у. Тому в кожному окремому разі змінна в може складатися з таких складових:
y = yx + &epsilon-,
де у - фактичні дані результату;
ух - теоретичні дані результату, визначені за допомогою рішення рівняння регресії;
&epsilon- - випадкова величина, яка характеризує відхилення між фактичним значенням і теоретичним.