Ти тут

Регресія логістична: модель і методи

Методи логістичної регресії і дискримінантного аналізу використовуються тоді, коли необхідно чітко диференціювати респондентів за цільовими категоріями. При цьому самі групи представлені рівнями одного одноваріантного параметра. Розглянемо далі докладно модель логістичної регресії, а також з`ясуємо, для чого вона потрібна.регресія логістична

Загальні відомості

Прикладом завдання, у вирішенні якої використовується регресія логістична, може виступати класифікація респондентів за групами купують і не купують гірчицю. Диференціація здійснюється відповідно до соціально-демографічними характеристиками. До них, зокрема, відносять вік, стать, кількість родичів, доходи та ін. В операціях присутні критерії диференціації і змінна. Остання кодує цільові категорії, на які, власне, потрібно розділити респондентів.

нюанси

Слід сказати, що спектр випадків, в яких застосовується регресія логістична, значно вужче, ніж для дискримінантного аналізу. У зв`язку з цим використання останнього як універсального способу диференціації вважається кращим. Більш того, експерти рекомендують починати класифікаційні дослідження з дискримінантного аналізу. І тільки в разі невпевненості за результати можна використовувати логістичну регресію. Така необхідність обумовлюється деякими чинниками. регресія логістична використовується при наявності чіткого уявлення про тип незалежних і залежних змінних. Відповідно до цього вибирається одна з 3-х можливих процедур. При дискримінантному аналізі дослідник завжди має справу з однією статичної операцією. У ній бере участь одна залежна і кілька незалежних категоріальних змінних зі шкалою будь-якого типу.

види

Завдання статистичного дослідження, в якому використовується регресія логістична, полягає у визначенні ймовірності того, що певний респондент буде віднесений до тієї чи іншої групи. Диференціація здійснюється за певними параметрами. На практиці, відповідно до значень одного або декількох незалежних факторів, можна класифікувати респондентів за двома групами. У цьому випадку має місце бінарна логістична регресія. Також задані параметри можуть використовуватися при розподілі на групи, яких більше двох. У такій ситуації має місце поліноміальний логістична регресія. Отримані групи виражені рівнями якоїсь однієї змінної. логістична регресія

приклад

Припустимо, є відповіді респондентів на запитання про те, чи цікаво їм пропозицію про придбання земельної ділянки в передмісті Москви. При цьому дані варіанти "немає" і "да". Необхідно з`ясувати, які саме чинники впливають переважний вплив на рішення потенційних покупців. Для цього опитуваним задаються питання про інфраструктуру території, відстані до столиці, площі ділянки, наявності / відсутності житлової споруди тощо. Використовуючи бінарну регресію, можна розподілити респондентів за двома групами. В першу входитимуть ті, хто зацікавлений в придбанні - потенційні покупці, а в другу, відповідно, ті, кого така пропозиція не цікавить. Для кожного респондента, крім того, буде розрахована ймовірність віднесення до тієї чи іншої категорії.

Відео: 007. Лінійні методи класифікації. Логістична регресія. - К. В. Воронцов

Порівняльна характеристика

Відмінність від двох варіантів, зазначених вище, полягає в різній кількості груп і типі залежних і незалежних змінних. У бінарної регресії, наприклад, вивчається залежність дихотомічного фактора від одного або декількох незалежних умов. При цьому останні можуть мати будь-який тип шкали. Мультіномінальная регресія вважається різновидом цього варіанту класифікації. У ній до залежної змінної ставиться більше 2-х груп. Незалежні фактори повинні мати або порядкову, або номінальну шкалу.

Відео: Практика побудови моделі логістичної регресії

Логістична регресія в spss

У статистичному пакеті 11-12 був введений новий варіант аналізу - порядковий. Цей метод використовується в разі, коли залежний фактор відноситься до однойменної (порядкової) шкалою. При цьому незалежні змінні вибираються одного певного типу. Вони повинні бути або порядковими, або номінальними. Класифікація по декількох категоріях вважається найбільш універсальною. Цей спосіб може використовуватися у всіх дослідженнях, в яких застосовується логістична регресія. Підвищити якість моделі, проте, можна тільки за допомогою всіх трьох прийомів. перевірка якості адекватного логістичної регресії

порядкова класифікація



Варто сказати, що раніше в статистичному пакеті не була передбачена типова можливість виконання спеціалізованого аналізу для залежних факторів з порядкової шкалою. Для всіх змінних з кількістю груп більше 2-х використовувався мультіномінальний варіант. Введений відносно недавно порядковий аналіз має низку особливостей. Вони враховують саме специфіку шкали. Тим часом в методичних посібниках порядкова логістична регресія часто не розглядається як окремий прийом. Обумовлено це наступним: порядковий аналіз не володіє будь-якими значними перевагами перед мультіномінальним. Дослідник цілком може використовувати останній при наявності і порядкової, і номінальною залежною змінною. При цьому самі процеси класифікації майже не відрізняються один від одного. Це означає, що проведення порядкового аналізу не викличе якихось труднощів.

варіант аналізу

Розглянемо простий випадок - бінарну регресію. Припустимо, в процесі маркетингового дослідження оцінюється затребуваність випускників певного столичного вузу. В анкеті респондентам запропоновані питання, в числі яких:

  1. Чи є ви працюючим? (Ql).
  2. Вкажіть рік закінчення вузу (q 21).
  3. Який середній випускний бал (aver).
  4. Пол (q22).

Логістична регресія дозволить оцінити вплив незалежних факторів aver, q 21 і q 22 на змінну ql. Простіше кажучи, метою аналізу буде визначення ймовірного працевлаштування випускників на підставі відомостей про поле, рік закінчення і середнього бала. індикатор логістичної сигмовидної регресії

Logistic Regression

Щоб визначити установки за допомогою бінарної регресії, слід скористатися меню Analyze Regression Binary Logistic. У вікні Logistic Regression потрібно вибрати в лівому списку доступних змінних залежний фактор. Їм є ql. Цю змінну потрібно помістити в поле Dependent. Після цього на ділянку Covariates необхідно ввести незалежні фактори - q 21, q 22, aver. Потім потрібно вибрати спосіб їх включення в аналіз. Якщо кількість незалежних факторів більше 2-х, використовується не метод одночасного введення всіх змінних, який встановлений за замовчуванням, а покроковий. Найпопулярнішим способом вважається Backward: LR. Використовуючи кнопку Select, можна включити в дослідження не всіх респондентів, а тільки конкретну цільову категорію.

Define Categorical Variables



Кнопку Categorical потрібно використовувати в тому випадку, коли однією з незалежних змінних є номінальна з кількістю категорій більше 2-х. У цій ситуації у вікні Define Categorical Variables на ділянку Categorical Covariates поміщається саме такий параметр. У розглянутому прикладі така змінна відсутня. Після цього в списку, що розкривається Contrast слід вибрати пункт Deviation і натиснути кнопку Change. В результаті з кожного номінального фактора буде сформовано кілька залежних змінних. Їх кількість відповідає числу категорій вихідного умови.

Save New Variables

За допомогою кнопки Save в основному діалоговому вікні дослідження задається створення нових параметрів. Вони міститимуть показники, розраховані в процесі регресії. Зокрема, можна створити змінні, якими визначаються:

  1. Належність до конкретної категорії класифікації (Groupmem­-bership).
  2. Імовірність віднесення респондента в кожну досліджувану групу (Probabilities).

При використанні кнопки Options дослідник не отримує будь-яких істотних можливостей. Відповідно, її можна ігнорувати. Після натискання кнопки "Ок" в основному вікні будуть виведені результати аналізу. коефіцієнт логістичної регресії

Перевірка якості адекватного логістичної регресії

Розглянемо таблицю Omnibus Testsof Model Coefficients. У ній відображаються результати аналізу якості наближення моделі. У зв`язку з тим, що був заданий покроковий варіант, потрібно дивитися підсумки останнього етапу (Step2). Позитивним буде вважатися такий результат, при якому виявляється збільшення показника Chi-square при переході на наступну стадію при високому ступені значимості (Sig. lt; 0,05). Якість моделі оцінюється в рядку Model. Якщо отримана негативна величина, але вона не розглядається як значуща при загальній високій суттєвості моделі, останню можна визнати практично придатною.

таблиці

Model Summary дає можливість оцінити показник сукупної дисперсії, яку описує побудована модель (показник R Square). Рекомендується застосовувати величину Nagelker. Позитивним показником можна вважати параметр Nagelkerke R Square, якщо він вище 0.50. Після цього оцінюються результати класифікації, в якій дійсні показники приналежності до тієї чи іншої досліджуваної категорії порівнюються з передбаченими на основі регресійної моделі. Для цього використовується таблиця Classification Table. Вона також дозволяє зробити висновки про коректність диференціації для кожної даної групи. модель логістичної регресії Наступна таблиця дає можливість з`ясувати статистичну значущість незалежних факторів, введених в аналіз, а також кожен нестандартизоване коефіцієнт логістичної регресії. На підставі цих показників можна спрогнозувати приналежність кожного респондента у вибірці до конкретної групи. За допомогою кнопки Save можна ввести нові змінні. У них будуть міститися відомості про належність до конкретної класифікаційної категорії (Pre­-dictedcategory) і ймовірність включення в ці групи (Predicted probabilities membership). після натискання "Ок" в основному вікні Multinomial Logistic Regression з`являться підсумки розрахунків.

Перша таблиця, в якій присутні важливі для дослідника показники, - Model Fitting Information. Високий рівень статистичної значущості буде вказувати на високу якість і придатність використання моделі при вирішенні практичних завдань. Ще однією значущою таблицею є Pseudo R-Square. Вона дозволяє оцінити частку загальної дисперсії в залежному факторі, яка обумовлюється незалежними змінними, обраними для аналізу. По таблиці Likelihood Ratio Tests можна зробити висновки про статистичної значущості останніх. У Parameter Estimates відображаються нестандартизо коефіцієнти. Вони використовуються при побудові рівняння. Крім цього, для кожного поєднання змінних визначена статистична значимість їх впливу на залежний фактор. Тим часом в маркетингових дослідженнях часто виникає необхідність диференціювати за категоріями респондентів не окремо, а в складі цільової групи. Для цього використовується таблиця Observedand Predicted Frequencies.

Практичне застосування

Розглянутий спосіб аналізу широко використовується в роботі трейдерів. У 1991 році було розроблено індикатор логістичної сигмовидної регресії. Він являє собою простий в експлуатації і ефективний інструмент, за допомогою якого можна спрогнозувати ймовірні ціни до їх "перегріву". Індикатор представлений на графіку у вигляді каналу, утвореного двома лініями, що проходять паралельно. Вони віддалені на рівну відстань від тренда. Ширина коридору буде залежати виключно від таймфрейма. Індикатор використовується при роботі майже з усіма активами - від валютних пар до дорогоцінних металів.

логістична регресія в spss

На практиці вироблено 2 ключові стратегії застосування інструменту: на пробій і на розворот. В останньому випадку трейдер буде орієнтуватися на динаміку цінового зміни в межах каналу. У міру наближення вартості до лінії підтримки або опору ставка робиться на ймовірність того, що рух почнеться в зворотному напрямку. Якщо ціна впритул підійде до верхньої межі, то від активу можна позбутися. Якщо ж вона знаходиться у нижньої межі, то варто задуматися про придбання. Стратегія на пробій передбачає застосування ордерів. Вони встановлюються за межами меж на відносно невеликій відстані. Беручи до уваги, що ціна в ряді випадків порушує їх на нетривалий час, слід перестрахуватися і встановити стоп-лосс. При цьому, зрозуміло, незалежно від обраної стратегії трейдеру необхідно максимально холоднокровно сприймати і оцінювати ситуацію, що виникла на ринку.

висновок

Таким чином, застосування логістичної регресії дозволяє швидко і просто класифікувати респондентів на категорії відповідно до заданих параметрів. При аналізі можна використовувати будь-який певний спосіб. Зокрема, універсальністю відрізняється мультіномінальная регресія. Однак фахівці рекомендують застосовувати всі описані вище способи в комплексі. Це обумовлюється тим, що в такому випадку якість моделі буде істотно вище. Це, в свою чергу, розширить спектр її застосування.

Поділися в соц мережах:

Увага, тільки СЬОГОДНІ!

Схожі повідомлення


Увага, тільки СЬОГОДНІ!