Метод головних компонент
Метод головних компонент ґрунтується на спробах пояснити максимальний рівень дисперсії в певному наборі змінних, і зорієнтований на елементи, розташовані в кореляційної матриці по діагоналі. Існує ще один метод, побудований на факторному аналізі, спрямований на здійснення апроксимації кореляційної матриці з використанням певного числа факторів (меншого, ніж заданий кількість змінних), але самими способами апроксимації істотно відрізняється від першого запропонованого методу.
Відео: Ідея і суть методу головних компонент
Отже, метод факторного аналізу дозволяє пояснити кореляцію між самими змінними, і зорієнтований на елементах матриці кореляційного типу, що знаходяться поза її діагоналі.
Виходячи з практичного застосування, спробуємо розібратися в необхідності застосування того чи іншого методу. Факторний аналіз застосовується тоді, коли існує зацікавленість дослідника у вивченні взаємозв`язку між змінними, метод головних компонент же використовується в разі необхідності скорочення розмірності даних і в меншій мірі потрібно інтерпретація їх.
Виходячи з практики, можемо побачити, що методи факторного аналізу використовують досить велика кількість спостережень. При цьому дана кількість на порядок має бути вище, ніж число виявлених чинників.
Метод головних компонент є дуже популярним в маркетингових дослідженнях, так як його можна використовувати при наявності мультиколінеарності вихідних даних. В процесі таких маркетингових досліджень опитувальні листи містять подібні питання, і отримані відповіді на них і будуть відповідати принципам мультіколлінеарності.
Метод головних компонент доцільно розглядати в сукупності показників, які повинні бути для дослідника орієнтиром при попередньому виборі числа компонент або факторів. Найбільш важливими з них є власні числа, що виражають рівень дисперсії змінних, що пояснюється цим чинником. Існує і одне важливе емпіричне правило, яке дуже корисно для оцінки числа факторів (повинно бути стільки факторів, скільки існує власних чисел понад одиниці). Можна це правило пояснити і дещо простіше - власні числа виражають частку нормованих дисперсій змінних, які пояснюються фактором, і в разі перевищення його одиниці вони повинні виражати ці дисперсії, що містяться більш ніж в однієї змінної.
Необхідно ще раз уточнити, що правило «одиничних власних чисел» - емпіричне, і питання про необхідність його застосування може бути вирішене тільки самим дослідником. Наприклад, власне кількість має значення, менше одиниці, але при цьому пояснюється розкид, що розподіляється між змінними. Для фахівця в маркетинговій сфері дуже важливо, щоб при сегментації виявлені чинники мали змістовний сенс. І ті чинники, які містять власні числа понад одиниці, але не мають змістовну інтерпретацію, будуть їм не взяті до уваги. І може виникати ситуація зовсім навпаки.
Ще одне важливе питання, що стосується практичного застосування методів факторного аналізу - питання обертань. Може розглядатися такі варіанти обертань. Найпопулярніший з них - метод варимакс. Він заснований на досягненні максимального рівня дисперсією змінних на кожен окремий фактор. Зазначений метод допомагає знайти обертання, у якого одні змінні приймають високі значення, а інші - досить низькі на кожен окремий фактор.
Відео: Matlab. Апроксимація. Метод головних компонент.
Інший метод обертання - квартімакс, він допомагає знайти певний поворот, в якому фактори на кожну окрему змінну мають одночасно і низькі, і високі навантаження.
Метод обертання еквімакс є деяким компромісом між двома способами, розглянутими вище.
Всі зазначені способи відносяться до ортогональним з взаємно перпендикулярними осями, при їх використанні простежується відсутність кореляції між окремими факторами.