Теорія, що стоїть за p -значеннями та нульовою гіпотезою, може здатися спочатку складною, але розуміння понять допоможе вам орієнтуватися у світі статистики. На жаль, ці терміни часто вживаються в науково-популярній науці, тому було б корисно всім зрозуміти основи.
Також дивіться нашу статтю Як видалити всі інші рядки в Excel
Обчислення р- значення моделі та доведення / спростування нульової гіпотези напрочуд просто для MS Excel. Є два способи зробити це, і ми охопимо їх обидва. Давайте копаємось.
Нульова гіпотеза і р -значення
Нульова гіпотеза - це твердження, яке також називається позицією за замовчуванням, яке стверджує, що зв’язок між спостережуваними явищами не існує. Він також може бути застосований до асоціацій між двома спостережуваними групами. Під час дослідження ви перевіряєте цю гіпотезу і намагаєтесь спростувати її.
Наприклад, скажіть, що ви хочете спостерігати, чи має певна дієта з примхами значні результати. Нульова гіпотеза в цьому випадку полягає в тому, що немає значної різниці у вазі досліджуваних до та після дієти. Альтернативна гіпотеза полягає в тому, що дієта все-таки змінила значення. Це намагаються довести дослідники.
Значення р- значення представляє ймовірність того, що статистичний підсумок буде рівним або більшим за спостережуване значення, коли нульова гіпотеза вірна для певної статистичної моделі. Хоча це часто виражається у вигляді десяткового числа, загалом це краще виразити у відсотках. Наприклад, р -значення 0, 1 повинно бути представлене як 10%.
Низький p -значення означає, що докази проти нульової гіпотези є сильними. Це також означає, що ваші дані є вагомими. З іншого боку, високе значення p означає, що немає сильних доказів проти гіпотези. Щоб довести, що дієта з придумками діє, дослідникам потрібно було б знайти низьку р- значення.
Статистично значущим є результат, який малоймовірний, якщо нульова гіпотеза буде правдивою. Рівень значущості позначається грецькою літерою альфа, і він повинен бути більшим значення р- значення, щоб результат був статистично значущим.
Багато дослідників у широкому діапазоні галузей використовують p -значення для кращого та глибшого розуміння даних, з якими вони працюють. Деякі із визначних галузей включають соціологію, кримінальне правосуддя, психологію, фінанси та економіку.
Пошук p -Value в Excel
Ви можете знайти p -значення набору даних у MS Excel через функцію T-Test або за допомогою інструменту аналізу даних. Спочатку ми розглянемо функцію T-Test. Ми розглянемо п'ятьох студентів коледжу, які пішли на 30-денну дієту. Ми порівняємо їх вагу до і після дієти.
ПРИМІТКА. Для цілей цієї статті ми будемо використовувати MS Excel 2010. Хоча це не остання версія, кроки, як правило, повинні застосовуватися і до нових версій.
Функція T-тесту
Виконайте ці кроки, щоб обчислити значення p- значення за допомогою функції T-Test.
- Створіть та заповніть таблицю. Наша таблиця виглядає так:
- Клацніть будь-яку клітинку поза вашим столом.
- Введіть: = T.Test (.
- Після відкритої дужки введіть перший аргумент. У цьому прикладі це стовпець До дієти. Діапазон повинен бути B2: B6. Поки функція виглядає приблизно так: T.Test (B2: B6.
- Далі введемо другий аргумент. Стовпчик "Дієта" та його результати - наш другий аргумент, і потрібний нам діапазон - C2: C6. Додамо його до формули: T.Test (B2: B6, C2: C6.
- Введіть кому після другого аргументу, а параметри розповсюдження з однохвостим та двохвостим автоматично з’являться у спадному меню. Виберемо перший - однохвостий розподіл. Двічі клацніть на ньому.
- Введіть іншу кому.
- Двічі клацніть на опції Парі в наступному спадному меню.
- Тепер, коли у вас є всі необхідні елементи, закрийте кронштейн. Формула цього прикладу виглядає приблизно так: = T.Test (B2: B6, C2: C6, 1, 1)
- Натисніть Enter. У комірці негайно відобразиться p -значення. У нашому випадку значення становить 0, 133906 або 13, 3906%.
Будучи вище 5%, ця p -значення не дає вагомих доказів проти нульової гіпотези. У нашому прикладі дослідження не довело, що дієта допомогла випробуваним втратити значну кількість ваги. Це не обов'язково означає, що нульова гіпотеза є правильною, лише що вона ще не була спростована.
Маршрут аналізу даних
Інструмент аналізу даних дозволяє робити багато цікавих речей, включаючи розрахунки p- значення. Щоб спростити справи, ми будемо використовувати ту саму таблицю, що і в попередньому методі.
Ось як це робиться.
- Оскільки у нас вже є різниці у вазі в колонці D, ми пропустимо розрахунок різниці. Для майбутніх таблиць використовуйте формулу: = "Стільниця 1" - "Клітина 2".
- Далі натисніть на вкладку Дані в головному меню.
- Виберіть інструмент аналізу даних.
- Прокрутіть список вниз і натисніть опцію t-Test: Paired Two Sample for Means.
- Натисніть кнопку ОК.
- З'явиться спливаюче вікно. Це виглядає приблизно так:
- Введіть перший діапазон / аргумент. У нашому прикладі це B2: B6.
- Введіть другий діапазон / аргумент. У цьому випадку це C2: C6.
- Залиште значення за замовчуванням у текстовому полі Альфа (це 0, 05).
- Клацніть перемикач вихідного діапазону і виберіть, де потрібно результат. Якщо це клітинка A8, введіть: $ A $ 8.
- Натисніть кнопку ОК.
- Excel обчислить p -значення та кілька інших параметрів. Фінальний стіл може виглядати так:
Як бачимо, однохвостий p -значення такий же, як у першому випадку - 0, 133905569. Оскільки це вище 0, 05, то для цієї таблиці застосовується нульова гіпотеза, а докази проти неї слабкі.
Що потрібно знати про p -значення
Ось кілька корисних порад щодо p- значень розрахунків у Excel.
- Якщо значення р- значення дорівнює 0, 05 (5%), дані вашої таблиці є значущими. Якщо вона менше 0, 05 (5%), ваші дані є дуже вагомими.
- Якщо значення р- значення перевищує 0, 1 (10%), дані у вашій таблиці незначні. Якщо він знаходиться в діапазоні 0, 05-0, 10, у вас є незначні дані.
- Можна змінити значення альфа, хоча найпоширеніші варіанти - 0, 05 (5%) і 0, 10 (10%).
- Вибір тестування з двома хвостами може бути кращим вибором, залежно від вашої гіпотези. У наведеному вище прикладі тестування з однохвостими засобами означає, що ми досліджували, чи втратили вагу випробувані після дієти, і саме це нам і потрібно було з’ясувати. Але двосхилий тест також вивчить, чи набрали вони статистично значущої кількості ваги.
- Значення p не може ідентифікувати змінні. Іншими словами, якщо вона визначає кореляцію, вона не може визначити причини, що стоять за нею.
P -Value Демістифікований
Кожен статистик, який коштує своєї солі, повинен знати нулі та мінуси перевірки нульової гіпотези та те, що означає значення p . Ці знання також стануть у нагоді дослідникам у багатьох інших сферах.
Чи використовували ви коли-небудь Excel для обчислення р- значення статистичної моделі? Який метод ви використовували? Ви віддаєте перевагу інший спосіб його обчислення? Повідомте нас у коментарі.
