Czym właściwie jest p-value i dlaczego wszyscy o tym mówią?



Jeśli kiedykolwiek zetknąłeś się z wynikami badań naukowych, statystykami medycznymi lub analizą danych w biznesie, jest duża szansa, że pojawił się tam tajemniczy symbol: p-value, czyli wartość p. Choć brzmi skomplikowanie, to jedno z najważniejszych pojęć w statystyce, które pomaga odróżnić przypadek od rzeczywistego zjawiska.

Ale czym dokładnie jest p-value i dlaczego wzbudza tyle emocji? Sprawdźmy to krok po kroku.

 

Co to jest p-value?

Mówiąc najprościej, p-value to liczba, która pomaga ocenić, czy wynik, który obserwujemy, mógłby pojawić się przypadkowo, jeśli w rzeczywistości nie istnieje żadne zjawisko, które badamy.

Formalnie rzecz ujmując, p-value to prawdopodobieństwo uzyskania wyniku równie ekstremalnego (lub bardziej ekstremalnego), jak ten zaobserwowany, zakładając, że hipoteza zerowa jest prawdziwa (Wasserstein & Lazar, 2016).

 

Hipoteza zerowa — brzmi groźnie, ale to nic trudnego

W większości testów statystycznych zaczynamy od tzw. hipotezy zerowej (oznaczanej jako H₀), która zazwyczaj mówi: "Nie ma efektu", "Brak różnicy", "Brak związku".

Przykład:

  • Testujesz nowy lek i Twoja hipoteza zerowa mówi: „Ten lek nie działa lepiej niż placebo”.

Jeśli po analizie danych obliczysz p-value i okaże się ono bardzo małe, oznacza to, że zaobserwowany efekt byłby bardzo mało prawdopodobny, gdyby H₀ była prawdziwa. Wtedy często decydujemy się odrzucić hipotezę zerową i uznać, że coś rzeczywiście się dzieje.

 

Ile to jest "małe" p-value? Czyli granica 0,05

W wielu dziedzinach standardową wartością graniczną jest 0,05, czyli 5%. Co to oznacza?

  • Jeśli p < 0,05, wynik uznaje się za statystycznie istotny — jest mało prawdopodobne, aby pojawił się przypadkiem.
  • Jeśli p ≥ 0,05, nie mamy wystarczających dowodów, by odrzucić hipotezę zerową.

Warto jednak pamiętać, że ta granica jest umowna i nie zawsze odpowiednia (Benjamin et al., 2018).

 

Dlaczego p-value bywa kontrowersyjne?

Choć p-value jest użyteczne, bywa również źródłem nieporozumień:

  • Nie mówi o sile efektu — Możesz mieć statystycznie istotny wynik, ale efekt w rzeczywistości jest minimalny.
  • Nie oznacza prawdopodobieństwa, że hipoteza jest prawdziwa — p-value mówi tylko o zgodności danych z hipotezą zerową, nie o tym, czy coś "na pewno działa".
  • Łatwo nim manipulować — przy dużych próbach nawet minimalne, nieistotne różnice mogą dawać niskie p-value.

W związku z tym wielu ekspertów podkreśla, by p-value interpretować ostrożnie i zawsze patrzeć na pełny kontekst badania.

 

Dlaczego wszyscy o tym mówią?

P-value to narzędzie stosowane na całym świecie w:

  • badaniach klinicznych,
  • psychologii,
  • ekonomii,
  • analizie marketingowej,
  • raportach biznesowych.

Jednak od lat trwa dyskusja w środowisku naukowym, by nie opierać decyzji badawczych wyłącznie na p-value, ale też brać pod uwagę np. wielkość efektu, przedziały ufności czy reprodukowalność wyników (Wasserstein et al., 2019).

 

Podsumowanie

p-value to istotne narzędzie statystyczne, które pozwala oddzielić przypadkowe wyniki od realnych efektów. Choć nie jest doskonałe i bywa nadużywane, jego znajomość to absolutna podstawa dla każdego, kto chce świadomie analizować dane — niezależnie od branży.

Jeśli chcesz lepiej zrozumieć p-value, testy statystyczne i całą tę "magiczno-logiczną" stronę analizy danych, zapraszam Cię na mój kurs podstaw statystyki — bez skomplikowanego żargonu, z przykładami z życia!

 

Źródła: