Czym właściwie jest p-value i dlaczego wszyscy o tym mówią?
Jeśli kiedykolwiek zetknąłeś się z wynikami badań naukowych, statystykami medycznymi lub analizą danych w biznesie, jest duża szansa, że pojawił się tam tajemniczy symbol: p-value, czyli wartość p. Choć brzmi skomplikowanie, to jedno z najważniejszych pojęć w statystyce, które pomaga odróżnić przypadek od rzeczywistego zjawiska.
Ale czym dokładnie jest p-value i dlaczego wzbudza tyle emocji? Sprawdźmy to krok po kroku.
Co to jest p-value?
Mówiąc najprościej, p-value to liczba, która pomaga ocenić, czy wynik, który obserwujemy, mógłby pojawić się przypadkowo, jeśli w rzeczywistości nie istnieje żadne zjawisko, które badamy.
Formalnie rzecz ujmując, p-value to prawdopodobieństwo uzyskania wyniku równie ekstremalnego (lub bardziej ekstremalnego), jak ten zaobserwowany, zakładając, że hipoteza zerowa jest prawdziwa (Wasserstein & Lazar, 2016).
Hipoteza zerowa — brzmi groźnie, ale to nic trudnego
W większości testów statystycznych zaczynamy od tzw. hipotezy zerowej (oznaczanej jako H₀), która zazwyczaj mówi: "Nie ma efektu", "Brak różnicy", "Brak związku".
Przykład:
- Testujesz nowy lek i Twoja hipoteza zerowa mówi: „Ten lek nie działa lepiej niż placebo”.
Jeśli po analizie danych obliczysz p-value i okaże się ono bardzo małe, oznacza to, że zaobserwowany efekt byłby bardzo mało prawdopodobny, gdyby H₀ była prawdziwa. Wtedy często decydujemy się odrzucić hipotezę zerową i uznać, że coś rzeczywiście się dzieje.
Ile to jest "małe" p-value? Czyli granica 0,05
W wielu dziedzinach standardową wartością graniczną jest 0,05, czyli 5%. Co to oznacza?
- Jeśli p < 0,05, wynik uznaje się za statystycznie istotny — jest mało prawdopodobne, aby pojawił się przypadkiem.
- Jeśli p ≥ 0,05, nie mamy wystarczających dowodów, by odrzucić hipotezę zerową.
Warto jednak pamiętać, że ta granica jest umowna i nie zawsze odpowiednia (Benjamin et al., 2018).
Dlaczego p-value bywa kontrowersyjne?
Choć p-value jest użyteczne, bywa również źródłem nieporozumień:
- Nie mówi o sile efektu — Możesz mieć statystycznie istotny wynik, ale efekt w rzeczywistości jest minimalny.
- Nie oznacza prawdopodobieństwa, że hipoteza jest prawdziwa — p-value mówi tylko o zgodności danych z hipotezą zerową, nie o tym, czy coś "na pewno działa".
- Łatwo nim manipulować — przy dużych próbach nawet minimalne, nieistotne różnice mogą dawać niskie p-value.
W związku z tym wielu ekspertów podkreśla, by p-value interpretować ostrożnie i zawsze patrzeć na pełny kontekst badania.
Dlaczego wszyscy o tym mówią?
P-value to narzędzie stosowane na całym świecie w:
- badaniach klinicznych,
- psychologii,
- ekonomii,
- analizie marketingowej,
- raportach biznesowych.
Jednak od lat trwa dyskusja w środowisku naukowym, by nie opierać decyzji badawczych wyłącznie na p-value, ale też brać pod uwagę np. wielkość efektu, przedziały ufności czy reprodukowalność wyników (Wasserstein et al., 2019).
Podsumowanie
p-value to istotne narzędzie statystyczne, które pozwala oddzielić przypadkowe wyniki od realnych efektów. Choć nie jest doskonałe i bywa nadużywane, jego znajomość to absolutna podstawa dla każdego, kto chce świadomie analizować dane — niezależnie od branży.
Jeśli chcesz lepiej zrozumieć p-value, testy statystyczne i całą tę "magiczno-logiczną" stronę analizy danych, zapraszam Cię na mój kurs podstaw statystyki — bez skomplikowanego żargonu, z przykładami z życia!
Źródła:
- Benjamin, D. J., et al. (2018). "Redefine statistical significance." Nature Human Behaviour, 2(1), 6-10. https://doi.org/10.1038/s41562-017-0189-z
- Wasserstein, R. L., & Lazar, N. A. (2016). "The ASA's statement on p-values: context, process, and purpose." The American Statistician, 70(2), 129-133. https://doi.org/10.1080/00031305.2016.1154108
- Wasserstein, R. L., Schirm, A. L., & Lazar, N. A. (2019). "Moving to a World Beyond p < 0.05." The American Statistician, 73(sup1), 1-19. https://doi.org/10.1080/00031305.2019.1583913