Een p-waarde, die staat voor kans, is een statistische maat tussen 0 en 1. Het wordt gebruikt voor het testen van hypothesen. In klinische onderzoeken wordt de p-waarde gebruikt om aan te duiden of een waargenomen resultaat het gevolg kan zijn van toeval of niet.
Het significantieniveau moet worden vastgesteld voordat het verzamelen van gegevens begint, en wordt meestal vastgesteld op 5% (of 0,05), hoewel afhankelijk van de studie ook andere niveaus kunnen worden gebruikt.
Een resultaat wordt aangemerkt als statistisch significant (en stelt ons in staat om de nulhypothese te verwerpen) als de p-waarde gelijk aan of lager dan het significantieniveau is. Dit wordt doorgaans opgeschreven als p ≤ 0,05.
Bij het berekenen van de p-waarde gaan we er meestal vanuit dat er feitelijk geen reëel verschil is tussen de twee geteste behandelingen, bijv. een nieuwe versus een standaardbehandeling (de nulhypothese). We berekenen dan de waarschijnlijkheid (kans) dat het waargenomen verschil uitsluitend het gevolg is van toeval als onze veronderstelling klopt (dat wil zeggen als er geen reëel verschil is). Dit is de p-waarde.
Dus de p-waarde is de kans om effecten waar te nemen die net zo groot zijn als de effecten die in het onderzoek zijn gezien als er feitelijk geen reëel verschil is tussen de behandelingen. Als p klein is, zullen de bevindingen waarschijnlijk niet zijn ontstaan door toeval en verwerpen we het idee dat er geen verschil is tussen de twee behandelingen (we verwerpen de nulhypothese). Als p groot is, kan het waargenomen verschil heel goed een toevallige bevinding zijn en verwerpen we het idee dat er geen verschil is tussen de twee behandelingen niet.
De p-waarde of overschrijdingskans (van een gegeven steekproefuitkomst) is de kans dat in de verdeling gegeven door de nulhypothese de in de steekproef waargenomen waarde van de toetsingsgrootheid wordt behaald of overschreden (links, rechts dan wel tweezijdig). De p-waarde is dus gebaseerd op de specifieke steekproefuitkomst.
De p-waarde geeft aan hoe extreem de gevonden waarde voor de toetsingsgrootheid in de verdeling onder de nulhypothese is. Hoe kleiner de p-waarde, hoe extremer de uitkomst. In de praktijk worden waarden van 5% en 1% aangehouden als grens; is de p-waarde kleiner, dan spreekt men van een significante, resp. sterk significante uitkomst.
De p-waarde vat als het ware de bewijskracht van de steekproefuitkomst in gestandaardiseerde vorm samen. Als de toetsingsgrootheid is en de steekproef daarvoor de waarde oplevert, is:
- de linker overschrijdingskans:
- de rechter overschrijdingskans:
- en de tweezijdige overschrijdingskans:
De p-waarde is alleen geschikt om een nulhypothese te toetsen tegen een alternatieve hypothese en doet geen uitspraak over de waarschijnlijkheid van de nulhypothese of alternatieve hypothese.
Statistische toetsen die gebruikmaken van p-waarden, komt men veel tegen in met name sociale wetenschappen, medische wetenschappen en economie.