Hypothesetests worden vaak gebruikt voor het leveren van ‘evidence’ met als doel medische onderzoeksresultaten te genereren. Door hypothesen te toetsen, probeert de onderzoeker conclusies te trekken over een gehele populatie op basis van informatie die is verkregen uit een relatief kleine steekproef. Echter, de interpretatie van het testen van hypothesen en de bijbehorende p-waarde biedt vele uitdagingen. In artikelen die in wetenschappelijke tijdschriften worden gepubliceerd staat bijvoorbeeld ‘is statistisch significant’ of ‘een statistisch significante p-waarde van 0,031 werd gevonden’. Helaas vergemakkelijkt deze focus op de p-waarde beslissingen over de relevantie van de verkregen resultaten niet. Want wat zeggen deze uitspraken eigenlijk? Het huidige artikel beschrijft de interpretatie van p-waarden en betrouwbaarheidsintervallen en het klinisch belang van deze maten.