Wanneer een patiënte door een arts wordt onderzocht, is het wenselijk dat de bevindingen (diagnose, Symptomen) niet anders uitvallen dan wanneer zij door een andere arts wordt onderzocht. Het boezemt geen vertrouwen in als artsen onderling ernstig van mening verschillen. Ze kunnen dan immers niet allemaal gelijk hebben. In experimenteel onderzoek kunnen verschillen tussen therapieën onduidelijk blijven door een onbetrouwbare beoordeling van het bereikte effect, maar ook door een onbetrouwbare beoordeling van toelatingscriteria en belangrijke prognostische factoren. In niet-experimenteel onderzoek moet rekening worden gehouden met de belangrijkste prognostische factoren, maar de daarvoor beschikbare statistische technieken werken alleen goed als deze prognostische factoren (vrijwel) foutloos kunnen worden vastgesteld. De waarde van beoordelingen, zowel voor de dagelijkse medische praktijk als voor wetenschappelijk onderzoek, kan aanzienlijk toenemen wanneer de onderlinge overeenstemming tussen beoordelaars merkbaar wordt verbeterd, ofschoon zelfs volledige overeenstemming tussen beoordelaars niet garandeert dat de betreffende beoordelingen enige waarde hebben.