Vollständigkeit bzw. Recall und Genauigkeit bzw. Precision sind zwei Maße zur Beschreibung der Güte eines Suchergebnisses beim Information-Retrieval oder bei einer Recherche im Allgemeinen. Der Recall beschreibt die Vollständigkeit eines Suchergebnisses. Er ist definiert als der Anteil der bei einer Suche gefundenen relevanten Dokumente (bzw. Datensätze) an den relevanten Dokumenten der Grundgesamtheit. Die Precision beschreibt die Genauigkeit eines Suchergebnisses. Sie ist definiert als der Anteil der gefundenen relevanten Dokumente zu allen bei der Suche gefundenen Dokumenten.
Für die Evaluierung eines Information-Retrieval-Systems sollten die beiden zusammenhängenden Maße gemeinsam betrachtet werden. Im Allgemeinen sinkt mit steigendem Recall (mehr Treffer) die Precision (mehr irrelevante Ergebnisse) und umgekehrt sinkt mit steigender Precision (weniger irrelevante Ergebnisse) der Recall (mehr relevante Dokumente, die nicht gefunden werden), d.h. es besteht eine negative Korrelation. Stellt man das Verhältnis zwischen Recall und Precision in einem Diagramm dar, so wird der (höchste) Wert im Diagramm, an dem der Precision-Wert gleich dem Recall-Wert ist – also der Schnittpunkt des Precision-Recall-Diagramms mit der Identitätsfunktion – der Precision-Recall-Breakeven-Punkt genannt.
Für die Evaluierung des Information-Retrieval-Systems gibt es mit dem Fall-Out noch ein drittes Kriterium. Das Fall-Out beschreibt in negativer Weise die Güte des zu bewertenden Verfahrens, indem die Anzahl der gefundenen irrelevanten Dokumente durch die Gesamtanzahl irrelevanter Dokumente geteilt wird.
Inhaltsverzeichnis |



Es ist auch möglich, die Maße nicht als Verhältnis, sondern als Wahrscheinlichkeit zu interpretieren.
Im informationstheoretischen Zusammenhang werden diese Eigenschaften auch mit ähnlicher Terminologie dargestellt. Hierfür wird erst die Grundlage der Berechnung dargestellt: true positive, false positive, false negative, true negative. Es wird ein erhaltenes Ergebnis mit dem gewünschten (wahren) Ergebnis verglichen.
| wahres Ergebnis | |||
|---|---|---|---|
| E1 | E2 | ||
| erhaltenes Ergebnis |
E1 | a (true positive) |
b (false positive, Fehler 1. Art) |
| E2 | c (false negative, Fehler 2. Art) |
d (true negative) |
|
Folgendermaßen werden aus diesen Grundlagen dann Precision und Recall berechnet:


In einer Datenbank gibt es zu einer Suchanfrage 78 relevante Dokumente. Eine Suche liefert 32 relevante und 9 nicht relevante Dokumente zurück.
x = 32 (gefundene relevante Dokumente)
y = 9 (gefundene nicht relevante Dokumente)
z = 46 (relevante Dokumente die nicht gefunden wurden)
Recall: 
Precision: 
Die durchgeführte Suche hat eine Vollständigkeit (Recall) von 0,41 und eine Genauigkeit (Precision) von 0,78 erreicht.
Ein Problem bei der Berechnung des Recalls ist die Tatsache, dass man nur selten weiß, wie viele relevante Dokumente nicht gefunden wurden. Bei größeren Datenbanken, bei denen die Berechnung des absoluten Recalls besonders schwierig ist, wird deswegen mit dem relativen Recall gearbeitet. Dabei wird die gleiche Suche mit mehreren Suchmaschinen durchgeführt und die jeweils neuen relevanten Treffer zu den nicht gefundenen relevanten Dokumenten hinzu addiert. Mit der Rückfangmethode kann abgeschätzt werden, wie viele relevante Dokumente insgesamt existieren.