Datenannotation bezeichnet den Prozess, bei dem Rohdaten wie Texte, Bilder, Audio- oder Videoaufnahmen manuell mit Beschriftungen, Kategorien oder Markierungen versehen werden, damit KI-Modelle daraus lernen können. Diese Arbeit ist unverzichtbare Grundlage des überwachten maschinellen Lernens: Ein Modell zur Bilderkennung muss zunächst Tausende von Fotos sehen, auf denen Menschen markiert haben, was zu sehen ist. Datenannotation wird häufig ausgelagert und von schlecht bezahlten Arbeitskräften in Ländern des Globalen Südens erledigt – ein wenig sichtbarer, aber ethisch bedeutsamer Teil der KI-Wertschöpfungskette. Beispiel: Damit eine KI zuverlässig Röntgenbilder auf Tumore untersuchen kann, müssen medizinische Fachkräfte zunächst Tausende von Aufnahmen manuell markieren und beschriften. Dies ist ein zeitaufwendiger Prozess, der die Qualität des späteren Modells entscheidend bestimmt.
« Zurück zum Lexikonindex