« Back to Glossary Index

Trainingsdaten sind die Datensätze, auf denen KI-Modelle trainiert werden, um Muster zu erkennen und Aufgaben zu erfüllen. Qualität, Umfang und Zusammensetzung der Trainingsdaten entscheiden maßgeblich darüber, wie gut und fair ein Modell funktioniert. Sind die Daten einseitig, veraltet oder fehlerhaft, übernimmt das Modell diese Mängel – mit teils gravierenden Folgen für betroffene Personen. Die Frage, welche Daten verwendet werden dürfen und wem sie gehören, ist ein zentrales rechtliches und ethisches Streitfeld der KI-Entwicklung. Beispiel: Ein Gesichtserkennnungssystem, das überwiegend mit Bildern heller Hautfarben trainiert wurde, erkennt Personen mit dunklerer Hautfarbe deutlich schlechter – ein direkt aus den Trainingsdaten resultierendes Problem.

« Zurück zum Lexikonindex
nach oben