Häufige Fehler vermeiden

Alle Modelle sind falsch, aber manche Modelle sind nützlich.
— George E. P. Box

Das obige Zitat wird auch in diesem xkcd Comic schön veranschaulicht:

image

Ein Supervised Learning Modell versucht, den Zusammenhang zwischen Inputs und Outputs aus den gegebenen Datenpunkten abzuleiten. Was für ein Zusammenhang gelernt wird, wird vor allem durch den gewählten Modelltyp und seinen internen Optimierungsalgorithmus bestimmt. Man kann (und sollte) jedoch einiges tun, um sicherzustellen, dass das Ergebnis nicht offensichtlich falsch ist.

Was wollen wir?

Ein Modell, das …​

  • …​ genaue Vorhersagen trifft

  • …​ für neue Datenpunkte

  • …​ aus den richtigen Gründen

  • …​ auch wenn sich die Welt ständig verändert.

Im Folgenden besprechen wir einige häufige Fallstricke und wie wir sie vermeiden können.