Kurs
Du hast also ein Modell durchlaufen lassen und musst es jetzt bewerten. Die richtige Modellmetrik zu finden, kann echt verwirrend sein, weil es Optionen wie MAE, MSE, RMSE und noch mehr gibt.
All diese Kennzahlen messen Fehler, aber sie sagen ein bisschen was anderes darüber aus, wie gut dein Modell funktioniert. In diesem Artikel schauen wir uns eine gängige Methode an, die du als Datenwissenschaftler kennen solltest: den mittleren absoluten Fehler (MAE). Wie du sehen wirst, bietet MAE eine einfache Übersicht über die Vorhersagegenauigkeit, ohne die Dinge zu kompliziert zu machen.
Was ist der mittlere absolute Fehler (MAE)?
Wenn du eine klare Methode brauchst, um die Genauigkeit deiner Vorhersagen zu messen, ist der mittlere absolute Fehler ein guter Ausgangspunkt. Es zeigt dir im Durchschnitt, wie weit die Vorhersagen deines Modells von den tatsächlichen Werten abweichen, ohne dass du dir Gedanken darüber machen musst, ob diese Vorhersagen zu hoch oder zu niedrig waren.

In dieser Gleichung istn die Gesamtzahl der Vorhersagen. Der absolute Wert, den du an den vertikalen Balken sehen kannst, sorgt dafür, dass alle Fehler als positiv behandelt werden, sodass sowohl Über- als auch Unterprognosen gleich gewichtet werden. Es ist eine einfache und direkte Messung des durchschnittlichen Vorhersagefehlers deines Modells, weshalb es so oft verwendet wird.
Warum solltest du dich für MAE interessieren?
Ich hab das alles schon mal angesprochen: MAE ist vor allem deshalb nützlich, weil es leicht zu verstehen ist. Wenn dein MAE 5 ist, heißt das, dass die Vorhersagen deines Modells im Durchschnitt um 5 Einheiten daneben liegen.
Um das zu verstehen, musst du dir den mittleren quadratischen Fehler (MSE) vorstellen, der große Fehler stärker gewichtet, indem er sie quadriert. Mit MSE kannst du Ausreißer vermeiden, die deine Bewertung zu sehr verzerren.
Wie berechnet man den MAE? (Mit Python-Beispiel)
Schauen wir uns ein kurzes Beispiel mit Python an. Angenommen, du hast ein Modell erstellt, um die monatlichen Umsätze vorherzusagen, und jetzt willst du überprüfen, wie genau es war. So berechnest du den MAE:
import numpy as np
actual = np.array([100, 150, 200, 250])
predicted = np.array([110, 140, 210, 240])
mae = np.mean(np.abs(actual - predicted))
print("MAE:", mae)
MAE: 10.0
Dieser Code findet die absolute Differenz zwischen jedem tatsächlichen und vorhergesagten Wert und berechnet dann den Durchschnitt. Das Ergebnis (hier 10,0) ist die typische Größe des Vorhersagefehlers.
Wo wird MAE verwendet?
Einzelhändler nutzen MAE oft, um zu checken, wie gut ihre Prognosen mit den tatsächlichen Verkäufen übereinstimmen. Das ist echt ein häufiger Fall. Ein hoher MAE könnte bedeuten, dass das Modell neu trainiert oder angepasst werden muss. Ich könnte mir auch vorstellen, dass MAE im Gesundheitswesen messen kann, wie nah die vorhergesagten Genesungszeiten an den tatsächlichen Ergebnissen liegen. Ein niedrigerer MAE gibt mehr Sicherheit, dass das Modell brauchbare Schätzungen liefert.
Das sind nur ein paar Beispiele, aber MAE kann in jeder Situation verwendet werden, in der du vorhergesagte und tatsächliche Zahlenwerte vergleichst. Die Möglichkeiten sind einfach zu viele, um sie alle aufzuzählen!
Wie schneidet MAE im Vergleich zu anderen Kennzahlen ab?
MAE ist nicht die einzige Möglichkeit, Vorhersagefehler zu bewerten. Je nachdem, welche Fehler dir am wichtigsten sind, könnten andere Kennzahlen besser passen.
MAE vs. MSE
MSE guckt sich auch den Unterschied zwischen den vorhergesagten und den tatsächlichen Werten an, aber bevor der Durchschnitt berechnet wird, wird jeder Fehler hochgezählt. Dadurch ist es empfindlicher gegenüber großen Fehlern. Wenn große Fehler in deinem Fall wichtiger sind, könnte MSE besser passen.
MAE vs. RMSE
RMSE ist die Quadratwurzel von MSE. Der Fehler wird wieder in die ursprünglichen Einheiten umgewandelt, was die Interpretation im Vergleich zu MSE vereinfacht. Aber genau wie MSE gibt es größeren Fehlern mehr Gewicht.
Wenn du alle Fehler gleich behandeln und die Dinge einfach halten willst, ist MAE eine gute Wahl. Wenn du aber eher die Auswirkungen großer Fehler im Blick hast, sind MSE oder RMSE vielleicht besser.
Fazit
MAE ist eine einfache und praktische Methode, um zu messen, wie weit deine Vorhersagen von den tatsächlichen Werten entfernt sind. Es ist einfach zu berechnen, leicht zu erklären und in vielen Bereichen nützlich.
Es zeigt zwar keine großen Fehler so deutlich wie MSE oder RMSE, gibt aber einen guten Überblick über die Gesamtgenauigkeit. Benutz das, wenn du eine direkte Messung willst, die nicht zu sehr von ein paar großen Fehlern beeinflusst wird.
Nach all dem solltest du MAE zusammen mit anderen Kennzahlen nutzen, vor allem wenn du Modelle vergleichst oder die Leistung optimierst. Mit der Zeit wirst du ein Gefühl dafür bekommen, wann die MAE ausreicht und wann die Kennzahl „ “ mehr Aufschluss gibt. Mach unseren Kurs „Understanding Data Science“ und „Introduction to Regression with statsmodels in Python“, um deine Fähigkeiten und dein Gespür zu verbessern.

