Man unterscheidet drei Arten des Machine Learnings:
- Überwachtes Lernen
- Unüberwachtes Lernen
- Verstärkendes Lernen
Was ist überwachtes Lernen?
Überwachtes Lernen ist die einfachste Form des Machine Learnings. Man will ein Modell entwickeln, welches bei einer neuen Eingabe eine Vorhersage treffen kann, um was für ein Objekt es sich handelt.
Dazu hat man eine Hand voll Trainingsdaten. Trainingsdaten heisst dabei, dass man die Eingabedaten hat sowie auch bereits das Resultat, welches dabei herauskommt. Hab man also Eingabedaten von Tieren wie „Hat vier Beine“ oder „Hat Rüssel“ dann steht bereits in einer Spalte, dass es sich bei einem Tier um einen Elefanten handelt und bei einem anderen Tier um einen Affen. Diese Information ist notwendig, damit das Modell lernen kann. Wichtig also: Das Resultat ist bei dieser Methode bereits bekannt, damit das Modell lernen kann.
Diese Vorhersage des Resultates nennt man Klassifizierung, also eine Einteilung der Daten in verschiedene Klassen. Dabei gibt es eine binäre Klassifizierung, bei dem es als Resultat ein Plus oder Minus gibt (oder schwarz/weiss oder wie auch immer). Dann gibt es eine sogenannte Mehrfachklassifizierung, etwa wenn das richtige Tier herauskommen soll.
Ein zweiter Typ der überwachten Lernens ist die sogenannte Regressionsanalyse. Hat man einen Eingabe Wert x und einen davon abhängigen Wert y kann man aus der Beziehung Trainingsdaten für ein Modell ableiten. Dabei wird aus der unabhängigen Variable x und der abhängigen Variable y eine Gerade so an die Daten angepasst, dass der Abstand der Punkte zu der Geraden minimal ist.
Lineare Regression einfach erklärt
Man hat eine paar Punkte mit x und y Korrdinaten und bildet nun eine Gerade so, dass sie möglichst durch alle Punkte geht. Da dies normalerweise mit einer Geraden nicht geht, weil die Punkte sehr unterschiedlich liegen, macht man einfach eine Gerade, die möglichst nahe an den Punkten liegen. Lineare Regression kennt man übrigens auch in anderen Gebieten, wie etwa der Numerik oder der Statistik.
Was ist unüberwachtes Lernen?
Diese Methode ist wohl die schwierigste. Hier hat man es mit Daten zu tun, deren Struktur unbekannt ist. Das Ziel des unüberwachten Lernens ist es, diese Struktur zu ergründen und sinnvolle Informationen aus den Daten zu ziehen.
Die erste Variante ist das sogenannte Clustering. Dabei wird versucht, die vorhandenen Daten in sinnvolle Gruppen oder Cluster einzuteilen. Ein Cluster beinhaltet also immer Daten, die in irgendeiner Form gleich sind und sich von anderen Daten unterscheiden. Clustering wird auch als unüberwachte Klassifizierung bezeichnet.
Die zweite Variante heisst Datenkomprimierung durch Dimensionsreduktion. Eine Dimension beim Machine Learning ist einfach ein Merkmal, also etwa „Hat vier Beine“ oder „Hat Rüssel„. Je mehr Merkmale ein Objekt hat, desto schwieriger wird natürlich der Umgang mit diesem Objekt. Darum wird vor der Analyse der Daten oftmals zuerst eine unüberwachte Dimensionsreduktion vorgenommen. Dabei will man die Daten von sogenanntem Rauschen befreien, um sich quasi auf die relevanten Informationen zu fokussieren. Natürlich muss man dabei aufpassen, dass man nicht fälschlicherweise die relevanten Informationen rausfiltert.
Was ist verstärkendes Lernen?
Verstärktes Lernen ist genau das, was Super Mario im Video macht, das ich in meinem Artikel Was sind Machine Learning und Deep Learning? so anpreise. Wie, jetzt nerve ich schon wieder mit diesem Video? Ja!
Bei dieser Variante wird das System (der sogenannte „Agent“) so entwickelt, dass es seine Leistung durch die Interaktion mit seiner Umgebung verbessert. Als Ergebnis gibt es dann jeweils ein Belohnungssignal, wie gut diese Interaktion war. Dieses Signal kommt von einer Belohnungsfunktion.
Im Falle von Super Mario: Mario probiert, möglichst weit im Level zu kommen. Je weiter er kommt, desto grösser ist das Belohnungssignal.
Und ja, ich hätte im echten Leben manchmal auch gerne eine Belohnungsfunktion 🙂
Pingback: ML: Was ist der Perzeptron Lernalgorithmus? – ZKMA