Ist Künstliche Intelligenz mittlerweile langweilig?

Der Optimist mit seiner Nachhaltigkeit

Ich habe das Ende der ersten Vorlesung in Künstlicher Intelligenz erreicht. Zu Beginn war die Aufgabe, die eigenen Gedanken zu KI in einem Blogeintrag niederzuschreiben (siehe Künstliche Intelligenz wird die Menschheit übernehmen). Nun, 14 Wochen später, soll ich mit meinen neu gewonnenen Erfahrungen erneut die Meinung zu diesem Thema niederschreiben.

Wie ich bereits im ersten Blogeintrag geschrieben hatte, bin ich ein extremer Optimist. Aber dieser Optimismus gilt nur jenen Themen, an die ich persönlich glaube. Themen, die meiner Meinung nach eine Nachhaltigkeit besitzen.

Künstliche Intelligenz > Bitcoin

Momentan gibt es einen grossen Hype zu Bitcoin/Kryptowährungen. Bei diesem Thema bin ich überhaupt nicht optimistisch, eher erinnert mich das aktuelle Treiben an ein Casino, bei dem schlussendlich einige Wenige als Gewinner – und die Meisten in Unterhosen hinauslaufen (Grüsse vom heutigen Kapitalismus). Kann Bitcoin wirklich nachhaltig wertvoll sein, wenn selbst mein Masseur mir dazu rät, unbedingt Bitcoin oder IOTA zu kaufen? 

Genau umgekehrt denke ich über das Thema Künstliche Intelligenz. Wenn ich im Internet dazu lese, habe ich das Gefühl, dass sich sehr viele intelligente Menschen mit dem Thema auseinandersetzen und substantielle Fortschritte erzeugen – Welche aber keinen riesigen Hype auslösen. Ich habe das Gefühl, diese Menschen sind grundsätzlich verschieden zu den Bitcoin Junkies, in dem sie tatsächlich die Welt verbessern wollen.

Bei KI sehe ich Python-Bibliotheken, die man kostenlos verwenden kann. Bei Bitcoin sehe ich einen unglaublichen Energieverbrauch (siehe Bitcoin verbraucht mehr Strom als 159 Länder – wirklich?). Würden Menschen, die sich mit KI beschäftigen, diesen Energieverbrauch billigen?

Künstliche Intelligenz ist Magie

In der Vorlesung haben wir verschiedene Agenten und das Thema Entscheidungsbäume / Decision Trees behandelt. Privat habe ich mich mit neuronalen Netzen beschäftigt. Hinter diesen Themen sehe ich absolut spannendes Material: Der Python Code, den ich noch optimieren kann! Die mathematischen Prinzipien, wie Gewichte aktualisiert werden! Das herrliche Zusammenspiel all dieser Komponenten, die es am Ende ermöglichen, Personen in Bildern zu erkennen oder verschiedene Tierarten zu identifizieren! Absolut spannend! 

Aber ich verstehe auch, warum Bitcoin zu Hype führt und KI eher nicht. Die Resultate in KI sind genial – aber der Weg dorthin bedeutet harte Arbeit. Mathematische und statistische Ansätze sind staubtrocken und man muss sich wirklich hineinknien, um diese Prinzipien zu lernen. Mit Bitcoin kann man reich werden – Und wer will das nicht? Schon immer hat die Geldgier den Menschen beeinflusst.

Ich werde mich auf jeden Fall weiterhin in KI hineinknien, mit dem Wunsch, dies früher oder später hauptberuflich zu tun. Ich werde mich weiterhin mit Gini-Impurity herumschlagen und hoffen, dass meine eigene Verwirrungsmatrix nicht zu gross wird.

Was ist statistische Standardisierung?

17.02.2017

Stellen Sie sich vor, Sie haben eine Menge statistische Daten und stellen diese grafisch dar. Es gibt jeweils beidesmal einen hübschen Hügel, welcher wie die Gauss’sche Glockenkurve aussieht. Sie möchten nun die beiden Hügel miteinander vergleichen – Dies geht aber nicht, den beide Hügel haben eine ganz andere Lage. Der eine ist irgendwo um die 0 und der andere liegt irgendwo bei 200.

Eine Standardisierung der beiden Daten kann Ihnen hierbei behilflich sein.

PS: Die Gauss’sche Glockenkurve heisst übrigens auch Normalverteilung und dieses Verfahren findet man auch unter dem Namen z-Transformation.

Wie sehen die Hügel nach der Standardisierung aus?

Wenn die Daten standardisiert wurden, liegt ihr Erwartungswert bei 0 und die Standardabweichung bei 1.

standardisierung

Quelle dieses genialen Bildes: http://www.statistics4u.info/fundstat_germ/ee_ztransform.html

Dabei gelten folgende Regeln:

  • Geht man vom Erwartungswert nach links und rechts „eine“ Standardabweichung findet man ca. 70% der Werte
  • Geht man vom Erwartungswert nach links und rechts „zwei“ Standardabweichungen findet man ca. 95% der Werte
  • Geht man vom Erwartungswert nach links und rechts „drei“ Standardabweichungen findet man ca. 99% der Werte

Und wie mache ich diese Standardisierung?

Die Formel, um Ihre Daten zu standardisieren, ist ganz simpel:

standardisierung2

In Python kann man dies mit Numpy Methoden folgendermassen erreichen:

X = (X - X.mean()) / X.std()

Mü oder X.mean() steht dabei für den Erwartungswert und sigma oder X.std() für die Standardabweichung.

Was ist der Erwartungswert?

Erwartungswert ist einfach gesagt einfach der Durchschnitt der Werte. Andere Namen dafür sind Mittelwert oder arithmetisches Mittel.

mittelwert

Was ist die Standardabweichung?

Die Standardabweichung ist der Wert, den die meisten Daten im Durchschnitt vom Erwartungswert abweichen. Es ist ein Mass für die Streubreite der Daten.

standardabweichung

Warum funktioniert das?

Nun, die Schritte, die in der Formel gemacht werden, kann man sich so vorstellen.

1. Zuerst rechnet man jeden Wert der Daten minus den Mittelwert. Der Mittelwert selber geht also nach 0, alle kleineren Werte sind dann links und alle grösseren Werte rechts davon. Der Hügel wird also quasi um den Mittelwert nach links verschoben, damit er genau über der 0 steht.

2. Dann steht der Hügel zwar am richtigen Ort, ist aber noch zu breit. Darum quetscht man den Hügel um den Faktor der Standardabweichung. An der Formel sieht man, dass das ganze nur in X-Richtung passiert, der Hügel ist also noch gleich gross wie vorher.