Erfahrungsbericht Fortbildung in Machine Learning (Stanford-Online / Coursera)

Einer der ausgewiesenen Experten rund um die Themen künstliche Intelligenz, Machine Learning und Data Mining ist Andrew Ng, der zum einen als (Associate) Professor an der renommierten Stanford Universität lehrte sowie zum anderen bei vielen namhaften Projekten im Silicon Valley mitgewirkt hat - so zum Beispiel bei Googles legendärem Brain Team.

Vor einigen Jahren hat Andrew Ng die Online-Lernplattform Coursera gegründet, wo es eine Vielzahl von Fortbildungsmöglichkeiten in Informatik-Themen gibt. Ich habe mich für den Kurs Machine Learning entschieden, der von der Standford Universität autorisiert ist und mit einem entsprechenden Zertifikat beim Bestehen "belohnt" wird.

Der Kurs ist in 11 Kapitel (ein Kapitel entspricht dabei einer Woche) aufgeteilt, die überwiegend durch Videos gelehrt werden. Begleitend gibt es die Folien zu den einzelnen Lektionen eines Kapitels jeweils als PDF-Version zum Download. In jedem Kapitel sind Tests zu bestehen (Quiz genannt), und es müssen Programmieraufgaben gelöst und eingeschickt werden.

Als Programmiersprache kommt das freie (= kostenlos verfügbare) GNU Octave zum Einsatz. Dabei handelt es sich um eine Art freie Implementierung von Matlab, d.h. Matlab und GNU Octave sind weitgehend kompatibel. Aber keine Sorge: Kenntnisse in Matlab / Octave werden nicht vorausgesetzt - man lernt die Sprache im Verlauf des Kurses.

Das Einreichen der Lösungen geschieht direkt aus Matlab / Octave heraus. Ein Skript auf dem Server prüft die eingereichte Lösung und bewertet sie. Sollte man zwischendurch Hilfe beim Programmieren, beim Quiz oder allgemein zum Verständnis des Stoffes benötigen, ist man Teil einer Online Community, wo man rasch Hilfe findet. Aber irgendwie hat es mir mehr Spaß gemacht, mich selber durchzubeißen. Erfahrung mit dem Forum habe ich daher keine gesammelt.

Inhaltlich lernt man die mathematischen Hintergründe und die Implementierungen sowie Optimierungsdetails der Algorithmen zu den folgenden Themen

  • Lineare Regression
  • Logistische Regression
  • Neuronale Netze
  • Support Vector Machines
  • k-means Algorithmus
  • Principal Component Analysis (PCA)
  • Anomalie-Erkennung
  • Collaborative Filtering
  • (Massive) Online Learning

Andrew Ng hat eine überaus sympathische Art, diese Themen zu erläutern und man kann seinen (natürlich in englisch gesprochenen) Ausführungen sehr gut folgen. Er schreibt während seiner Videos vieles in die gezeigten Folien von Hand hinein, was beim Ansehen der Videos sehr zum Verständnis beiträgt. Das Endprodukt in der PDF-Datei sieht dann allerdings etwas chaotisch aus und hilft nur dann weiter, wenn man weiß, wie es entstanden ist.

Die Quiz-Aufgaben sind nicht besonders schwer, wenn man sich mit den Inhalten der Lektionen einigermaßen gut befasst hat. Die Programmieraufgaben variieren sehr stark und bewegen sich zwischen "trivial" und "gut machbar". Allerdings sollte man schon über profunde Programmierkenntnisse (egal in welcher Sprache) verfügen - sonst sind sie wohl eher nicht "gut machbar".

Für das Durcharbeiten der 11 Lektionen ist ein Zeitraum von 3 Monaten vorgesehen. Wegen meiner Begeisterung für diese Themen und meiner Neugier möglichst viel davon zu lernen und auszuprobieren, habe ich aber deutlich weniger Zeit dafür benötigt.

Der Kurs ist übrigens kostenlos verfügbar - lediglich die von mir gewählte Variante, die mit dem Stanford Zertifikat endet - kostet einen geringen Betrag.

Fazit: Mir hat der Kurs viel Spaß gemacht. Ich habe sehr viel gelernt - vor allem etwas, das in unserer Zeit sehr gefragtes Wissen ist. Und so ganz nebenbei habe ich die dunklen Winterabende überbrückt und freue mich nun auf den Frühling, um demnächst hier wieder über Natur- und Radtouren zu berichten... :-)

Zertifikat Machine Learning (Stanford University / Coursera)

Disclaimer

Alle Bilder auf meinem Webauftritt sind von mir selber angefertigt und urheberrechtlich geschützt. Gerne bin ich bereit, der Verwendung meiner Bilder in Ihren Projekten zuzustimmen, doch darüber sollten wir uns im Einzelfall zuvor jeweils austauschen. Sofern Sie Interesse an der Verwendung meiner Bilder haben, können Sie gerne Kontakt zu mir aufnehmen.

Datenschutz

Informationen zum Datenschutz habe ich auf einer eigenen Datenschutzseite zusammengefasst.

Kontaktinformationen

Dr. Norbert Heidenbluth
Monheimer Straße 8
D-40789 Monheim am Rhein

Email: info@norbert-heidenbluth.de

Credits

Für meine XXL-Galerien mache ich Verwendung vom Lens-Template von HTML5UP, das unter einer Creative-Commons-Lizenz veröffentlicht ist.