Benutzer-Werkzeuge

Webseiten-Werkzeuge


bigdata:machinelearning

Dies ist eine alte Version des Dokuments!


Maschinelles Lernen

Maschinelles Lernen (auch Machine Learning) bezeichnet Methoden und Algorithmen, um Programmen beizubringen, anhand von Eingabedaten Muster interpretieren, erkennen und Vorhersagen treffen zu können. Dabei soll sich die Leistung des System mit gewonnener Erfahrung verbessern (vgl. Mitchell 1997: S. 2). Ein Programm wird nicht für die Lösung eines Problems programmiert, sondern soll selbstständig lernen, es anhand Daten zu lösen, die ihm vorliegen.

Beispiele dafür sind die Spracherkennung, Übersetzungsprogramme, Handschrifterkennung oder das auch Personalisieren von Werbung.

Dabei ist auch die Masse der verfügbaren Daten wichtig. Das bedeutet, dass nicht nur der Algorithmus ausschlaggebend ist, sondern auch die Masse an Daten, die zur Analyse zur Verfügung stehen. So können etwa die Sprachassistenten auf Smartphones auf eine breite Masse an Sprachbeispielen von Menschen unterschiedlichster Herkunft mit unterschiedlichsten Dialekten zum Lernen zugreifen.

Lernmethoden

  • Überwachtes Lernen (supervised learning): Beim überwachten Lernen bekommt ein Algorithmus viele verschiedene Daten vorgeführt, zu denen es auch Informationen erhält. Neben den Inputdaten stehen also bereits die erwarteten Outputdaten zur Verfügung. Dabei gilt es auch zu beachten, dass dafür möglichst viele unterschiedliche Beispiele verwendet werden, damit das Programm nicht gänzlich überfordert ist, wenn es auf eine Situation stößt, die es zuvor so noch nicht gelernt hat (vgl. Mitchell 1997: S. 6). Ziel ist es letztlich, den Algorithmus auf diese Weise Muster erkennen zu lassen, damit später auch Daten ohne Lösung richtig interpretiert werden können.
  • Unüberwachtes Lernen (unsupervised learning): Beim unüberwachten Lernen soll der Algorithmus eigenständig nach Mustern in Daten suchen. Weder Infos zu den Inputdaten, noch erwartete Outputdaten sind bekannt. Dabei können Verfahren wie das Clustering zum Einsatz kommen, um so Muster oder Eigenschaften erkennen zu können nach denen die Daten gruppiert werden können. (Barnes 2015: S. 33)
  • Bestärkendes Lernen (reinforcement learning): Bestärkendes Lernen beschreibt eine ähnliche Lernmethode, wie sie auch von Burrhus Skinner propagiert wurde. Durch Belohnung und Bestrafung soll der Lernprozess positiv beeinflusst werden. So kann beim unüberwachten Lernen dem Algorithmus ein positives Feedback gegeben werden, wenn das erzeugte Vorhersagemodell oder einzelne Aktionen korrekt waren (vgl. Barnes 2015: S. 34).

Techniken

Es gibt eine Vielzahl an Techniken, die beim Machine Learning eingesetzt werden, darunter:

  • Empfehlung (Recommendation): „Kunden die dieses Produkt kauften, kauften auch…“ ist ein wohl bekanntes Beispiel für Empfehlungen in Onlineshops. Anhand von vergangenen Bestellungen anderer Kunden, die ein Produkt enthielt, kann ermittelt werden, welche anderen Produkte typischerweise zusammen damit gekauft wurden, um so nützliche Vorschläge bereitstellen zu können. So werden Informationen von einer einzelnen Person mit Informationen der Masse kombiniert, um sinnvolle Empfehlungen auszuarbeiten. Ebenso könnte die Kategorie untersucht werden, in den die Produkte vergangener Einkäufe stehen, um so andere Produkte derselben Kategorie oder mit ähnlichen Eigenschaften finden zu können.
  • Klassifizierung (Classification): Klassifizierungen dienen dem richtigen Einstufen von Daten. Dafür werden bekannte Daten dafür genutzt, neue Daten richtig einzuschätzen (vgl. Costin o. J.). Klassisches Beispiel dafür sind Spam-Filter. Manuelles Markieren von Mails als „Spam“ oder „Kein Spam“ beeinflusst künftige Entscheidung über die Klassifizierung des Mail-Programms.
  • Gruppierung (Clustering): Beim Clustering werden ähnliche Daten werden nach gemeinsamen Charakteristika in Gruppen zusammengefasst. Anders als bei der Klassifizierung werden sie dabei in neue Gruppen geordnet und nicht in bereits bestehende Kategorien zugeordnet (vgl. Barnes 2015: S. 169f).
bigdata/machinelearning.1444070060.txt.gz · Zuletzt geändert: 2015/10/05 20:34 von brueck