Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- bigdata:machinelearning [2015/10/05 20:33] – [Maschinelles Lernen] brueck
+++ bigdata:machinelearning [2015/10/05 20:34] (aktuell) – [Techniken] brueck
@@ Zeile 9: / Zeile 9: @@
 ===== Lernmethoden =====
-  * **Überwachtes Lernen (supervised learning)**: Beim überwachten Lernen bekommt ein Algorithmus viele verschiedene Daten vorgeführt, zu denen es auch Informationen erhält. Neben den Inputdaten stehen also bereits die erwarteten Outputdaten zur Verfügung. Dabei gilt es auch zu beachten, dass dafür möglichst viele unterschiedliche Beispiele verwendet werden, damit das Programm nicht gänzlich überfordert ist, wenn es auf eine Situation stößt, die es zuvor so noch nicht gelernt hat (vgl. [[bigdata:literatur|Mitchell 1997: S. 6]]). Ziel ist es letztlich, den Algorithmus auf diese Weise Muster erkennen zu lassen, damit später auch Daten ohne Lösung richtig interpretiert werden können.
+  * **Überwachtes Lernen (supervised learning)**: Beim überwachten Lernen bekommt ein Algorithmus viele verschiedene Daten vorgeführt, zu denen es auch Informationen erhält. Neben den Inputdaten stehen also bereits die erwarteten Outputdaten zur Verfügung. Dabei gilt es auch zu beachten, dass dafür möglichst viele unterschiedliche Beispiele verwendet werden, damit das Programm nicht gänzlich überfordert ist, wenn es auf eine Situation stößt, die es zuvor so noch nicht gelernt hat (vgl. [[bigdata:literatur#m|Mitchell 1997: S. 6]]). Ziel ist es letztlich, den Algorithmus auf diese Weise Muster erkennen zu lassen, damit später auch Daten ohne Lösung richtig interpretiert werden können.
-  * **Unüberwachtes Lernen (unsupervised learning)**: Beim unüberwachten Lernen soll der Algorithmus eigenständig nach Mustern in Daten suchen. Weder Infos zu den Inputdaten, noch erwartete Outputdaten sind bekannt. Dabei können Verfahren wie das Clustering zum Einsatz kommen, um so Muster oder Eigenschaften erkennen zu können nach denen die Daten gruppiert werden können. ([[bigdata:literatur|Barnes 2015: S. 33]])
+  * **Unüberwachtes Lernen (unsupervised learning)**: Beim unüberwachten Lernen soll der Algorithmus eigenständig nach Mustern in Daten suchen. Weder Infos zu den Inputdaten, noch erwartete Outputdaten sind bekannt. Dabei können Verfahren wie das Clustering zum Einsatz kommen, um so Muster oder Eigenschaften erkennen zu können nach denen die Daten gruppiert werden können. ([[bigdata:literatur#b|Barnes 2015: S. 33]])
@@ Zeile 23: / Zeile 23: @@
   * **Empfehlung (Recommendation)**: //„Kunden die dieses Produkt kauften, kauften auch...“// ist ein wohl bekanntes Beispiel für Empfehlungen in Onlineshops. Anhand von vergangenen Bestellungen anderer Kunden, die ein Produkt enthielt, kann ermittelt werden, welche anderen Produkte typischerweise zusammen damit gekauft wurden, um so nützliche Vorschläge bereitstellen zu können. So werden Informationen von einer einzelnen Person mit Informationen der Masse kombiniert, um sinnvolle Empfehlungen auszuarbeiten. Ebenso könnte die Kategorie untersucht werden, in den die Produkte vergangener Einkäufe stehen, um so andere Produkte derselben Kategorie oder mit ähnlichen Eigenschaften finden zu können.
-  * **Klassifizierung (Classification)**: Klassifizierungen dienen dem richtigen Einstufen von Daten. Dafür werden bekannte Daten dafür genutzt, neue Daten richtig einzuschätzen (vgl. [[bigdata:literatur|Costin o. J.]]). Klassisches Beispiel dafür sind Spam-Filter. Manuelles Markieren von Mails als „//Spam//“ oder „//Kein Spam//“ beeinflusst künftige Entscheidung über die Klassifizierung des Mail-Programms.
+  * **Klassifizierung (Classification)**: Klassifizierungen dienen dem richtigen Einstufen von Daten. Dafür werden bekannte Daten dafür genutzt, neue Daten richtig einzuschätzen (vgl. [[bigdata:literatur#c|Costin o. J.]]). Klassisches Beispiel dafür sind Spam-Filter. Manuelles Markieren von Mails als „//Spam//“ oder „//Kein Spam//“ beeinflusst künftige Entscheidung über die Klassifizierung des Mail-Programms.
-  * **Gruppierung (Clustering)**: Beim Clustering werden ähnliche Daten werden nach gemeinsamen Charakteristika in Gruppen zusammengefasst. Anders als bei der Klassifizierung werden sie dabei in neue Gruppen geordnet und nicht in bereits bestehende Kategorien zugeordnet (vgl. [[bigdata:literatur|Barnes 2015: S. 169f]]).
+  * **Gruppierung (Clustering)**: Beim Clustering werden ähnliche Daten werden nach gemeinsamen Charakteristika in Gruppen zusammengefasst. Anders als bei der Klassifizierung werden sie dabei in neue Gruppen geordnet und nicht in bereits bestehende Kategorien zugeordnet (vgl. [[bigdata:literatur#b|Barnes 2015: S. 169f]]).