Web 2.0

Der Begriff „Web 2.0“ wurde 2004 von Tim O’Reilly und Dale Dougherty durch die „Web 2.0 Konferenz“ geprägt (Friedmann 2009: S. 36). Damit ist hauptsächlich die Erweiterung des „alten“ Webs, von statischen Angeboten hin zu einem interaktiven und kommunikativen Web gemeint.

Webseiten im „Web 1.0“ (der Begriff entstand erst im Nachhinein) dienten vornehmlich als Informationsquelle für die Besucher. Das war eine einseitige Form der Kommunikation. Ein Seitenbetreiber schreibt etwas auf seine Seite und die Besucher konsumieren es. Seit Anfang der 2000er änderte sich dies zunehmend. Das Web wurde interaktiver und kann flexibel auf den Nutzer reagieren. Nutzer konnten selbst Inhalte erzeugen, gestalten und mit anderen frei teilen. Seien es nun Kommentare und Bewertungen oder wissenschaftliche Artikel wie auf diversen Wikis, die sich durch Artikel auszeichnet, die von andern Nutzern erstellt wurden (anders als etwa Online-Enzyklopädien wie „Encyclopaedia Britannica“, deren Artikel durch die Redaktion erstellt wurden). Der User wird vom Konsument zum Produzent. Man spricht auch von „user generated content“. Durch Blogs oder Media-Seiten wie YouTube oder den sozialen Netzwerken wie Facebook kann nun jeder auf einfachste Weise seine Meinung kundtun oder an Diskussionen teilnehmen. Man spricht oft auch von einer Demokratisierung des Wissens oder des Internets. Der Kreativität beim Ausdruck sind dabei kaum Grenzen gesetzt. Beiträge in Text-, Bild-, Audio- oder Video-Form sind möglich.

Für Unternehmen bedeutet dies auch die Möglichkeit auf Kundenwünsche einzugehen und Feedback aktiv zu nutzen. Kundenzufriedenheit bekommt einen neuen Stellenwert, da sie auch das Kaufverhalten anderer Kunden beeinflussen kann (etwa durch Rezensionen in Online-Shops).

(Grafik-Quelle: Müller/Schumann o. J.)

Bedeutung für Datenbanken

Das Internet hat im Laufe der letzten Jahrzehnte mehrere Wandlungen erfahren, von einem statischen Web mit recht einseitiger Kommunikation hin zu einem interaktiven Erlebnis mit Nutzern, die selber Content generieren und in sozialen Netzwerken mit anderen Nutzern aus der ganzen Welt rund um die Uhr kommunizieren. Spätestens seit dem Siegeszug der Smartphones und Tablets ist das Internet allgegenwärtig und immer mehr Menschen erzeugen so immer mehr Inhalte.

So ergibt sich eine Vielzahl neuer Quellen, die zur Wissensgenerierung erschlossen werden können. Dazu zählen Blogeinträge, Tweets oder Facebook-Posts. Dabei liefern diese Quellen Daten nicht in strukturierter Form, sondern in den unterschiedlichsten Formaten wie Text, Logs, E-Mails, Audiodateien oder Videos.

Damit verbunden sind auch ganz neue Herausforderungen an Datenbanksysteme. Die traditionellen relationalen Datenbanksysteme sind mit den Massen der Daten, die in hoher Geschwindigkeit und in unterschiedlichsten Formaten anfallen können, überfordert. Man spricht auch von den drei Vs, die Big Data charakterisieren: Volume (Volumen), Velocity (Geschwindigkeit) und Variety (Vielfalt). Noch dazu müssen Services rund um die Uhr verfügbar sein und müssen stets möglichst schnell arbeiten, um kurze Reaktionszeiten zu ermöglichen, denn schon kleine Verzögerungen können Kundenunzufriedenheit und somit letztendlich auch Verlust bedeuten (Borland 2013).

Unter dem Begriff „NoSQL“ haben sich daraufhin einige neue Datenbanksysteme entwickelt, deren Datenmodelle sich von dem strikten Modell der relationalen Datenbanken entfernen, um mehr Flexibilität im Umgang mit Big Data bieten zu können.

Solche Datenbanken müssen einigen Anforderungen genügen:

Hohe Durchsatzrate
Hohe Verfügbarkeit
Horizontale Skalierbarkeit
Lauffähig auf günstiger Standardhardware
Einfach zu implementieren
Flexibler Umgang mit verschiedenen Datenformaten

(Grafik-Quelle: Pharos o. J.)