
Vom 14.05.2008
Grundlagenserie Business Intelligence
BI-Methoden (Teil 4): Text Mining und Web Mining
Sollen Muster und Zusammenhänge in unstrukturierten Dokumenten oder auf Websites entdeckt werden, bieten sich Text Mining und Web Mining an. Textuelle Informationen, aber auch Website-Besucher, lassen sich damit automatisch gruppieren, klassifizieren und mit Regeln beschreiben.
Die Methoden des Data Mining werden auf strukturierte Daten angewendet. Auf Daten also, wie sie typischerweise etwa in relationalen Datenbanksystemen in Tabellenform gespeichert sind. Nicht alle Geschäftsdaten liegen jedoch so aufbereitet vor. Eine ganze Reihe wichtiger betrieblicher Informationen bildet als unstrukturierte Sammlung von Texten einen zusätzlichen wichtigen Informationsbestand in Unternehmen.
Praktisch ist es sogar so, dass die weitaus meisten Informationen in Unternehmen textueller Art sind. Bei bis zu 80 Prozent liegt laut einschlägiger Studien der Anteil unstrukturierter Textdokumente am Gesamtaufkommen betrieblicher Informationen. Seit Jahrzehnten akkumulieren Unternehmen beispielsweise potenziell geschäftskritische Marktstudien, Geschäftsberichte, Kundenbefragungen oder Projektmemos in dateibasierten Archiven.
Für die Analyse dieser Art von unstrukturierten Daten hat sich Text Mining als Methode etabliert. Analog zum Data Mining soll Text Mining Muster und Beziehungen in den Daten entdecken – mit dem Unterschied, dass die Datenbasis nun Textdokumente bilden.
Oft wird Text Mining mit Information Retrieval verwechselt. Information Retrieval wird ebenfalls auf unstrukturierte Daten angewendet, im Mittelpunkt steht dabei aber die effiziente Suche nach Informationen. Ziel des Text Mining hingegen ist die Aufbereitung und Analyse unstrukturierter Daten zur Entdeckung mehr oder weniger verborgenen Wissens. Dieses soll im wirtschaftlichen Kontext dann Entscheidungsprozesse unterstützen.
Neben unternehmensinternen Textdokumenten gibt es die scheinbar unendliche Menge potenziell entscheidungsrelevanter Webseiten - Patentschriften, Branchennachrichten, Produktbewertungen oder Pressemitteilungen. Auch diese enthalten oft wertvolle Informationen für Betriebe, deren Auswertung nachhaltig Wettbewerbsvorteile sichert.
Da die Analyse von Web-Inhalten eigene Problematiken beinhaltet, hat sich hier eine weitere Variante des Data Mining entwickelt – das Web Mining. Web Mining wendet Methoden des Data Mining an, um Datenstrukturen im WWW zu untersuchen, wobei neben dem eigentlichen Seiteninhalt und der Struktur von Websites auch das Nutzerverhalten zum Gegenstand gemacht wird.
Inhalt dieses Artikels
Live-Berater: TecChannel Experten-Netzwerk Links zum Artikel
BI-Methoden (Teil 3): Data Mining im Detail Für das Aufspüren wirtschaftlich interessanter Muster und Zusammenhänge stehen eine ganze Reihe von Data Mining Verfahren ...
Links zum Thema


















