Grundlagenserie Business Intelligence

BI-Methoden (Teil 4): Text Mining und Web Mining

Sollen Muster und Zusammenhänge in unstrukturierten Dokumenten oder auf Websites entdeckt werden, bieten sich Text Mining und Web Mining an. Textuelle Informationen, aber auch Website-Besucher, lassen sich damit automatisch gruppieren, klassifizieren und mit Regeln beschreiben.
Die Methoden des Data Mining werden auf strukturierte Daten angewendet. Auf Daten also, wie sie typischerweise etwa in relationalen Datenbanksystemen in Tabellenform gespeichert sind. Nicht alle Geschäftsdaten liegen jedoch so aufbereitet vor. Eine ganze Reihe wichtiger betrieblicher Informationen bildet als unstrukturierte Sammlung von Texten einen zusätzlichen wichtigen Informationsbestand in Unternehmen.


Praktisch ist es sogar so, dass die weitaus meisten Informationen in Unternehmen textueller Art sind. Bei bis zu 80 Prozent liegt laut einschlägiger Studien der Anteil unstrukturierter Textdokumente am Gesamtaufkommen betrieblicher Informationen. Seit Jahrzehnten akkumulieren Unternehmen beispielsweise potenziell geschäftskritische Marktstudien, Geschäftsberichte, Kundenbefragungen oder Projektmemos in dateibasierten Archiven.


Für die Analyse dieser Art von unstrukturierten Daten hat sich Text Mining als Methode etabliert. Analog zum Data Mining soll Text Mining Muster und Beziehungen in den Daten entdecken – mit dem Unterschied, dass die Datenbasis nun Textdokumente bilden.


Oft wird Text Mining mit Information Retrieval verwechselt. Information Retrieval wird ebenfalls auf unstrukturierte Daten angewendet, im Mittelpunkt steht dabei aber die effiziente Suche nach Informationen. Ziel des Text Mining hingegen ist die Aufbereitung und Analyse unstrukturierter Daten zur Entdeckung mehr oder weniger verborgenen Wissens. Dieses soll im wirtschaftlichen Kontext dann Entscheidungsprozesse unterstützen.


Begriffsortung: Text Mining im Kontext von Suche, Entdeckung und dem Grad der Datenstrukturierung.
spacer_1px
Begriffsortung: Text Mining im Kontext von Suche, Entdeckung und dem Grad der Datenstrukturierung.
spacer_1px


Neben unternehmensinternen Textdokumenten gibt es die scheinbar unendliche Menge potenziell entscheidungsrelevanter Webseiten - Patentschriften, Branchennachrichten, Produktbewertungen oder Pressemitteilungen. Auch diese enthalten oft wertvolle Informationen für Betriebe, deren Auswertung nachhaltig Wettbewerbsvorteile sichert.


Da die Analyse von Web-Inhalten eigene Problematiken beinhaltet, hat sich hier eine weitere Variante des Data Mining entwickelt – das Web Mining. Web Mining wendet Methoden des Data Mining an, um Datenstrukturen im WWW zu untersuchen, wobei neben dem eigentlichen Seiteninhalt und der Struktur von Websites auch das Nutzerverhalten zum Gegenstand gemacht wird.




dotted_line_content
 
Seite 1 von 10
dotted_line_content
Inhalt dieses Artikels
dotted_line_content
Links zum Artikel





Links zum Thema









Ihre Meinung zum Artikel
Benutzername:
Passwort:



.
spacer