English| Impressum & AGBs | Datenschutz

Data Mining

Data Mining bezeichnet den Prozess des Entdeckens neuer Muster in grossen Datenmengen mittels Ansätze aus der künstlichen Intelligenz und auch der klassischen Statistik. Das Ziel von Data Mining ist die Mustererkennung, das Entdecken von etwas neuem, das Sie vorher nicht wussten oder kannten.

Wir bieten professionelles Data Mining von großen Datenmengen im ganzen Spektrum: Vom Enterprise Miner 12.1, über anspruchsvolle statistische Ansätze auf hohem Niveau (u.a. Entscheidungsbäume, Zeitreihenanalyse, (multiple) Regressionen oder Segmentierungsverfahren (vgl. Six Sigma, Advanced Analytics), bis zur Planung und Implementierung flexibler SQL Abfragen, und visueller Präsentation und Kommunikation.

Gibt es etwas, das Sie schon immer -wirklich- wissen wollten?

Beispiele für die Modellierung von Geschäftsprozessen und -zielen (einschließlich von Finance, Manufacturing, Medicine, CRM/Marketing und Telco):

  • Landwirtschaft: Kennen Sie die wirklich signifikanten Prädiktoren für den besten Wein in einem Jahr? Ein Data Miner hat eine Formel herausgefunden, die bislang noch alle Weinexperten bei der Vorhersage der besten Jahrgänge geschlagen hat.
  • Einzelhandel: Einen Blick in einen Warenkorb (SMCG, FMCG) ermöglicht Ihnen zu sagen, was dieser Kunde mmit hoher Wahrscheinlichkeit als nächstes kaufen wird.
  • Verkauf (Cross-/Up-Sell): Haben Sie zuvor einen Blick in einen Warenkorb geworfen, dann sind Sie erfolgreicher beim Verkauf mehr oder verwandter Produkte an denselben Kunden oder an ähnliche Kunden (Klassifizierung und Segmentierung).
  • Manufacturing: Sind Produktion und Produktqualität immer noch im grünen Bereich? Haben Sie schon die Faktoren identifizieren können, die die Ursache für Mängel sind?
  • Katalogmarketing: Kann ich bestimmte Muster bei Kunden erkennen und diejenigen identifizieren, die am wahrscheinlichsten auf anstehende Mailing-Kampagnen reagieren? (Target-Modeling)
  • Health Care: Daten, die einem Mining unterzogen wurden, könnten Ärzte in ihrer Entscheidungsfindung zu unterstützen oder sogar ihr Fachwissen erweitern, um die beste Behandlungsqualität anzubieten.
  • Customer Profiling: Kennen Sie wirklich Ihre Kunden? Finden Sie die gewünschten Produkte oder Informationen Ihrer Kunden, rangordnen Sie all Ihre Kunden gemäß ihrem Wert, sprechen Sie sie effektiv in Mail-Kampagnen an, und sagen Sie zukünftige Trends bei Umsatz und Umsatzwachstum voraus (time to churn, time to event).
  • Finance: Erstellen Sie Kundenprofile oder Klassifikationen (Typen) durch die Analyse des Ausgabe-Verhaltens (z.B. von Kreditkarten-Inhabern), und sagen Sie die Kunden-Verlustrate voraus (Churn, Attrition).
  • Controlling: Warum immer auf unternehmensweit verteilte Datendateien warten, was wiederum Berichte verzögert? Warum nicht ein automatisiertes KPI-System implementieren, das automatisierte Berichte einschließlich der Ergebnisse des automatisierten Mining auf jetzt integrierten Daten liefert?
  • Telco: Kann ich Umsatzprognosen oder Prognosen von Vertragsstornierungen (z.B. Handys) modellieren?
  • Risk: Kann ich ein Risiko bestimmen? Wie ist Betrug im Business zu erkennen und vorherzusagen? Was könnte ich tun, wenn dieser Kunde, dieses Produkt oder diese eine Dienstleistung diese oder jener Merkmale aufweist?
  • F&E/R&D: Wie Muster in großen Datenmengen erkennen, z. B. Pharmadaten, Mediendaten, Ingenieurdaten, soziale Daten?
  • Die gleiche Frage, die gleiche Antwort: Data Mining.

    Typische Data Mining Ansätze:
  • Clusterung und Segmentierung: Two-Stage, k-nearest neighbours (KNN), SOM/Kohonen, Binning, Market Basket, Variable Clustering, Diskriminanzanalyse, etc.
  • Kausalmodellierung: Path Analysis, Neural Network, AutoNeural, Gradient Boosting, Decision Tree, Random Forest, Multilayer Perceptron, etc.
  • Regressionsmodellierung: Dmine Regression, DMNeural, LARS, PLS, Regression (multiple, binär, logistisch, ordinal, multinomial), Survival etc.
  • Text Mining: MapReduce (PROC HADOOP), Text Mining mit SPSS Modeller; Visual Analytics mit IBM COGNOS (a/k/a 'Many Eyes'); Analyse unstrukturierter Texte mittels Word Trees, Tag Clouds, Phrase Nets, und HISTORIO.
    Pre-Processing Ansätze(über EM hinausgehend):
  • Werte: Imputation (Median/Mittelwert, EM/FIML, Regression, Cold/Hot Deck), Löschen, Zusammenfassen, Flagging etc.
  • Zeilen: Filtering, Indexing, Cleansing, Sampling, Kombinieren, Zusammenfassen kategorialer Inputvariablen etc.
  • Felder (Verdichtung): Combining (PCA, Regression, Faktoranalyse), univariate Korrelation mit Target (Spearman, Hoeffding), weitere Reduzierung durch Clusterung der Inputvariablen.
  • Bestes Modell: Schrittweise Variablenselektion, z.B. durch Rückwärtsregression (abhängig von Datenlast und Verarbeitungsumgebung).
  • Andere daten-getriebene Techniken: Unterauswahl nach Zufall und Struktur (Strata), Entscheidungsbäume, ehrliche Einschätzung der Performanz von Klassifizierern, Validierung, AUC/ROC, Cut-Off Kalibrierung, Lift etc.
  • Daten-getriebene Techniken ersetzen kein expertenwissen-getriebenes Validieren und Testen.

Wir beraten Sie gerne in Bezug auf Vorzüge und Möglichkeiten von Data Mining und multivariaten Analysen, und planen und führen professionelle Analysen gemäß Ihren Vorgaben und Spezifikationen durch. Wenn Sie uns einen Einblick in Ihre Daten gewähren, könnten wir Ihnen diese und andere Fragen beantworten. Wir helfen Ihnen, Ihre Kunden, Produkte und Dienstleistungen noch besser kennenzulernen. Wir beraten zu Expertenanalysen und ihrer Anwendung gemäß Ihren Anforderungen und Spezifikationen einschließlich eventuell notwendiger Schritte für Integration, Aufbereitung, Überprüfung (Reinigung), Formatierung und (schlussendlich) Analyse. Wenn Sie dies möchten.

 
Kontakt Sitemap
1998-2015 Copyright by Method Consult Switzerland, Dr.Schendera