Video: Probabilistische Modellierung mit Scala

Im April habe ich einen Vortrag zum Thema „Probabilistic modelling with Scala“ auf der Scalar Conference in Warschau in Polen gehalten. Der Veranstalter hat nun kürzlich die Videoaufzeichnung meines Vortrags veröffentlicht – diese möchte ich Euch natürlich nicht vorenthalten!

In meinem Vortrag bekommt Ihr zunächst eine Einführung in die probabilistische Modellierung und in Bayes’sche Netzwerke. Anschließend zeige ich Euch eine Beispiel-Analyse, die mit Scala durchgeführt wurde.

Für diejenigen unter Euch, die Scala noch nicht kennen: Scala ist eine hybride funktional- objektorientierte Programmiersprache mit der sich sehr eleganter und effizienter Code schreiben lässt. Gleichzeitig mausert sich Scala zur Sprache der Wahl in vielen Datenanalyse-Aufgaben, speziell im Bereich Big Data (z.B. Spark). Die Arbeit mit unserer SEA-Software camato und den zugehörigen Gebotsmanagementfunktionen erfordert eine Menge an Zahlenverarbeitung und statistischer Modellierung – hier ist Scala meiner Meinung nach das perfekte Tool.

Mithilfe von probabilistischer Modellierung kannst Du Erkenntnisse über deine Daten gewinnen, während das Bayes’sche Netz eine Methode zur Modellierung von Zusammenhängen von Zufallsvariablen darstellt. Beide sind sowohl leicht verständlich als auch effektiv beim Erlernen von Modellen unter verschiedensten Bedingungen.

Bayes‘sche Netzwerke ermöglichen es, komplexe Abhängigkeiten zwischen beobachtbaren und latenten (versteckten) Variablen in Deinen Daten zu modellieren. So könnte man zum Beispiel ein Modell erstellen, dass die Conversion Rate von Kombinationen von Ausdrücken in Produkttiteln und Produkten, die diese Ausdrücke enthalten, darstellt. Dieses Modell könnte sowohl die Kombination aus Ausdruck und Produkt berücksichtigen, als auch die Tatsache, dass manche Produkte von Haus aus eine höhere Conversion Rate (unabhängig vom Produkttitel) haben und manche Ausdrücke besser oder schlechter funktionieren, unabhängig bei welchem Produkt (z.B. “hochqualitativ”). Es könnte auch unbeobachtete Variablen, wie die Absicht des Besuchers, modellieren, die man nur indirekt aus den Daten schätzen kann.

Hat man ein “trainiertes” Bayes‘sches Netzwerk, kann man eine Reihe von interessanten Anfragen stellen:

  • Wenn ich dieses neue Produkt verkaufen will, welche Conversion Rates kann ich erwarten? (Vorhersage)
  • Ich habe ein bestimmtes User-Verhalten bei einem Produkt beobachtet, was sind mögliche Erklärungen dafür? (Diagnose)
  • Werden Benutzer, die sich ein bestimmtes Produkt anschauen, zu Neukunden? (Klassifikation)
  • Welche Variablen könnte ich ändern, um die Conversion Rate zu verbessern? (Entscheidungsfindung)

Bayes‘sche Netzwerke sind aus vielen Gründen interessant. Es benötigt etwas Zeit, um sich an ihre Art zu “denken” zu gewöhnen, aber der Aufwand könnte sich sehr gut lohnen 🙂

Die Folien des Vortrags findest Du hier und die technisch Interessierten unter Euch können hier auch gerne mit dem Beispiel-Code des Vortrags spielen.

ABOUT THE AUTHOR


Martin is developing a bid management solution for crealytics. He is also a long-term meditator and interested in neuro-feedback.

    Find more about me on:
  • twitter
  • Corny

    @gimme_moe #innohub 4 win!