Textanalyse mit KI

Schnelle thematische Einordnung für hochpräzises B2B-Targeting

MBmedien nutzt die API von OpenAI, um Fachartikel zu analysieren und Informationen zu extrahieren. Die neue Methode liefert präzise Klassifikationen und spart viel Zeit und Geld.

Herausforderung

MBmedien bietet seit einigen Jahren eine innovative Lösung für das B2B-Marketing an: Intent Data. Diese “Absichtsdaten” geben Marketern und Vertrieblern Auskunft darüber, mit welchen Themen sich ihre Zielkunden online beschäftigen und wo Indikatoren für eine Kaufbereitschaft zu erkennen sind. Mit diesen Informationen lassen sich Werbemaßnahmen fokussieren und Verkaufszyklen beschleunigen. (Mehr dazu hier.)

Grundlage für Intent Data sind Fachartikel auf redaktionellen Plattformen wie heise.de und t3n.de. Diese Artikel müssen kategorisiert und ausgewertet werden, um daraus Themeninteressen und Kaufbereitschaft abzuleiten.

Früher wertete MBmedien die Artikel manuell über Schlagwörter aus. Diese Herangehensweise erfordert den Blick eines vielbeschäftigten Redakteurs, sodass in der Regel nur eine oberflächliche Analyse möglich ist. Besonders zeitaufwändig sind Zweifelsfälle: Ein Artikel über das Thema “Cloud” beispielsweise kann Beratung, Infrastruktur oder Security behandeln – eine saubere Einordnung gelingt nur mit tiefem Kontextverständnis.

Als die Anzahl der auszuwertenden Artikel zunahm, war der Zeit- und Kostenaufwand ohne Automatisierung nicht mehr tragbar.

Ziel

Erreicht werden sollte also eine hohe Präzision bei der Inhaltsanalyse bei minimalem Aufwand für eine praktisch unbegrenzt skalierbare Asset-Pipeline. Keine leichte Aufgabe – auch nicht für künstliche Intelligenz, wie sich noch herausstellen sollte.

Ein neuartiges Projekt wie dieses beginnt mit vielen Unklarheiten. In diesem Fall mussten unter anderem die folgenden Fragen beantwortet werden:

Erst nach der Klärung dieser Fragen konnte das Team von MBmedien die Ziele des Projekts konkretisieren und die entsprechenden Maßnahmen in Angriff nehmen.

Lösung

Im aktuellen Setup nutzt MBmedien die API von OpenAI, um Inhalte einzugeben und strukturierte JSON-Antworten zurückzuerhalten. Die Prompts beschreiben exakt, welche Informationen benötigt werden und wie die Antwort formatiert sein soll, nämlich als JSON mit definierten Abkürzungen nach Clean-Code-Regeln.

Nach verschiedenen Tests gestaltete sich der Prozess letztendlich so:

  1. Die Artikel werden nacheinander an die API gesendet.
  2. Die Antworten – standardisierte JSON-Objekte – werden in eine Datenbank geschrieben.
  3. Eine Harmonisierung vereinheitlicht Felder (z. B. in Form von Synonym-Mapping), und entfernt irrelevante Zusatztexte.

 

Als Modell nutzt MBmedien GPT-4o von OpenAI, da hier vor allem bei textgenerativen Aufgaben regelmäßig Qualitätssprünge beobachtet wurden.

Die technische Einbindung über die API war innerhalb weniger Stunden erledigt. Auch die Harmonisierung nahm für die Datenspezialisten nicht allzu viel Zeit in Anspruch.

Ein Großteil des Aufwands floss in das Prompt-Design und die entsprechenden Test Cases. Die KI hielt sich anfangs nicht strikt genug an die Format- und Abkürzungsvorgaben – ein generelles Problem bei aktuellen LLMs. Der Prompt wurde immer wieder verfeinert, bis die Antworten verlässlich genug waren, um automatisch weiterverarbeitet zu werden. Dieser Feinschliff nahm mehrere Wochen in Anspruch; auch das ist jedoch nicht untypisch für mittelständische KI-Projekte.

Ergebnisse

Eine Analyse von Fachinhalten “auf Knopfdruck” bei gleichbleibender Qualität – das hat eine Vielzahl von Vorteilen.

Dank kurzer Prompts und kompakter JSON-Outputs bleiben die API-Kosten überschaubar. Nur ca. 2.000 Euro sind seit dem Projektstart vor einigen Monaten aufgewendet worden, um etwa 80.000 Artikel auszuwerten – 2,5 Cent pro Artikel.

Risiken sind bei Automatisierungen nicht gänzlich zu vermeiden, kleinere Fehler sind in diesem Anwendungsbereich jedoch tolerierbar – und würden bei diesen Textmengen wahrscheinlich auch bei manueller Auswertung auftreten. Dennoch werden Outputs in Stichproben geprüft, insbesondere bei ungewöhnlichen Formaten und Themen.

Fazit

Der Wechsel von Schlagwort- zu Bedeutungsanalyse verbessert die Auswertung von Fachartikeln deutlich: maximales Tempo, hohe Präzision, minimaler Aufwand. Die KI erkennt zuverlässig, ob Inhalte B2B-Entscheider adressieren, in welcher Kaufentscheidungsphase sich diese wahrscheinlich befinden und welche thematischen Aspekte behandelt werden. So lassen sich schnell und einfach die notwendigen Daten zusammenstellen, auf deren Basis thematische Interessen ermittelt und Intent-Daten erfasst werden.

Die wichtigsten Learnings für MBmedien:

Dieser Use Case stellte die erste KI-Implementierung für MBmedien dar. “Weitere werden folgen”, so IT-Leiter Sascha Strzoda. “Wir gehen davon aus, dass die erarbeiteten Kenntnisse und Standards den Zeitaufwand in ähnlichen Workflows stark verkürzen. Insofern war das Projekt in doppelter Hinsicht eine Investition in die Zukunft der Agentur.”

Für KI-Implementierungen empfiehlt sich grundsätzlich ein stufenweises Vorgehen: erst ein eng umrissener Pilot, dann die Erweiterung um priorisierte Bausteine und schließlich die umfassende Automatisierung mit sinnvollen Prozessen zur Qualitätssicherung. So bleiben Kosten und Risiken kontrollierbar, während man sich langsam, aber stetig dem Zielbild annähert.

Über MBmedien

MBmedien ist ein B2B-Marketing-Spezialist mit Sitz in Krefeld, der seit 1995 Unternehmen verschiedenster Branchen, insbesondere IT und Industrie, berät und unterstützt. Das Portfolio umfasst sowohl bewährte als auch neuartige Lösungen, darunter Kundendaten-Management, Leadgenerierung, Webinare, Account-based Display Advertising und Intent Data. MBmedien verfügt über eine eigene B2B-Datenbank mit Kontakten aus 665.000 DACH-Unternehmen. Seit einiger Zeit ist MBmedien Teil der heise-Gruppe und des reachIT-Netzwerks.