Named-Entity-Recognition (NER) ist ein Prozess, bei dem bestimmte Entitäten aus einem Text, wie z. B. Namen von Personen, Organisationen, Orte, etc. automatisiert identifiziert werden. Dadurch können z. B. in finanzbezogenen Dokumenten wie Geschäftsberichten bestimmte Finanzindikatoren, Firmennamen, Zeitpunkte oder Beträge lokalisiert und zur weiteren Prozessierung verwendet werden.

Komplementär zur NER ist die sogenannte Relationship-Extraction (RE) einzuordnen. Relationship-Extraction bezieht sich auf die Aufgabe, Beziehungen und Verbindungen zwischen Entitäten in einem Text zu identifizieren und zu klassifizieren. Eine Kombination von NER und RE kann sehr nützlich sein, um aus unstrukturierten Textdaten strukturierte Informationen zu erhalten.

Im Folgenden soll dies an einem einfachen Beispiel erläutert werden. Der Satz "Apple Inc. wurde 1976 von Steve Jobs, Steve Wozniak und Ronald Wayne gegründet." kann von einem kombinierten NER und RE-System in folgenden Output umgewandelt werden:

  • (Apple Inc., wurde gegründet von, Steve Jobs)
  • (Apple Inc., wurde gegründet von, Steve Wozniak)
  • (Apple Inc., wurde gegründet von, Ronald Wayne)
  • (Apple Inc., wurde gegründet in, 1976)

Es kommen hier die Entitätsklassen "Organisation" (Apple Inc.), "Person" (z. B. Steve Jobs) und "Datum" (1976) sowie die Beziehungsklassen "wurde gegründet von" und "wurde gegründet in" vor. Über diese Methodik können umfangreiche Knowledge-Graphen erzeugt werden, die die Informationen von einer großen Menge an Texten strukturiert in einem Graphen visualisieren (s. Abb. 4). Z. B. können so Lieferketten analysiert oder die Aktivitäten von Wettbewerbern getrackt werden (s. Abb. 1, Anwendungsfelder Lieferketten und Wettbewerber-Analyse).

Abb. 4: Knowledge-Graph entstanden aus einer Kombination aus Named-Entity-Recognition und Relationship-Extraction, angewandt auf eine große Menge an Nachrichtenartikeln zu einem bestimmten Thema. Es entsteht ein Netzwerk aus Entitäten und den dazugehörigen Beziehungen/Verbindungen.

Das ist nur ein Ausschnitt aus dem Produkt Controlling Office. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge