Suche mit Bedeutung: Wie beginnen mit Terminologiemanagement und Ontologie?

Denken Sie an eine alltägliche Situation im Straßenverkehr: Ein schwarzer Sportwagen fährt röhrend mit hoher Geschwindigkeit durch das Stadtgebiet. Erlebt man diese Situation im wirklichen Leben, kann man unmittelbar nachher auch folgende Fragen beantworten:

  • Um welche Stadt handelte es sich?
  • Zu welcher Tageszeit ereignete sich der Vorfall?
  • Um welche Automarke handelte es sich?
  • Saß ein Mann oder eine Frau hinter dem Steuer?

Viele Aspekte der Umwelt, die wir unbewusst wahrnehmen, können wir in den passenden Kontext setzen und jederzeit abrufen. So stellt es für uns Menschen keine große Herausforderung dar, aus Informationen logische Schlüsse zu ziehen.

Computern diese Fähigkeit beizubringen bedeutet da schon, einen sehr viel höheren Aufwand zu betreiben. Jede Information, die abgerufen werden soll, muss auch gespeichert werden.

Die Einbeziehung der Bedeutung und der Merkmale der Begriffe bietet einen Ansatzpunkt, um Maschinen künstliche Intelligenz anzutrainieren. Genau diese Tatsache wird in der semantischen Suche genutzt.

Die semantische Suche ist bei Weitem kein Newcomer mehr:

Bereits im Februar 2004 veröffentlichte das W3C (World Wide Web Consortium; ein Gremium, das die Techniken im World Wide Web standardisiert) mit OWL (Web Ontology Language; eine Spezifikation zur Beschreibung von Ontologien) eine Empfehlung zur Beschreibung von Ontologien, die im November 2011 aktualisiert wurde.

Mit Hilfe von OWL ist es möglich, Begriffe und deren Beziehungen zueinander so zu beschreiben, dass auch Software deren Bedeutung versteht. Dieser Zugang ist ein Grundpfeiler des Semantic Web und somit der semantischen Suche.

Das Semantic Web baut auf Daten auf, die untereinander leicht ausgetauscht werden können und somit neue Verknüpfungen mit bestehenden Daten ermöglichen.

Zurück zum Beispiel mit dem röhrenden, schwarzen Sportwagen: Die beiden Eigenschaften röhrend und schwarz können auch andere Begriffe auszeichnen, das heißt, diese Merkmale bilden die Berührungspunkte für mehrere Begriffe untereinander.

Basis für semantische Suche sind Informationen, und zwar so viele wie möglich, also BIG DATA. Diese Informationen müssen in irgendeiner Weise kategorisiert werden und dann mit so viel wie möglich Zusatzinformationen ausgestattet werden. Hierzu gibt es eine Reihe von Modellen, wie die Grafik ansatzweise illustriert.

Eine Ontologie ist im Wesentlichen eine Taxonomie (Methode, nach der Begriffe kategorisiert bzw. klassifiziert werden), die jedoch zusätzlich die Merkmale von Begriffen aufnehmen kann. Über die Merkmale können die Begriffe dann miteinander verknüpft werden: Das Resultat ist, dass alles mit allem in gewisser Weise zusammenhängt.

Ontologien kann man sich wie „gut gefütterte“ Datenbanken vorstellen. Dabei spielen ausgeklügelte Kategorisierungen eine wesentliche Rolle. Diese entstehen nicht von einem Tag auf den anderen, sondern implizieren einen immerwährenden Prozess. Es scheint vielfach einfacher, einen Heuhaufen in gleich lange Halme zu sortieren, als die vorhandenen Informationen zu kategorisieren und mit den notwendigen Metadaten zu versehen.

Ich bin sicher, Sie haben längst damit begonnen, eine Reihe von Datenpools aufzubauen. Sei es eine Excel-Liste als Basis für die kontrollierte Sprache in Ihrem Unternehmen oder die Verwendung eines professionellen Tools zum Terminologiemanagement.

Zum Anfangen eignet sich am besten eine projektspezifische Terminologie: Projekte haben die Eigenschaft, dass in ihnen eine eigene Terminologie heranwächst. Das ist nicht immer gewünscht, aber meist die Realität.

Nehmen Sie jedes (relevante) Wort unter die Lupe, gleichen Sie es mit bestehenden Terminologielisten ab und versehen Sie es mit Metadaten (Kategorie, Eigenschaften etc.). Wichtig dabei ist, dass alle Abteilungen in Ihrem Unternehmen mitspielen und den sprichwörtlichen Senf dazugeben: Sie werden staunen, wie unterschiedlich die einzelnen Wörter in den Abteilungen verwendet werden.

Damit ist ein erster Schritt zur ersten Ontologie gemacht. Und das Gute an Ontologien ist, dass sie wiederverwendbar sind.

Es ist ein guter Zeitpunkt, jetzt anzufangen, bestehende Informationen in Ihrem Unternehmen durch Ontologien „aufzufetten“ und zu Wissen zu verarbeiten. Damit schaffen Sie die Voraussetzungen für die semantische Suche.

Kenner und Akteure der Semantic-Web-Branche prophezeien, dass die semantische Suche in allen Bereichen Fahrt aufnehmen wird und bis 2020 alle gängigen Suchsysteme mit den entsprechenden Technologien ausgestattet sein werden.

Die Menge der Daten will gemanagt werden, oder – um es mit George Orwell (1984) zu sagen: „ (…) who controls the vocabulary, controls the knowledge.”

Kommentar schreiben

Kommentar schreiben

* Diese Felder sind erforderlich

Kommentare

Kommentare

[23. August 2016]

Ein interessanter Aspekt fällt mir aus dem Eingangsbeispiel auf, den ich bei technischer Kommunikation bisher kaum gesehen habe: Emotion!

Ich kann mich an die Tageszeit eher nicht und an die Person hinterm Steuer nur falls weiblich und blond erinnern ;-), die Automarke ist wieder total egal.

Gerade bei elektronischer Kommunikation fällt mir auf, weil noch nicht wie Papierkommunikation „in den Genen verankert“, wie die persönliche emotionale Einstellung die Stärke der ontologischen Verknüpfungen wohl massiv beeinflusst.

Insofern ist das Thema User Experience, also das über die Gebrauchstauglichkeit hinausgehende positive emotionale Erlebnis z. B. auch bei einer „banalen“ Volltextsuche vielleicht doch viel wichtiger ist, als ich ursprünglich mal dachte. So sind die Google Doodles (http://www.google.com/doodles/) vielleicht doch mehr nur als ein Gag ...