Suche mit Bedeutung: Wie beginnen mit Terminologiemanagement und Ontologie?
Am Anfang stand die Suche
Denken Sie an eine alltägliche Situation im Straßenverkehr: Ein schwarzer Sportwagen fährt röhrend mit hoher Geschwindigkeit durch das Stadtgebiet. Erlebt man diese Situation im wirklichen Leben, kann man unmittelbar nachher auch folgende Fragen beantworten:
Um welche Stadt handelte es sich?
Zu welcher Tageszeit ereignete sich der Vorfall?
Um welche Automarke handelte es sich?
Saß ein Mann oder eine Frau hinter dem Steuer?
Viele Aspekte der Umwelt, die wir unbewusst wahrnehmen, können wir in den passenden Kontext setzen und jederzeit abrufen. So stellt es für uns Menschen keine große Herausforderung dar, aus Informationen logische Schlüsse zu ziehen.
Computern diese Fähigkeit beizubringen bedeutet da schon, einen sehr viel höheren Aufwand zu betreiben. Jede Information, die abgerufen werden soll, muss auch gespeichert werden.
Die Einbeziehung der Bedeutung und der Merkmale der Begriffe bietet einen Ansatzpunkt, um Maschinen künstliche Intelligenz anzutrainieren. Genau diese Tatsache wird in der semantischen Suche genutzt.
Suchen Sie noch oder arbeiten Sie schon?
Die semantische Suche ist bei Weitem kein Newcomer mehr:
Bereits im Februar 2004 veröffentlichte das W3C (World Wide Web Consortium; ein Gremium, das die Techniken im World Wide Web standardisiert) mit OWL (Web Ontology Language; eine Spezifikation zur Beschreibung von Ontologien) eine Empfehlung zur Beschreibung von Ontologien, die im November 2011 aktualisiert wurde.
Mit Hilfe von OWL ist es möglich, Begriffe und deren Beziehungen zueinander so zu beschreiben, dass auch Software deren Bedeutung versteht. Dieser Zugang ist ein Grundpfeiler des Semantic Web und somit der semantischen Suche.
Semantic Web
Das Semantic Web baut auf Daten auf, die untereinander leicht ausgetauscht werden können und somit neue Verknüpfungen mit bestehenden Daten ermöglichen.
Zurück zum Beispiel mit dem röhrenden, schwarzen Sportwagen: Die beiden Eigenschaften röhrend und schwarz können auch andere Begriffe auszeichnen, das heißt, diese Merkmale bilden die Berührungspunkte für mehrere Begriffe untereinander.
Ontologien und ihr Nutzen
Basis für semantische Suche sind Informationen, und zwar so viele wie möglich, also BIG DATA. Diese Informationen müssen in irgendeiner Weise kategorisiert werden und dann mit so viel wie möglich Zusatzinformationen ausgestattet werden. Hierzu gibt es eine Reihe von Modellen, wie die Grafik ansatzweise illustriert.
Was können Ontologien besser als Terminologielisten?
Eine Ontologie ist im Wesentlichen eine Taxonomie (Methode, nach der Begriffe kategorisiert bzw. klassifiziert werden), die jedoch zusätzlich die Merkmale von Begriffen aufnehmen kann. Über die Merkmale können die Begriffe dann miteinander verknüpft werden: Das Resultat ist, dass alles mit allem in gewisser Weise zusammenhängt.
Metadaten
Ontologien kann man sich wie „gut gefütterte“ Datenbanken vorstellen. Dabei spielen ausgeklügelte Kategorisierungen eine wesentliche Rolle. Diese entstehen nicht von einem Tag auf den anderen, sondern implizieren einen immerwährenden Prozess. Es scheint vielfach einfacher, einen Heuhaufen in gleich lange Halme zu sortieren, als die vorhandenen Informationen zu kategorisieren und mit den notwendigen Metadaten zu versehen.
Wo anfangen?
Ich bin sicher, Sie haben längst damit begonnen, eine Reihe von Datenpools aufzubauen. Sei es eine Excel-Liste als Basis für die kontrollierte Sprache in Ihrem Unternehmen oder die Verwendung eines professionellen Tools zum Terminologiemanagement.
Zum Anfangen eignet sich am besten eine projektspezifische Terminologie: Projekte haben die Eigenschaft, dass in ihnen eine eigene Terminologie heranwächst. Das ist nicht immer gewünscht, aber meist die Realität.
Nehmen Sie jedes (relevante) Wort unter die Lupe, gleichen Sie es mit bestehenden Terminologielisten ab und versehen Sie es mit Metadaten (Kategorie, Eigenschaften etc.). Wichtig dabei ist, dass alle Abteilungen in Ihrem Unternehmen mitspielen und den sprichwörtlichen Senf dazugeben: Sie werden staunen, wie unterschiedlich die einzelnen Wörter in den Abteilungen verwendet werden.
Damit ist ein erster Schritt zur ersten Ontologie gemacht. Und das Gute an Ontologien ist, dass sie wiederverwendbar sind.
Conclusio
Es ist ein guter Zeitpunkt, jetzt anzufangen, bestehende Informationen in Ihrem Unternehmen durch Ontologien „aufzufetten“ und zu Wissen zu verarbeiten. Damit schaffen Sie die Voraussetzungen für die semantische Suche.
Kenner und Akteure der Semantic-Web-Branche prophezeien, dass die semantische Suche in allen Bereichen Fahrt aufnehmen wird und bis 2020 alle gängigen Suchsysteme mit den entsprechenden Technologien ausgestattet sein werden.
Die Menge der Daten will gemanagt werden, oder – um es mit George Orwell (1984) zu sagen: „ (…) who controls the vocabulary, controls the knowledge.”
Kommentar schreiben
Kommentar schreiben
Kommentare
Kommentare
Dieter Gust
[23. August 2016]
Ein interessanter Aspekt fällt mir aus dem Eingangsbeispiel auf, den ich bei technischer Kommunikation bisher kaum gesehen habe: Emotion!
Ich kann mich an die Tageszeit eher nicht und an die Person hinterm Steuer nur falls weiblich und blond erinnern ;-), die Automarke ist wieder total egal.
Gerade bei elektronischer Kommunikation fällt mir auf, weil noch nicht wie Papierkommunikation „in den Genen verankert“, wie die persönliche emotionale Einstellung die Stärke der ontologischen Verknüpfungen wohl massiv beeinflusst.
Insofern ist das Thema User Experience, also das über die Gebrauchstauglichkeit hinausgehende positive emotionale Erlebnis z. B. auch bei einer „banalen“ Volltextsuche vielleicht doch viel wichtiger ist, als ich ursprünglich mal dachte. So sind die Google Doodles (http://www.google.com/doodles/) vielleicht doch mehr nur als ein Gag ...
Terminologiemanagement ist eigentlich ein alter Hut. Schon seit über 20 Jahren predigen Sprachverantwortliche im Unternehmen die Bedeutung einer einheitlichen Terminologie, fanden aber in der Vergangenheit wenig Gehör. Warum ist das so? Welche Mythen begleiten die Einführung und Organisation eines Terminologiemanagements, welche historischen Hintergründe haben sie und welche Antworten haben wir heute darauf?
Haben Sie ihn schon entdeckt, den Online-Dienst Wolfram Alpha? Und auch schon ausprobiert? Wolfram Alpha bietet Antworten auf Suchanfragen konzentriert auf einer Seite. Könnte das der Standard für App-Suchen werden?
Das Jahr 2022 hat begonnen. Zeit, noch einmal die wichtigsten Entwicklungen und Entscheidungen in Bezug auf die Terminologiemanagement-Plattform [i]-match im Jahr 2021 zusammenzufassen. Im Jahr 2019 war es an der Zeit, die Software grundlegend zu überarbeiten, um eine zukunftsorientierte Cloud-Native-Lösung anzubieten. Das Jahr 2021 war somit das 2. Jahr nach Neubeginn. Das größte Thema war definitiv die Umstellung von On Premise auf Cloud Native.
Unsere Webseite verwendet Cookies. Diese haben zwei Funktionen: Zum einen sind sie erforderlich für die grundlegende Funktionalität unserer Website. Zum anderen können wir mit Hilfe der Cookies unsere Inhalte für Sie immer weiter verbessern. Hierzu werden pseudonymisierte Daten von Website-Besuchern gesammelt und ausgewertet. Das Einverständnis in die Verwendung der Cookies können Sie jederzeit widerrufen. Weitere Informationen zu Cookies auf dieser Website finden Sie in unserer Datenschutzerklärung und zu uns im Impressum.
Kommentar schreiben