Neue Funktion für Wikipedia - aus Wuppertal

Bergische Uni : Neue Funktion für Wikipedia - aus Wuppertal

Im Rahmen eines von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts haben Wissenschaftler des Lehrstuhls für Data & Knowledge Engineering an der Bergischen Universität Wuppertal eine neue Funktion für die freie Online-Enzyklopädie Wikipedia entwickelt.

Seit Anfang Januar besteht die Möglichkeit, mathematische Formeln um die Bedeutung ihrer einzelnen Elemente zu erweitern. Die Erweiterung basiert auf der Erforschung effektiver Methoden zur automatischen Aufbereitung mathematischer Ausdrücke als maschinenlesbare Informationen. „Bei vielen Wikipedia-Artikeln fehlt eine gute Erklärung dafür, was die einzelnen Bestandteile der Formeln bedeuten. Das wiederum löst einigen Unmut bei Leserinnen und Leser aus“, erklärt Moritz Schubotz. Der Wissenschaftliche Mitarbeiter am Lehrstuhl für Data & Knowledge Engineering von Prof. Dr. Bela Gipp hat die neue Funktion gemeinsam mit Lehrstuhlkollege André Greiner-Petter entwickelt.

Ein Beispiel aus der Praxis findet sich auf der Wikipedia-Seite zur Masse-Energie-Äquivalenz – dem berühmten, von Albert Einstein entdeckten Naturgesetz – beschrieben durch die Formel „E=mc2“: Diese enthält neuerdings Informationen zu den Variablen „E“, „m“ und „c“. „Durch Klicken auf die Formel wird eine neue Informationsseite geöffnet, auf der die Bedeutungen der einzelnen Elemente sowie Links zur weiteren Beschreibung der Formel angezeigt werden“, so Schubotz. Dort erfahren die Leserinnen und Leser unter anderem, dass „E“ für Energie steht, und eine physikalische Größe darstellt. „Die Nutzerinnen und Nutzer müssen somit nicht mehr den kompletten Artikel lesen und sich in dem Fachgebiet des Artikels auskennen, um die Formel als solche zu verstehen.“

Die Wissenschaftler leisten damit einen wichtigen Beitrag für die Verarbeitung mathematischer Ausdrücke und setzen dafür auch auf Künstliche Intelligenz. „Eine entsprechende Informationsseite, wie beispielsweise die zur Äquivalenz von Masse und Energie, manuell zu erstellen, wäre sehr viel Arbeit. Daher erforschen wir Methoden, wie diese Informationen automatisch extrahiert werden können“, fasst Schubotz zusammen. Wichtige Daten zu den unterschiedlichsten Formeln stammen dabei aus der sogenannten „Wikidata“, einer zentralen, sprachunabhängigen Wikipedia-Datenbank, die von Menschen sowie von Computerprogrammen bearbeitet werden kann.

„Während die schlagwort-basierte Suche nach relevanten und verwandten Publikationen in vielen wissenschaftlichen Bereichen zu guten Ergebnissen führt, bedarf es in der Mathematik und in den Naturwissenschaften aufgrund der hohen Dichte an mathematischen Ausdrücken zusätzlicher Strategien“, merkt Schubotz an. Einen ersten Schritt stelle dabei die Aufbereitung der mathematischen Ausdrücke dar: „Diese sind in der Regel für die Darstellung optimiert und als Bilder oder in speziellen Formaten abgespeichert. Für Suchmaschinen zum Beispiel sind das schwer auffindbare Inhalte. Erst durch eine semantische Anreicherung, also das Hinzufügen von Bedeutungen, werden die Formeln zu maschinenlesbaren Informationen.“

Derartige neue Methoden sind eine Grundlage für die automatische Erkennung ähnlicher sowie verwandter mathematischer Ausdrücke. Sie helfen beispielsweise dabei, Such- und Empfehlungsdienste für wissenschaftliche Publikationen zu verbessern und ermöglichen Verlinkungen zu ähnlichen Artikeln und Informationsquellen. Schubotz: „Davon profitieren nicht zuletzt Schüler*innen sowie Studierende in naturwissenschaftlichen Fächern, die sich mathematisches Wissen mit verschiedenen digitalen Medien aneignen.“