Das DFG-Projekt SINIR () ist gleich in zweierlei Hinsicht besonders: Zum einen passt sich die entwickelte Lösung an das Suchprofil der Nutzerin oder des Nutzers an. Zum anderen ist bereits der Weg dorthin außergewöhnlich: Denn die Forscherinnen und Forscher arbeiten bei der Entwicklung fast ganz ohne reale Nutzungsdaten und ohne zeitaufwendige Tests.
„Uns geht es in dem Projekt darum, die Zugänge zu digitalen Bibliotheken zu optimieren“, erklärt Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science an der Universität Passau. Er leitet das Projekt zusammen mit Matthias Hagen, Professor für Big Data Analytics an der Martin-Luther-Universität Halle-Wittenberg, und Prof. Dr. Klaus Tochtermann, Direktor des Leibniz-Informationszentrum Wirtschaft (ZBW) in Kiel. „Mit Hilfe unserer Methode können wir den Prozess der Entwicklung entscheidend abkürzen“, so Prof. Dr. Granitzer.
Das Forschungsteam simuliert ein Bibliothekssystem und speist in dieses System eine große Menge an künstlich generierten Nutzungsdaten ein. Diese Daten bilden möglichst viele Nutzungsvorlieben ab: „Es gibt ganz unterschiedliche Suchprofile. Manche Nutzerinnen und Nutzer suchen tagtäglich, andere kommen nur einmal und schauen dann ganz gezielt nach einem konkreten Buch“, erklärt Prof. Dr. Granitzer.
Die Nutzungsmodelle simulieren also beispielsweise Anfragen, Klicks und Ergebnisinteraktionen. Ganz ohne den Einsatz vorhandener Daten geht es aber dann doch nicht: Einige Modelle trainieren die Forscherinnen und Forscher auf Basis von realen Logdaten – also jenen Dateien, die das Suchverhalten von realen Nutzerinnen und Nutzer automatisch erfassen. Diese Modelle wiederum reichert das Team mit künstlich generierten Daten an.
Diese Nutzungsmodelle helfen den Forscherinnen und Forschern dabei, die digitale Suche zu verbessern: Sie lassen Rückschlüsse zu, wie Bibliotheksdaten verschlagwortet werden müssen, damit sie besser gefunden werden. Außerdem geben sie Hinweise auf die beste Reihenfolge der Suchergebnisse.
Beteiligte und Förderung
Das entwickelte Verfahren evaluiert das Forschungsteam im Umfeld einer tatsächlich existierenden digitalen Bibliothek: der wirtschaftswissenschaftlichen Suchmaschine EconBiz. Projektpartner ist das ZBW - Leibniz-Informationszentrum Wirtschaft, die weltweit größte Spezialbibliothek für wirtschaftswissenschaftliche Literatur. Das Ergebnis stellt das Forschungsteam auch anderen digitalen Bibliotheken in Form eines Open-Source-Frameworks zur Verfügung.
Die Deutsche Forschungsgemeinschaft (DFG) fördert das Vorhaben mit der Projektnummer GR 4277/2-1, AOBJ: 651840 über eine Laufzeit von drei Jahren.