Modular und flexibel: Entwicklung eines Forschungsinformationssystems am Karlsruher Institut für Technologie (KIT)

Die Vorgeschichte: Die Einrichtung eines Forschungsinformationssystems ist mehr als nur ein IT-Projekt

Das Thema Forschungsinformationen hat am KIT eine lange Historie. Das KIT entstand 2009 aus der Fusion einer Universität und einem Helmholtz-Zentrum und ist heute mit über 9.000 Beschäftigten eine der größten Forschungseinrichtungen Europas. Entsprechend komplex sind die Anforderungen an ein Forschungsinformationssystem: An beiden Standorten gab es langjährige zentrale Verzeichnisse der Forschungsinformation, aber dennoch waren die Prozesse der Datenerfassung, die Berichtsanforderungen sowie die „Kulturen“ des Einbezugs von Wissenschaftler/innen sehr unterschiedlich. Der erste Anlauf, am KIT ein integriertes Forschungsinformationssystem zu etablieren, startete 2010 kurz nach der Gründungsphase der neuen Forschungseinrichtung und war von (zu) vielen Erwartungshaltungen geprägt. Zentrale Prozesse um ein einheitliches und integriertes Informationsmanagement waren am „jungen“ KIT noch völlig ungeklärt und mussten erst in den Gremien entsprechend platziert werden. Trotz der strategischen Verankerung des Projekts beim CIO waren die eigentlichen Treiber die KIT-Bibliothek und die Abteilung Forschungsförderung, die beide das Projekt auch zur Ablösung veralteter Infrastrukturen nutzen wollten. Man entschied sich in der ersten Phase für ein kommerzielles Produkt, das versprach, die komplexen Prozesse am KIT abbilden zu können. Im Fokus stand die Implementierung eines FIS-Standardsystems. Um es vorweg zu nehmen: Das Projekt wurde eingestellt. Zum einen hatte das noch „junge“ KIT auf organisatorischer Seite noch zu viele Prozessklärungen offen, zum anderen erwies sich die Einführung einer kommerziellen Softwarelösung für eine so große Forschungseinrichtung mit sehr vielen unterschiedlichen Anforderungen als zu monolithisch und für die Belange des KIT als nicht ausreichend.

Vom Standardsystem zum modularen Ansatz

Nach Evaluation verschiedener Alternativen entschloss sich das KIT schließlich, ein Forschungsinformationssystem als „modulares System“ aufzubauen und weitgehend in Eigenregie innerhalb der Einrichtung voranzutreiben. Dazu wurde das Projekt auf organisatorischer Ebene noch einmal völlig neu aufgestellt: Strategisch ist es nun auf oberster Ebene als Teil eines am KIT entstehenden Management-Informationssystems platziert. Beteiligte sind wie im Vorgängerprojekt die KIT-Bibliothek und die Abteilung Forschungsförderung, aber es wurden weitere Teilprojekte zur Anbindung weiterer IT-Systeme am KIT (u.a. Angebots- und Auftragsmanagement, die Abteilungen für Verträge und Transferleistungen/Patente sowie Promotionen) sowie zur Integration von Stammdaten gegründet.
Der modulare Ansatz vereint verschiedene IT-Systeme für Basisdaten mit einem übergeordneten Aggregationssystem zur Bereitstellung aggregierter Daten. Die notwendige Klammer, die die Aggregation ermöglicht, ist die Verwendung gleicher Stammdaten in allen Modulen des Forschungsinformationssystems. Konzeptionell wird das Forschungsinformationssystem als „FIS by contract“ verstanden. Damit ist ein Vorgehen umschrieben, das sowohl die einheitliche und klare Definition von Schnittstellen, Datenmodellen und Metadaten als auch die aktuelle, konsistente und transparente Bereitstellung derselben durch die verschiedenen Module bzw. „Basissysteme“ voraussetzt. Die Anforderungen an das Aggregationssystem werden im Projekt mit dem vielfachen Berichtsanforderungen am KIT abgestimmt, deren Bedarfe auch in die Umsetzung bzw. Weiterentwicklung der Basissysteme zurückgespiegelt werden (z.B. im Hinblick auf Datenattribute). Parallel dazu erfolgt die Klärung von weiteren Berichtsanforderungen, die auch die umfängliche Umsetzung des KDSF beinhalten.

Die sehr vielfältigen Services des modularen Forschungsinformationssystems werden in der Endstufe den Anwendern sowohl aus den einzelnen Basissystemen als auch aus dem Aggregationssystem entsprechend ihrer Rollen zur Verfügung gestellt. Die Szenarien reichen dabei u. a. von der Erfüllung unterschiedlicher Berichtsanforderungen bis hin zur Befüllung von Forschungsprofilen und automatisch generierten Publikationslisten.
Ein ganz starker Fokus wurde bei der Neukonzeptionierung des Forschungsinformationssystems auf Nachnutzungsszenarien und damit verbunden auf die Interoperabilität der verschiedenen Basisdienste innerhalb des modularen Forschungsinformationssystems gelegt: Wissenschaftler/innen sollen freien Zugriff auf ihre Daten haben und IT-Systeme auf Seiten der Basisinfrastrukturen für den Aufbau weiterer potenzieller Mehrwertdienste entsprechend offen konzipiert sein.

Die Grundlage des modularen Forschungsinformationssystems –
Die Basissysteme

Ab 2016 erfolgte ein schrittweiser Produktivstart von Modulen des Forschungsinformationssystems. Die Module bestehen aus Basissystemen, die die betreffenden Fachabteilungen (u.a. KIT-Bibliothek und Abteilung Forschungsförderung) mit unterschiedlichen Anforderungen, Datenmodellen und Prozessen selbst verantworten. Das schafft Flexibilität und reduziert die Anforderungen auf überschaubare Arbeitspakete und Systeme. Bestehende Systeme bleiben erhalten bzw. werden in Eigenregie modernisiert, fehlende werden neu implementiert. Dieses pragmatische Vorgehen erleichtert die iterative Weiterentwicklung der Basissysteme anhand sich wandelnder Anforderungen. Die betreffenden Organisationseinheiten übernehmen selbstverständlich und dezentral die Pflege für ihre Prozesse und Infrastrukturen. Das kommt der Nachhaltigkeit und auch der Qualitätssicherung zu Gute. Voraussetzung sind auch im modularen Forschungsinformationssystem des KIT einheitliche Stammdaten für Personen, Organisationen, Forschungsstrukturen aus einer autoritativen Quelle, die über das Teilprojekt Stammdaten verantwortet werden. Die Erarbeitung von Schnittstellen aus den Basissystemen erfolgt hier in enger Kooperation unter den Modulen.

Die Anwendung im Forschungsinformationssystem – Das Aggregationssystem

Auf Seiten der IT-Infrastrukturen haben alle Basissysteme Schnittstellen für den Output in ein entstehendes und noch zu entwickelndes Aggregationssystem bereitzustellen. Das Aggregationssystem soll langfristig als zentrales Informationssystem aggregierte Daten für die Anwender verfügbar machen. Dabei sind viele Details noch offen und werden iterativ besprochen und umgesetzt. Das betrifft zum Beispiel Fragen der Abgrenzung zwischen Basis- und Aggregationssystemen auf der operativen Ebene oder die Vorhaltung von Daten in Form von ad-hoc Abfragen aus Basissystemen oder zentraler Vorhaltung.

Werkstattbericht eines Moduls – Das Basissystem der KIT-Bibliothek: Repository KITopen

Eine sehr positive Bilanz für dieses pragmatische Vorgehen zieht die KIT-Bibliothek, die im Zuge der Entwicklungsarbeiten ihr Repository KITopen auf vier Säulen gestellt hat:

KITopen-Erfassung
KITopen-Katalog
KITopen-Auswertungen
KITopen-Publikationslisten

KITopen-Erfassung verfügt mittlerweile über ein modernes User-Interface mit entsprechender Rechteverwaltung, das die dezentrale Datenerfassung und Zuarbeiten von spezifischen Forschungsinformationen durch Wissenschaftler/innen ermöglicht. Die primäre Befüllung mit Publikationsmetadaten erfolgt jedoch über Schnittstellen in weitere Quelldatenbanken wie Scopus und Web of Science, die routinemäßig Publikationen von KIT-Wissenschaftler/innen importieren. Das Repository ist in den zentralen Katalog der KIT-Bibliothek integriert (KITopen-Katalog). Der Service KITopen-Publikationslisten hat die Akzeptanz des Forschungsinformationssystems auf dem Campus regelrecht beflügelt, denn alle Publikationsdaten können tagesaktuell über eine einfache Konfiguration in das Content-Management-System des KIT eingebunden und im persönlichen und/oder institutionellen Webauftritt über unterschiedliche Darstellungs- und Sortieroptionen nachgenutzt werden. KITopen bietet weitere, offene Schnittstellen und Exportmöglichkeiten für weitere Anwendungsszenarien. Zentral für die Berichterstattung der Helmholtz-Gemeinschaft ist der Service KITopen-Auswertungen, der nicht nur die Basisdaten für die Berichte des künftigen Aggregationssystems liefert, sondern auch insgesamt die Prozesse der Datenerhebung und Qualitätssicherung für die Berichterstattung optimiert hat.

Über die Berichtsanforderungen und Mehrwertdienste eines Forschungsinformationssystems hinaus hat die KIT-Bibliothek im letzten Jahr die Volltext-Entität in KITopen vollständig überarbeitet und bietet nun moderne Open-Access-Workflows, die u.a. rechtliche Optionen der Zweitveröffentlichung sowie Verlagspolices integrieren und die Befüllung des Repository hinsichtlich der Open-Access-Indikatorik der Helmholtz-Gemeinschaft vorantreiben. Diese Flexibilität im Basissystem bedient Berichtspflichten und weitere strategische Zielsetzungen der KIT-Bibliothek gleichermaßen.

Bewertung und Ausblick

Die Vision am KIT ist nach wie vor dieselbe: Durch das Forschungsinformationssystem soll die Forschungsberichterstattung effizienter und Forschenden neue Mehrwerte bereitgestellt werden. Aber das Vorgehen im neuen und modularen Ansatz ist anders zu bewerten als im Vorgängerprojekt. Da die beteiligten Abteilungen ihre Basissysteme in Eigenverantwortung vorantreiben, passt die Entscheidung für eine modulare Eigenentwicklung zu den relativ eigenständigen Organisationsbereichen und zeitversetzten Prozessen der Großeinrichtung KIT. Die oft sehr zeitaufwändige Abstimmung von heterogenen Anforderungen der Teilbereiche eines FIS-Standardsystems ist nach diesem Ansatz deutlich reduziert. Voraussetzungen sind allerdings die Bereitstellung erheblicher Kapazitäten zur Entwicklung der Basissysteme sowie ein fachlich gut ausgearbeiteter Anforderungskatalog für die gemeinsam zu verwendenden Standards und Ressourcen. Sehr positiv zu bewerten ist, dass das KIT sich diesen Fragestellungen schrittweise innerhalb der unterschiedlichen Organisationseinheiten annähert und in der IT-Infrastruktur auch flexibel auf servicerelevante Anforderungen reagieren kann und wird. Von allen Beteiligten wird daher dieser erneute Anlauf des Forschungsinformationssystem als sehr erfolgreich bewertet, für den über die Projektressourcen hinaus langfristig Personal aus dem Bestand zur Verfügung gestellt wird. Denn, ein gutes Forschungsinformationssystem entsteht nicht einfach nur „über Nacht“, sondern es handelt sich um ein langjähriges Organisationsentwicklungsprojekt.

Gemeinsamer Blog der DINI AGs

Forschungsinformationen & Systeme | Elektronisches Publizieren | Kompetenzzentrum Interoperable Metadaten