Einführung
Seit der Veröffentlichung der Empfehlungen zur Spezifikation des Kerndatensatz Forschung (KDSF) durch den Wissenschaftsrat 2016 wird die Einführung von Forschungsinformationssystemen als zentrale Nachweis- und Berichtsinstrumente zu den eigenen Forschungsaktivitäten und -ergebnissen an vielen Hochschulen intensiv diskutiert. Dies erfolgt oft in Abstimmung aller Beteiligten innerhalb der jeweiligen Hochschule oder Forschungseinrichtung. Mit Blick auf den großen Bereich „Publikationen“ gehören zu den Beteiligten auch Bibliotheken bzw. konkret Repositorienbetreibende. An diese richtet sich dieser Blogbeitrag vornehmlich.
Für Publikationstypen gibt es anerkannte, standardisierte Beschreibungen, die auf Nachnutzung und Austausch der Metadaten und Veröffentlichungen zielen.Teil davon ist seit 2010 das Gemeinsame Vokabular für Publikations- und Dokumenttypen, das angesichts der Verbreitung und Verwendungskontexte als etabliert angesehen werden kann: für die DINI-Zertifizierung der Repositorien ist es genauso Voraussetzung wie für die Pflichtablieferung an die Deutsche Nationalbibliothek (DNB).
Analog zum Gemeinsamen Vokabular ist auch der KDSF ein definitorischer Standard zu Metadaten von Forschungsaktivitäten und -ergebnissen, der jedoch im Wesentlichen auf die Nutzung für die Forschungsberichterstattung ausgerichtet ist. Nicht in allen Belangen ist die Spezifikation des KDSF deckungsgleich mit dem Gemeinsamen Vokabular. Um eine gemeinsame Nutzung und Verbreitung der Metadaten zu Publikationen zu ermöglichen, besteht Handlungsbedarf zur Harmonisierung von KDSF und Gemeinsamem Vokabular.
DINI reagiert auf diesen Handlungsbedarf mit einer gemeinsamen Initiative der drei Arbeitsgruppen (AGs) Elektronisches Publizieren (E-Pub), Forschungsinformationssystem (FIS) und Kompetenzzentrum Interoperable Metadaten (KIM).
Ziel ist es, auf eine Kompatibilität von KDSF und Gemeinsamen Vokabular hinzuwirken, damit sowohl eine KDSF-konforme Forschungsberichterstattung als auch der Betrieb von Repositorien mit ihren zugehörigen Ablieferungspflichten (DNB, OpenAIRE) sichergestellt werden können.
Im ersten Schritt wurden die Spezifikation des KDSF und das Gemeinsame Vokabular detailliert verglichen, um die für eine Kompatibilität notwendigen Änderungen bzw. Weiterentwicklungen für beide Standards zu bestimmen.
- In einigen Fällen ist ein direktes Mapping von Publikationstypen möglich.
- In vielen Fällen ist der KDSF differenzierter als das Gemeinsame Vokabular. Dazu wurde festgehalten, dass im Rahmen einer Aktualisierung des Gemeinsamen Vokabulars eine Hierarchisierung eingeführt werden soll. Dies ermöglicht in Zukunft eine spezifischere Berichterstattung, die KDSF-konform ist. Eine umfangreiche Migration von Altdaten mit einer weniger spezifischen, gemäß dem aktuell gültigen Gemeinsamen Vokabular erfolgten Erfassung, ist jedoch nicht erforderlich.Trotzdem wird es Interpretationsspielraum geben hinsichtlich dessen, was nach dem KDSF ausgeliefert wird.
- Einige Definitionen im KDSF sind nicht eindeutig und die Anforderungen damit nur bedingt umsetzbar.
Zur Umsetzung dieser Ergebnisse wurden zum einen im Winter 2019 Empfehlungen an den Beirat des Helpdesk des KDSF übermittelt mit der Bitte um Berücksichtigung im Rahmen der kontinuierlichen Weiterentwicklung des KDSF. Zum anderen gibt es konkrete Anregungen für die Aktualisierung des Gemeinsamen Vokabulars, die in den nächsten Monaten angegangen werden. Weiterhin wurde ein Mapping zwischen dem Gemeinsamen Vokabular und den KDSF-Begriffen erstellt. Auf Anfrage kann dieses Mapping, das eine reine Empfehlung darstellt, gern auch zugesandt werden.
Gemeinsame Empfehlungen für den Bereich „Publikationen“ des KDSF
Im folgenden werden die gemeinsamen Empfehlungen kurz vorgestellt:
Vorschläge zur Einführung neuer Publikationstypen in den KDSF
Aus Sicht der AGs erscheint eine Erweiterung des KDSF um drei neue Publikationstypen sinnvoll, die im Folgenden detailliert dargestellt werden: Konferenzbeiträge, Konferenzbände sowie Internetplattformen (Blogs, Webauftritte,…).
Konferenzbeitrag
- Beiträge auf wissenschaftlichen Konferenzen und Tagungen sind unter anderem in den Ingenieurwissenschaften, übliche Publikationsformen. Im gegenwärtigen Stand der Spezifikationen des KDSF spiegeln sich die verschiedenen Formen von Konferenzbeiträgen nicht umfänglich bzw. explizit ausdifferenziert wider.
- Es wird daher empfohlen, einen neuen Publikationstyp ‘Konferenzbeitrag’ einzuführen, der sich in die Untertypen ‘Poster’, ‘Vortragsfolien’, ‘Meeting Abstract’ und ‘Beitrag/Paper’ gliedert. Dabei ist der bereits vorhandene Dokumenttyp ‘Meeting Abstract’ (Pu48) zu berücksichtigen und in der Definition zu schärfen. Darüber hinaus sollten die vorhandenen Publikationstypen ‘Konferenzposter’ (Pu26) und ‘Wissenschaftliche Vortragsfolien’ (Pu44) integriert werden.
- Die Definition des bestehenden Publikationstyps ‘Artikel’ (Pu25) muss dementsprechend ‘Konferenzbeiträge’ (z. B. ‘Meeting Abstract’) explizit ausschließen.
Konferenzband
- Neben Beiträgen auf wissenschaftlichen Konferenzen (vgl. 2.1) haben auch herausgegebene Konferenzbände gegenüber weiteren Formen des Sammelbands in verschiedenen Disziplinen eine gesonderte Bedeutung. Konferenzbände sollten daher als eigenständiger Publikationstyp im KDSF ausgewiesen werden.
- Es wird vorgeschlagen, Konferenzbände als Untertyp zu ‘Buch’ (Pu22) (ggf. als Element der Schale) einzuführen. In der bibliothekarischen Praxis wird ‘Konferenzband’ im Allgemeinen explizit als Untertyp eines Sammelbands (siehe Publikationstyp ‘Sammelband’ (Pu23) oder als Teil einer Serie (Periodikum) kenntlich gemacht. Hierbei ist zu beachten, dass die bestehende Definition von ‘Sammelband’ (Pu23) entsprechend durch explizites Ausschließen von Konferenzbänden angepasst werden müsste.
Internetplattformen (Blogs, Webauftritte,…)
- Nicht zuletzt im Zusammenspiel mit Entwicklungen im Bereich Open Science und Open Research erfahren Publikationswege abseits der üblichen akademischen Formate zunehmend an Bedeutung, über die Erkenntnisse frühzeitig geteilt, offen zugänglich, kommentiert und interaktiv erlebbar und nachvollziehbar gemacht werden können.
- Es wird daher angeregt, einen Publikationstyp einzuführen, der Webseiten, Webauftritte und Blogs über den bestehenden Publikationstyp ‘Beiträge/Interviews in nicht-wissenschaftlichen Medien’ (Pu39) hinaus abdeckt. Im bibliothekarischen Regelwerk wird hierfür der Begriff ‘Integrierende Ressource’ verwendet. Hierbei geht es aber nicht um einzelne Beiträge, sondern um Blogs und Webauftritte als Gesamtkonzept.
- Es wird daher empfohlen, Blogbeiträge differenzierter zu erfassen – sind diese nicht wissenschaftlich, sollten sie wie bereits im KDSF vorgesehen als ‘Beiträge/Interviews in nicht-wissenschaftlichen Medien’ (Pu39) erfasst werden. Zusätzlich sollte eine weitere Abgrenzungsmöglichkeit für Beiträge in wissenschaftlichen Blogs in Form eines weiteren Publikationstyps eingeführt werden.
Empfehlungen zur Weiterentwicklung der Definitionen im Bereich ‘Publikationen’ des KDSF
Die Auseinandersetzung mit dem KDSF in der übergreifenden AG hat gezeigt, dass auf zwei Ebenen im Bereich der Publikationen Bedarf an einer Schärfung von Definitionen vorhanden ist.
Hierarchie zwischen Publikations- und Dokumenttyp
Die eine Ebene betrifft die Hierarchie zwischen Publikations- und Dokumenttyp (Pu6 bzw. Pu101). Es scheint, als sei ‘Dokumenttyp’ (Pu101) immer ein Untertyp, eine Spezifikation von ‘Publikationstyp’ (Pu6). In manchen Fällen werden inhaltliche Kriterien (wie bspw. bei ‘Quellenedition’ (Pu47 bzw. Pu130), ‘Bibliographie’ (Pu24 bzw. Pu129), in anderen Fällen hingegen formale Kriterien zur Unterscheidung zwischen Publikations- und Dokumenttyp herangezogen. Zudem kommen die Typen ‘Quellenedition’ und ‘Bibliographie’ sowohl als Publikationstyp (Pu47 bzw. Pu24) als auch als Dokumenttyp (Pu130 bzw. Pu129) vor.
Vor diesem Hintergrund wird empfohlen, eine Konsistenz in der Verwendung von Publikationstypen und Dokumenttypen zu schaffen. Hierzu würde unter anderem beitragen, wenn einzelne Typen nur auf einer der beiden Ebenen (Publikations- oder Dokumenttyp) – und nicht wie gegenwärtig auf beiden Ebenen – vorkommen. Dazu werden folgende Alternativen vorgeschlagen:
- ‘Dokumenttypen’ (Pu101) werden als Unterordnung des Publikationstyps ‘Artikel’ (Pu25) abgeschafft oder
- ‘Dokumenttypen’ werden ebenfalls beim Publikationstyp ‘Buch’ (Pu22) eingeführt.
Sollte diese Über-/Unterordnung Fortbestand haben, wird weiterhin empfohlen, die Begrifflichkeiten so anzupassen, dass nicht mehr zwischen ‘Publikationstyp’ und ‘Dokumenttyp’, sondern zwischen ‘Publikationstyp’ und ‘Unter/Sub-Publikationstyp’ unterschieden wird.
Definition spezieller Publikationstypen
Die zweite Ebene betrifft die Definition der Publikationstypen: ‘ePaper’ (Pu29) und ‘Forschungsdaten’ (Pu38) sowie des Merkmals ‘Ressource’ (Pu102).
‘ePaper’ (Pu29)
- Die gegenwärtige Definition erscheint sehr weit und damit unscharf gefasst. So könnten Artikel, die in einer rein digital publizierten Zeitschrift erscheinen, sowohl als ‘ePaper’ (Pu29) als auch als ‘Journalartikel’ (Pu11) definiert werden.
- Es ist nicht eindeutig, wofür das ’e‘ vor dem Begriff ‘Paper’ steht. In diesem Zusammenhang stellt die beispielhafte Nennung in der bestehenden Definition von ‘Preprints’ keine eindeutige und abschließende Definition dar Auch impliziert der Verweis auf den Veröffentlichungsort bei ‘ePaper’ einen Bruch mit der Klassifikation der restlichen Unterkategorien des Publikationstyps ’Artikel’ (Pu25), die rein formal sind (vgl. ‘Journalartikel’ (Pu11) und ‘Sammelbandbeitrag‘’(Pu23).
- In diesem Zusammenhang empfiehlt sich auch eine eindeutige Abgrenzung zum Publikationstyp ‘Arbeitspapier/Forschungsbericht’ (Pu37) und zum Dokumenttyp ‘Wissenschaftlichen Artikel’ (Pu112). So ist beispielsweise nicht klar, ob Thesen- und Positionspapiere unter ‘ePaper’ aufzufassen sind.
Forschungsdaten
- Es wäre wünschenswert, wenn der Publikationstyp ‘Forschungsdaten’ (Pu38) genauer definiert und Erläuterungen hierzu formuliert würden. So wäre einerseits eine Aufzählung von Typen von Forschungsdaten hilfreich, die auch einschließt, ob nur digitale oder auch analoge Daten gemeint sind. Andererseits sind Abgrenzungen notwendig, da auch Publikationen Forschungsdaten darstellen können.
Ressource
- Es scheint, dass das Merkmal ‘Ressource’ (Pu102) mit seinen nach der Erscheinungsform differenzierten Ausprägungen (Text, Bild, Audio, bewegte Bilder) einerseits einen gewissen Bezug zu Publikationstypen aufweist, auf der anderen Seite jedoch auf einer anderen Ebene als die weiteren Merkmale von Publikationstypen zu stehen scheint. Der Bezug dieses Merkmals zu den weiteren Merkmalen wie auch die Definition der Ausprägungen bleiben hingegen unklar.
- Daher wäre es wünschenswert, wenn die Beziehung von ‘Ressource’ zu den anderen Merkmalen einer Publikation sowie des Merkmals und dessen Ausprägungen eindeutig definiert würde.
Fazit
Harmonisierung von KDSF und Gemeinsamen Vokabular
Für Repositorienbetreibende kann sich aus der Harmonisierung von KDSF und Gemeinsamen Vokabular die Konsequenz ergeben, dass die Erfassungen im Repositorium zu ändern sind – so kann es z.B. notwendig werden, neue Publikationstypen einzuführen.
Daher sollte zunächst innerhalb der eigenen Institution geklärt werden, in welcher Form und mit welchen Datenquellen eine KDSF-konforme Berichterstattung erfolgen soll. Denn die Spezifikation des KDSF verpflichtet nicht, die Daten 1:1 in den spezifizierten Strukturen des KDSF zu erheben, sondern die relevanten Datenquellen (u. a. auch Repositorien) hierzu kompatibel zu machen, sodass hieraus KDSF-konforme Berichte erstellt werden können. Unabhängig hiervon obliegt es stets den abliefernden Institutionen, welche Daten sie bei einer Anfrage ausliefern wollen oder können.
Einbettung in/Beziehung zu internationalen Vokabularen
Aktuell gibt es im Bibliotheksbereich mehrere Vokabulare für Publikationstypen, die sich im Hinblick auf Aktualität und geographische Verbreitung unterscheiden. Das Gemeinsame Vokabular der DINI ist im deutschsprachigen Raum verbreitet, während das in den OpenAIRE-Guidelines verwendete Vokabular in europäischen Projektzusammenhängen entstanden ist. Das Vokabular der Confederation of Open Access Repositories (COAR) auf internationaler Ebene ist im Begriff die OpenAIRE-Definitionen abzulösen.
Es muss jedoch festgehalten werden, dass sich Vokabulare erst mit erheblichem Zeitverzug in der Praxis durchgesetzt haben. DINI-Vokabulareinträge (im nationalen Rahmen) und OpenAIRE-Einträge kommen inzwischen in Publikationsmetadaten in großer Anzahl vor, während die vergleichsweise neuen COAR-Publikationstypen in der Praxis noch eine sehr geringe Rolle spielen.
Für Repositorienbetreibende bleibt aktuell die Aufgabe, sich auf die Vergabe von Metadaten für Publikationstypen in ihrem Repository-System zu konzentrieren. Dafür, dass diese Metadaten sowohl mit dem Gemeinsamen Vokabular als auch mit COAR konsistent sind, können Repositoriumsbetreibende Sorge tragen. Für die Kompatibilität mit dem KDSF wurden im Rahmen unserer Initiative erste Empfehlungen formuliert. Die Umsetzung der Anpassungen der (inter)nationalen Vokabulare erfolgt üblicherweise über das Einspielen neuer Softwareversionen und liegt damit nicht direkt in den Händen der Repositoriumsbetreibenden. Diese zukünftigen Lösungen müssen die gängigen Vokabulare unterstützen und dabei auch die KDSF-Kompatibilität berücksichtigen.
Unsere Initiative freut sich über Feedback von Repositoriumsbetreibenden und anderen Personen, die sich mit den Definitionen im Bereich Publikationen beschäftigen – gerne auch direkt als Kommentar auf diesen Blogbeitrag.
Autorin und Autoren
Dieser Beitrag ist verfasst von Kathrin Höhner, Sebastian Herwig und Friedrich Summann.
Zitiervorschlag
Hoehner, Kathrin, Sebastian Herwig, and Friedrich Summann. „Gemeinsame Empfehlung Der DINI AGs E-Pub, FIS Und KIM Zum Kerndatensatz Forschung.” Blog der DINI AGs FIS & EPUB, 2020. https://doi.org/10.57689/DINI-BLOG.20200217.
Dieser Beitrag – ausgenommen Zitate und anderweitig gekennzeichnete Teile – ist lizenziert unter der Creative Commons Namensnennung 4.0 International Lizenz (CC BY 4.0).
Es wäre hilfreich (z. B. für Repositorienbetreibende), wenn ein Mapping zwischen Gemeinsamen Vokabular, COAR, info:repo-eu und KDSF bereitgestellt wird, damit die im Beitrag erwähnte Kompatibilität hergestellt werden kann. Die Auslieferung der Metadaten auf Basis eines solchen Mappings hängt nicht unbedingt mit der eingesetzten Softwareversion zusammen.
„Denn die Spezifikation des KDSF verpflichtet nicht, die Daten 1:1 in den spezifizierten Strukturen des KDSF zu erheben, sondern die relevanten Datenquellen (u. a. auch Repositorien) hierzu kompatibel zu machen, sodass hieraus KDSF-konforme Berichte erstellt werden können. Unabhängig hiervon obliegt es stets den abliefernden Institutionen, welche Daten sie bei einer Anfrage ausliefern wollen oder können.“
Ich mich frage, welche Datenqualität am Ende in der Forschungsevaluation zu erwarten ist, wenn zwei verschiedene Anwendungsfälle auf dieser Weise kompatibel gemacht werden. Einerseits die Veröffentlichung im Repository, bei der die Metadaten meist durch die/den Verfasser*in eingegeben wird und m. E. n. nur selten durch Fachpersonal geprüft (gegen welche Anforderung?) wird. Und andererseits die Forschungsberichterstattung, deren Anforderungen zum Zeitpunkt der Veröffentlichung noch keine Rolle spielen.
Bei dem Mapping zwischen Gemeinsamem Vokabular und KDSF denken wir COAR soweit möglich mit. Hierbei sind sowohl auf Seiten des KDSF als auch beim Gemeinsamen Vokabular Änderungsbedarfe aufgefallen. Als AGs der DINI haben wir bezogen auf das Gemeinsame Vokabular selbst die Gestaltungshoheit und daher beim Mapping den Fokus daraufgelegt. Zudem können Änderungen bei COAR deutlich langsamer erfolgen als es bei dem Gemeinsamen Vokabular der Fall ist, weshalb wir uns für die Anpassung von letzterem entschieden haben. Für die Zukunft ist nicht ausgeschlossen, dass auch Mappings zu anderen Standards wie bspw. info:repo-eu angegangen werden. Dies muss aber nicht nur durch die DINI erfolgen. Hierzu ist selbstverständlich die gesamte Community eingeladen.
Bezüglich Ihrer zweiten Frage zur Datenqualität: einerseits etablieren sich mit der Einführung von FIS Prozesse der Qualitätskontrolle bei der Erfassung von Publikationsdaten. Ob diese nun im Repositorium oder im angeschlossenen FIS erfolgt, ist je nach Einrichtung verschieden. Zum anderen ermöglicht die Harmonisierung von Gemeinsamen Vokabular und KDSF, dass bei der Erfassung von Publikationen in Repositorien in Zukunft schon ein Augenmerk auf die Erhebung und Qualitätssicherung von Metadaten gerichtet wird, die für eine spätere Forschungsberichterstattung notwendig sind. Positiv betrachtet profitiert durch die Dualität der Nutzung der Daten der Anwendungsfall mit einem geringen Qualitätsanspruch von dem mit dem höheren Anspruch.