Als Fachinformationsdienst stellen wir künftig Teile unseres Datenbestandes auch in Form von Linked Data in einem Wissensgraph zur Verfügung. Hier stellen wir Informationen über unser Projekt bereit und dokumentieren unsere Fortschritte. Der Wissensgraph Bildung ist ein Projekt des Fachinformationsdienst Erziehungswissenschaft und Bildungsforschung und wird von der Deutschen Forschungsgemeinschaft (DFG) gefördert.
Wir freuen uns sehr über Ihr Interesse am Projekt - wenn Sie darüber hinaus an einem Erfahrungsaustausch interessiert sind, dann freuen wir uns noch mehr über eine Kontaktaufnahme!
Schnellzugriff auf Themen
- Konzeptuelles Modell des Wissensgraph Bildung
- Wissenschaftliche Zeitschriften
- Bildungsspezifische Schlagwörter
- Download: Zeitschriftendaten
- Download: Schlagwortdaten
- Download: Demonstrator Schlagwortseiten
Konzeptuelles Modell des Wissensgraph Bildung
Das Modell ist eine übergreifende Beschreibung der im Wissensgraph existierenden Ressourcenarten, wobei im Wissensgraph Bildung die für unseren FID zentralen Informationsobjekte im Mittelpunkt stehen. Für diesen Projektabschnitt sind das hauptsächlich Zeitschriften, Personen, Forschungsdaten und Schlagwörter. Verbindende Ressource sind dabei bibliographische Nachweise.
Download: Nach Ressourcenart getrennte Darstellung (PDF)
Wissenschaftliche Zeitschriften im Wissensgraph Bildung
Der Ausbau des Wissensgraph Bildung erfolgt schrittweise nach Ressourcentypen. Die Umsetzung wurde mit dem Typ "wissenschaftliche Zeitschrift" begonnen, wobei die technischen Grundlagen für eine bedürfnisangepasste Umsetzung gelegt werden mussten. Eine dabei elementare Komponente sind die vielfältigen Ontologien, die auf dem Resource Description Framework (RDF) aufbauen.
Die Entwicklung des Wissensgraph Bildung wird durch die Entwicklung von neuen Angeboten im Fachportal Pädagogik flankiert. Neue Zeitschriften-Detailseiten sollen Informationen zu wissenschaftlichen Zeitschriften bündeln, neue Informationen anreichern und für Nutzer*innen darstellen. Darüber hinaus werden diese Zeitschriftenseiten mit einem vom Suchsystem entkoppelten URI permanent adressierbar gemacht.
Bei der Datenmodellierung wurde deutlich, dass für die FID-spezifischen Datenanforderungen mehrere Vokabularien einbezogen werden müssen, weshalb eine Reihe von Anwendungsprofilen recherchiert wurden. Unsere Auswahl fiel auf das DINI AG KIM Anwendungsprofil , wobei noch Anpassungen vorgenommen wurden.
Aufgrund der Ähnlichkeit unseres Anwendungsprofils mit dem der Zeitschriftendatenbank erhoffen wir uns im weiteren Verlauf eine vereinfachte Anreicherung unseres Datenbestands mit Zusatzinformationen.
Obige Grafik zeigt die wissenschaftliche Zeitschrift, modelliert mit der Klasse bibo:Periodical, im Zentrum. Davon ausgehend sind die beschreibenden Eigenschaften dargestellt mit typischen Wertausprägungen. Angewandt auf eine konkrete Zeitschrift ergibt sich beispielsweise ein RDF-Datensatz wie dieser:
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix ffp-zs: <https://www.fachportal-paedagogik.de/zeitschrift/> .
@prefix lexvo: <http://lexvo.org/id/iso639-3/> .
@prefix ncit: <http://purl.obolibrary.org/obo/NCIT_> .
@prefix rdact: <http://rdvocab.info/termList/RDACarrierType/#> .
@prefix rdau: <http://rdaregistry.info/Elements/u/#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix schema: <https://schema.org/> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1038 a ncit:C93226,
bibo:Periodical ;
rdfs:label "Vierteljahrsschrift für wissenschaftliche Pädagogik" ;
dc:publisher "Paderborn, Deutschland : Brill, Ferdinand Schöningh" ;
dc:subject "Allgemeine Erziehungswissenschaft"@de ;
dc:title "Vierteljahrsschrift für wissenschaftliche Pädagogik" ;
dcterms:language lexvo:deu ;
bibo:issn "0507-7230",
"2589-0581" ;
rdau:P60048 rdact:1018,
rdact:1049 ;
rdau:P60128 [ a schema:PropertyValue ;
schema:name "Erscheinungsverlauf"@de,
"Publication History"@en ;
schema:value "Band 1, Ausgabe 1 (1925)-" ;
schema:valueReference "online" ],
[ a schema:PropertyValue ;
schema:name "Erscheinungsverlauf"@de,
"Publication History"@en ;
schema:value "1.1925 - 9.1933; 26.1950 -" ;
schema:valueReference "print" ] ;
rdau:P60327 <https://d-nb.info/gnd/37157-9>,
<https://d-nb.info/gnd/38796-4> ;
schema:identifier [ a schema:PropertyValue ;
schema:name "ZDB-ID" ;
schema:value "200394-6" ;
schema:valueReference "print" ],
[ a schema:PropertyValue ;
schema:name "ZDB-ID" ;
schema:value "2912637-X" ;
schema:valueReference "online" ] ;
schema:sameAs <https://ld.zdb-services.de/resource/200394-6>,
<https://ld.zdb-services.de/resource/2912637-X> ;
schema:subjectOf ffp-zs:vierteljahrsschrift-fuer-wissenschaftliche-paedagogik-1038 ;
schema:url "http://www.bibliothek.uni-regensburg.de/ezeit/?2912637",
"https://brill.com/vfp",
"https://v2.sherpa.ac.uk/id/publication/35069",
"https://www.fachportal-paedagogik.de/zeitschrift/vierteljahrsschrift-fuer-wissenschaftliche-paedagogik-1038" .
ZDB-ID
Unser Anwendungsszenario sieht vor, dass für eine Zeitschrift der aktuellste Print- und Onlineeintrag bei der ZDB referenziert wird. Die Empfehlungen des DINI AG KIM Anwendungsprofils waren hier nicht weitreichend genug, um die Zusatzinformation "print vs. online" abzubilden und um auch die Art des Identifiers explizit auszusagen. Die ZDB-ID wird mit schema:PropertyValue in Verbindung mit schema:identifier realisiert:
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix schema: <https://schema.org/> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1038 a bibo:Periodical ;
...
schema:identifier [ a schema:PropertyValue ;
schema:name "ZDB-ID" ;
schema:value "200394-6" ;
schema:valueReference "print" ],
[ a schema:PropertyValue ;
schema:name "ZDB-ID" ;
schema:value "2912637-X" ;
schema:valueReference "online" ] ;
...
Ebenso verlinken wir unsere Ressource via schema:sameAs Property mit der entsprechenden ZDB-Ressource (siehe DINI AG KIM Anwendungsprofil S. 13 i.V.m. S.15):
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix schema: <https://schema.org/> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1038 a bibo:Periodical ;
...
schema:sameAs <https://ld.zdb-services.de/resource/200394-6>,
<https://ld.zdb-services.de/resource/2912637-X> ;
...
Erscheinungsverlauf
Da Print- und Onlineausgabe mitunter voneinander abweichende Erscheinungsverläufe haben, wird wie bei der ZDB-ID schema:PropertyValue benutzt, um die Erscheinungsverläufe unterscheidbar zu speichern:
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix rdau: <http://rdaregistry.info/Elements/u/#> .
@prefix schema: <https://schema.org/> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1038 a bibo:Periodical ;
...
rdau:P60128 [ a schema:PropertyValue ;
schema:name "Erscheinungsverlauf"@de,
"Publication History"@en ;
schema:value "Band 1, Ausgabe 1 (1925)-" ;
schema:valueReference "online" ],
[ a schema:PropertyValue ;
schema:name "Erscheinungsverlauf"@de,
"Publication History"@en ;
schema:value "1.1925 - 9.1933; 26.1950 -" ;
schema:valueReference "print" ] ;
...
"Peer Review" Merkmal
Im DINI AG KIM Anwendungsprofil ist zur Codierung kein Vokabularelement mit entsprechender Semantik für die "Zeitschriftenebene" vorhanden. Zwar existiert in bibo eine Peer Review Property, diese bezieht sich jedoch explizit auf ein einzelnes Dokument (bibo:Document i.V.m. bibo:DocumentStatus) und nicht wie notwendig auf eine bibo:Collection bzw. bibo:Periodical.
Die aktuelle Realisierung besteht darin, auch die Klasse ncit:C93226 als Annotation zu verwenden. Diese Klasse ist definiert als:
A publication that contains original articles that have been written by scientists and evaluated for technical and scientific quality and correctness by other experts in the same field.
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix ncit: <http://purl.obolibrary.org/obo/NCIT_> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1039 a ncit:C93226,
bibo:Periodical ;
rdfs:label "Vocations and Learning" ;
...
Anmerkung Die Abwesenheit einer ncit:C93226 Annotation ist als "Peer Review Status ist unbekannt" zu verstehen.
"Open Access" Merkmal
Zur Repräsentation von Lizenzinformationen in RDF bieten die im Anwendungsprofil inkludierten Ontologien mehrere Alternativen, z.B. auch eine Property mit booleschem Wertebereich schema:isAccessibleForFree. Dies wäre wohl eine einfache Form der Codierung. Aufgrund der mehrschichtigen Bedeutung von Open Access haben wir uns aber für eine Modellierung mit dcterms:rights in Kombination mit einer RDF Blank Node entschieden (siehe DINI AG KIM Anwendungsprofil, S. 8).
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix ncit: <http://purl.obolibrary.org/obo/NCIT_> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:1042 a ncit:C93226,
bibo:Periodical ;
rdfs:label "Waikato Journal of Education" ;
...
dcterms:rights [ rdfs:label "Open Access (DOAJ)" ] ;
...
Anmerkung Die Abwesenheit einer dcterms:rights Aussage ist als "Open Access Status ist unbekannt" zu verstehen.
Sprache
Das DINI AG KIM Anwendungsprofil stellt mehrere Alternativen zur Auswahl, wir codieren die Sprachangabe wie folgt mit lexvo:
@prefix bibo: <http://purl.org/ontology/bibo/> .
@prefix dcterms: <http://purl.org/dc/terms/> .
@prefix lexvo: <http://lexvo.org/id/iso639-3/> .
@prefix ncit: <http://purl.obolibrary.org/obo/NCIT_> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix wgb-zs: <https://graph.fachportal-paedagogik.de/journal/> .
wgb-zs:236 a ncit:C93226,
bibo:Periodical ;
rdfs:label "Education Policy Analysis Archives" ;
...
dcterms:language lexvo:eng,
lexvo:por,
lexvo:spa ;
...
Schlagwörter
Im Rahmen des Projekts werden bildungsbezogene, fachspezifische Begriffe in den Wissensgraph integriert. Ausgegangen wird vom Schlagwortbestand der FIS Bildung Literaturdatenbank, der sowohl Allgemein- als auch Fachbegriffe enthält, sowie auch Geografika, Personen und Körperschaften. Entsprechend der Ausgangslage wird zunächst ein abgegrenzter Teil dessen, ein fachlicher Kernwortbestand, im Wissensgraph repräsentiert.
Zur Integration werden diese Begriffe und ihre Begriffsbeziehungen nach dem SKOS Standard transformiert, der zentral für die Repräsentation von Taxonomien, Thesauri und ähnlichen Systemen zur Wissensrepräsentation in RDF Graphen ist. Im Weiteren werden dann, analog zum Vorgehen bei wissenschaftlichen Zeitschriften, die Entitäten mit Informationsseiten im Fachportal Pädagogik repräsentiert, sowie die Datenbasis als Linked Open Data veröffentlicht.
Zur Orientierung bei der Umsetzung eines Schlagwortbestands mit SKOS gibt es zahlreiche ähnlich gelagerte Projekte. Das Leibniz Institut für Sozialwissenschaften (GESIS) transformierte zum Beispiel den Thesaurus Sozialwissenschaften "TheSoz" bereits 2009 und veröffentlichte Aufsätze über die Arbeiten. Der Standardthesaurus Wirtschaft (STW) der ZBW wird auch wie TheSoz als Linked Open Data nach dem SKOS Standard zur Verfügung gestellt. Bei der Europäischen Union wird EuroVoc, ein multilingualer Thesaurus auf Basis von SKOS, gepflegt. Auch GND Sachschlagwörter werden als Linked Open Data angeboten, jedoch nach der GND Ontologie und nicht nach dem SKOS Standard.
Anreicherung mit Identifikatoren aus GND und WikiData
Im Zuge des Projekts werden Schlagwörter aus dem FIS Bildung Bestand mit Indentifikatoren aus der GND angereichert. Somit werden Verknüpfungen zwischen beiden Korpora aufgebaut. Dazu werden zunächst entsprechende GND Sachschlagwörter mit Hilfe der Software OpenRefine zugeordnet. Der lobid-gnd Dienst schlägt dabei mögliche Entsprechungen vor, die über das OpenRefine Interface akzeptiert oder abgelehnt werden können. Nachdem eine GND-ID zugeordnet ist, kann dann aus den GND-Daten auch eine entsprechende WikiData ID bezogen werden.
Angereicherter Export des Begriffs "Religionsunterricht", mit Beschränkung der Begriffsbeziehungen auf den Kernwortbestand (OB_IDs, UB_IDs, VB_IDs) - zur besseren Darstellung hier transponiert:
DESKRIPTOR | Religionsunterricht |
---|---|
SYNONYME | Religionslehre; Religionskunde |
OBERBEGRIFFE | Unterricht |
UNTERBEGRIFFE | Jüdischer Religionsunterricht; Konfessioneller Religionsunterricht; Außerschulischer Religionsunterricht; Ökumenischer Religionsunterricht; Islamischer Religionsunterricht |
VERWANDTE_BEGRIFFE | Religionserziehung; Vergleichende Religionspädagogik; Bibeldidaktik; Religionspädagogik; Bibelschule; Religion; Koranschule; Glaubensvermittlung; Konfirmandenunterricht; Firmunterricht; Bibelkunde |
DESKRIPTOR_ID | 10615 |
ÜBERSETZUNGEN | Teaching of religion; Religious instruction |
OB_IDs | 43996 |
UB_IDs | 26562 |
VB_IDs | 4641 |
BENUTZE_FÜR | Religionskundeunterricht; Religionskundlicher Unterricht; Schulfach Religion; Schulfach Religionslehre |
SLUG | religionsunterricht-10615 |
OB_SLUG | unterricht-43996 |
UB_SLUG | konfessioneller-religionsunterricht-26562 |
VB_SLUG | religionspaedagogik-4641 |
DESKRIPTOR_GND_GNDID | 4049422-6 |
DESKRIPTOR_GND_QID | Q1412471 |
Konvertierung der tabellarischen Daten nach SKOS
Nach der Anreicherung mit Identifikatoren werden die tabellarischen Daten mit einem Python-Skript in RDF-Tripel konvertiert. Prinzipiell werden dazu die Spalten der Eingabedatei auf SKOS Vokabularelemente abgebildet, wobei jede Zeile in einer Entität vom Typ skos:Concept resultiert.
Die resultierende SKOS-Repräsentation des Begriffs "Religionsunterricht", mit Beschränkung der Begriffsbeziehungen auf den Kernwortbestand:
@prefix fpp-sw: <http://www.fachportal-paedagogik.de/deskriptor/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix schema: <https://schema.org/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix wg-sw: <http://graph.fachportal-paedagogik.de/descriptor#> .
wg-sw:10615 a skos:Concept ;
rdfs:seeAlso fpp-sw:religionsunterricht-10615 ;
skos:altLabel "Religionskunde"@de,
"Religionslehre"@de,
"Religious instruction"@en,
"Teaching of religion"@en ;
skos:broader wg-sw:43996 ;
skos:hiddenLabel "Religionskundeunterricht"@de,
"Religionskundlicher Unterricht"@de,
"Schulfach Religion"@de,
"Schulfach Religionslehre"@de ;
skos:inScheme <http://graph.fachportal-paedagogik.de/kwb> ;
skos:narrower wg-sw:26562 ;
skos:prefLabel "Religionsunterricht"@de ;
skos:related wg-sw:4641 ;
schema:sameAs "http://www.wikidata.org/entity/Q1412471",
"https://d-nb.info/gnd/4049422-6" .
Da sich die Bedeutung eines Begriffes maßgeblich durch seine Beziehungen zu anderen Begriffen bestimmt und die Zuordnung mit OpenRefine dies nicht berücksichtigt, kann nicht garantiert werden, dass ein Deskriptor im FIS Kernwortbestand immer in den exakt gleichen Begriffsbeziehungen steht wie das zugeordnete GND Sachschlagwort. Deshalb wird, wie bei den wissenschaftlichen Zeitschriften, schema:sameAs zur Verweisung auf offizielle Normdaten verwendet, siehe DINI AG KIM Anwendungsprofil S. 13 i.V.m. S.15. Eine Aussage der absoluten Gleichheit (Identität) mit owl:sameAs könnte, extrapoliert über mehrere Hierarchie- und Verwandschaftsebenen, zu falschen Aussagen führen.
Für die lokale Entwicklungsarbeit am Wissensgraphen wird die Software GraphDB 10 in der kostenfreien Version verwendet. Eine Visualisierung aus dem Programm stellt einen Ausschnitt des resultierenden RDF-Graphen dar:
Repräsentation von Schlagwörtern im Fachportal Pädagogik
Der Schlagwortbestand soll im Fachportal Pädagogik interaktiv erfahrbar gemacht werden. Basierend auf den angereicherten Daten sind derzeit Informationsseiten für die Deskriptoren in Entwicklung.
Das Nutzungskonzept besteht aus alphabetischen Indexseiten und untereinander verlinkten Deskriptorenseiten. Über die Indexseiten wird auf einzelne Deskriptorenseiten zugegriffen. Deskriptorenseiten weisen - entsprechend den Begriffsbeziehungen - Links zu anderen Deskriptorenseiten auf. Es sind jedoch nur solche Deskriptoren verlinkt, die Teil des Kernwortbestands sind. Begriffe die nicht Teil des Kernwortbestands sind, sind nicht interagierbar, d.h. sie sind nicht klickbar. Diese Begriffe sind auch nicht in Indexseiten und nicht im SKOS Datensatz repräsentiert. Neben den Verlinkungen innerhalb des Kernwortbestands werden, sofern verfügbar, externe Links auf GND und WikiData angeboten.
Aktuell sind diese Arbeiten noch nicht abgeschlossen, eine Vorabversion ist hier verfügbar:
Download: Demonstrator Deskriptorenseiten
Hierfür ist keine Installation notwendig; der Inhalt besteht lediglich aus statischen HTML-Seiten. Entpacken sie den Inhalt in einen beliebigen Ordner und öffnen Sie eine der Dateien mit Ihrem Browser. Eine Internetverbindung wird benötigt, um Komponenten aus dem Webseitenframework Bootstrap zu laden.
Der Demonstrator besteht aus statischen HTML-Seiten, die mit Python, der Templating-Library jinja2 und dem Framework Bootstrap erstellt werden.