Aufgabe / Problemstellung
Der öffentliche Sektor verfügt über zahlreiche Informationen – z.B. Statistiken, Satellitenbilder sowie Umwelt- und Mobilitätsdaten – die für das Gemeinwohl und/oder für die Wirtschaft von Nutzen sein können. Um das gesamtgesellschaftliche und ökonomische Potenzial besonders relevanter Daten auszuschöpfen und gleichzeitig deren Nutzung zu regeln, hat die Europäische Kommission 2013 die EU-Richtinie über offene Daten und die Weiterverwendung des öffentlichen Sektors, kurz: PSI-Richtlinie (nach dem englischen Titel »Re-use of Public Sector Information«), erlassen. Ziel ist die Vereinfachung der Zugänglichkeit von Daten des öffentlichen Sektors.
Im Jahr 2019 wurde die PSI-Richtlinie überarbeitet: Die novellierte Richtlinie sieht u.a. die Bestimmung sogenannter hochwertiger Datensätze, der »High Value Datasets« (HVD), vor. Als HVD klassifizierte Datensätze sollen künftig von Behörden oder öffentlichen Unternehmen als offene Daten kostenfrei, maschinenlesbar und über Schnittstellen zur Verfügung gestellt werden.
Um die Verhandlungen der EU-Mitgliedsstaaten und der EU-Kommission zur Bestimmung der HVD-Datensätze vorzubereiten, beauftragte das Bundesministerium für Wirtschaft und Energie Fraunhofer FOKUS mit der Studie »Hochwertige Datensätze in Deutschland«.
Lösungsansatz / Umsetzung
Die Studie identifiziert rund 60 potenziell hochwertige Datensätze in Deutschland und betrachtet diese jeweils aus drei Perspektiven: Untersucht werden die (1) technischen, (2) rechtlichen und (3) ökonomischen Rahmenbedingungen, Potenziale sowie etwaige Anpassungsbedarfe in Folge einer Klassifizierung. Die exemplarisch untersuchten Datensätze decken sechs Themenbereiche ab: Georaum, Erdbeobachtung und Umwelt, Mobilität, Meteorologie, Statistik sowie Unternehmen und Eigentümerschaft von Unternehmen.
Der Geschäftsbereich Digital Public Services am Fraunhofer FOKUS hat neben der Studien-Projektleitung die Analyse der technischen Ebene (1) übernommen: Untersucht wurde u.a., ob die in der PSI-RL geforderten Bedingungen hinsichtlich Maschinenlesbarkeit und Verfügbarkeit der Daten über Schnittstellen bereits gegeben sind.
Zur Identifikation geeigneter Datensätze führte das Wissenschafts-Team eine Online-Umfrage zur ersten Einschätzung des Weiterverwendungspotenzials unterschiedlicher Datenkategorien durch. Anhand der Ergebnisse benannte das Studien-Team konkrete Datensätze aus Deutschland. Die Auswahl der Datensätze sowie damit verbundene Potenziale und Herausforderungen wurden durch einen Projektbeirat sowie Stakeholder-Workshops evaluiert. Dabei flossen die Sichtweisen von Datenbereitstellern und -nutzern ein.