Zum Inhalt

Datenkatalog

Dieser Katalog erklärt die Startquellen des Beispieldatenkatalogs in configs/sources.yml. Sie sind Beispiele für den Hackathon, keine geschlossene Liste. Teilnehmende können diese Quellen direkt nutzen oder einen Eintrag kopieren, um eine weitere offizielle/offene Quelle anzubinden.

Reifegrad

Label Bedeutung
Analysebereit Die Payload enthält bereits Zeilen oder Records, die direkt geladen werden können.
Bereinigung nötig Die Payload enthält nutzbare Records, aber Labels, Daten oder URIs sollten normalisiert werden.
Nur Katalog Die Payload enthält vor allem Metadaten und Links zu den eigentlichen Dateien.
Publikationsseite Die Payload ist ein Seiten-Snapshot mit Links und Text, nützlich für Dokumentensuche oder Textanalyse.

Startquellen des Beispieldatenkatalogs

Source ID Was die Payload enthält Wichtige Variablen Reifegrad Erster sinnvoller Nutzen
opendata_swiss CKAN-Metadaten zum Schweizer Energiebilanz-Datensatz. result.title, result.description, result.keywords, result.resources[].format, result.resources[].download_url, result.resources[].rights, result.metadata_modified. Nur Katalog Offizielle CSV/SPARQL-Ressourcen und Lizenzhinweise finden.
sfoe_energy_balance_csv Direkte CSV-Tabelle des Bundesamts für Energie. Jahr, Rubrik, Energietraeger, TJ. Analysebereit Energieabhängigkeit, Verbrauchsmix und Resilienzindikatoren über Zeit bauen.
meteo_swiss_smn STAC-Collection-Metadaten für automatische MeteoSchweiz-Stationen. id, title, description, extent.spatial, extent.temporal, assets, links. Nur Katalog Stations-/Parameterinventare und STAC-Items herunterladen.
geoadmin_army_nature_landscape STAC-Metadaten zu Natur- und Landschaftswerten auf militärisch genutzten Flächen. id, title, description, extent.spatial, extent.temporal, links. Nur Katalog Geodaten für Umweltauflagen und räumliche Exposition herunterladen.
geoadmin_civil_protection_meeting_points STAC-Metadaten zu Notfalltreffpunkten. id, title, description, extent.spatial, links. Nur Katalog Punktgeometrien herunterladen und mit Bevölkerung oder Gefahrenkarten verknüpfen.
geoadmin_surface_runoff_hazard STAC-Metadaten zur Gefährdungskarte Oberflächenabfluss. id, title, description, extent.spatial, extent.temporal, links. Nur Katalog Hazard-Geodaten mit Infrastruktur- oder Bevölkerungsexposition kombinieren.
geoadmin_nuclear_emergency_zones STAC-Metadaten zu Notfallschutz-Zonen um Kernanlagen. id, title, description, extent.spatial, extent.temporal, links. Nur Katalog Polygonzonen für Notfallplanung und Kaskadenrisiken herunterladen.
armasuisse_st_publications HTML-Snapshot der offiziellen armasuisse-S+T-Publikationsseite. Seitentext, href-Links, PDF-URLs, Themenwörter wie Cyber, Artificial Intelligence, Drone, Quantum, Research. Publikationsseite Publikationen und PDFs für Technologie-Trendscreening finden.
aramis_armasuisse_research_projects JSON-Liste von armasuisse-Projekten aus der ARAMIS-Forschungsdatenbank. CountOfMatchedProjects, Projects[].Id, Projects[].ProjectNumber, Projects[].Titel.Text, Projects[].Abstract.Text, Projects[].Department.Text, Projects[].Status.Text, Projects[].StartDate, Projects[].EndDate. Analysebereit Forschungsprojekte nach Technologiesignalen und Verteidigungsprioritäten auswerten.
parliament_affairs JSON-Liste aktueller Parlamentsgeschäfte mit strategischen Suchbegriffen. ID, BusinessShortNumber, BusinessTypeName, Title, BusinessStatusText, ResponsibleDepartmentName, SubmissionDate, Modified, TagNames. Bereinigung nötig Politische Signale zu Energie, Infrastruktur, Sicherheit, Klima, Versorgung und Armee verfolgen.
lindas CSV-SPARQL-Resultat zur Energiebilanz als Linked Data. observation, year, rubric, energy_carrier, tj. Bereinigung nötig Reproduzierbare Energieindikatoren bauen; URI-Werte vorher in lesbare Labels mappen.
fedlex JSON-SPARQL-Resultat für Rechts- und Regulierungssignale. act, title, date. Analysebereit Bundesblatt- und Rechtssignale zu Energie, Versorgung, Infrastruktur und Klima verfolgen.
bfs_pxweb CSV-Tabelle aus BFS STAT-TAB zur Bevölkerung nach Kanton. Year, Canton, Population type, Sex, Marital status, Age - total. Analysebereit Kantonale Bevölkerung als Expositions- oder Kontextvariable nutzen.

Ordnerstruktur

Jeder Lauf schreibt einen Snapshot:

data/raw/<source_id>/<timestamp>/payload.json
data/raw/<source_id>/<timestamp>/metadata.json

Die Payload kann je nach Quelle auch payload.csv oder payload.html heissen. In RenkuLab kann derselbe logische Rohdatenordner automatisch auf den gemounteten Connector ../govtech-raw zeigen, wenn dieser Ordner neben dem Repository existiert.

Metadaten

Jeder Snapshot hat eine metadata.json. Sie enthält Quellenname, Connector-Typ, Format, Abrufzeitpunkt, Dokumentations-URL, Zugriffspfad, Lizenz/Nutzungsbedingungen, räumlichen Bezug, Update-Logik und die genauen Request-Details wie URL, Query, Parameter oder POST-Body.

Für eine Hackathon-Abgabe sind diese Metadaten der Reproduzierbarkeitsnachweis: Sie zeigen, woher die Daten kommen, wann sie abgerufen wurden und wie eine andere Person sie erneut abrufen kann.