Zum Inhalt

Architektur

Zielbild

Die Challenge eignet sich für eine modulare, schichtartige Architektur. Sie trennt Quellenanbindung, Verarbeitung, Speicherung, Analyse, Bereitstellung und Dokumentation sauber voneinander. Das erleichtert Nachvollziehbarkeit, Austauschbarkeit einzelner Komponenten und spätere Weiterentwicklung nach dem Hackathon.

Architekturübersicht

Layered Architecture im Überblick

Layer Aufgabe Typische Ergebnisse
Source Layer Öffentliche Datenquellen, Dokumente und Services anbinden Rohdaten, Metadaten, Quellreferenzen
Ingestion Layer Abruf, Download, Connector-Logik und technische Erfassung API-Antworten, Dateien, Snapshots
Raw Data Layer Unveränderte Ablage der Quellartefakte versionierte Originaldaten und Abrufprotokolle
Processing / ETL / ELT Layer Parsing, Bereinigung, Normalisierung und Mapping harmonisierte Datensätze und abgeleitete Merkmale
Storage Layer strukturierte Ablage für Analyse und Wiederverwendung relationale Tabellen, Geodaten, optionale Dokument- oder Vektorspeicher
Analytics & Intelligence Layer Indikatoren, Trendkarten, Weak Signals und Evidenzlogik berechnete Kennzahlen, Signale, Bewertungen
API Layer standardisierte Bereitstellung für Frontend oder Drittsysteme REST-Endpunkte, OpenAPI, Swagger UI
Presentation Layer Dashboard, Web-App und Visualisierung Karten, Zeitachsen, Indikatoren, Filter
Documentation Layer technische und fachliche Nachvollziehbarkeit Quelleninventar, Architektur, Reproduzierbarkeit

Architekturprinzipien

  • Modularität: jede Schicht soll austauschbar und separat testbar bleiben
  • Quellentransparenz: jedes Ergebnis bleibt auf konkrete Quellen referenzierbar
  • Versionierung: Rohdaten, Transformationslogik und Indikatoren sollen nachvollziehbar versioniert sein
  • Reproduzierbarkeit: Doku, Schema und Zugriffslogik müssen nach dem Hackathon wiederverwendbar sein
  • Kleiner Kern: lieber wenige tragfähige Komponenten als ein zu breiter Stack ohne Betriebsreife

Technologische Leitplanken

Bereich Künftige Hosted-/Server-Option Datei-basierte MVP-Option
SQL-Datenbank PostgreSQL DuckDB oder SQLite
Geodatenbank PostGIS GeoParquet + DuckDB, oder später PostGIS
Dokument- oder NoSQL-Speicher MongoDB JSONL/Parquet + DuckDB, SQLite JSON oder TinyDB
Vector Store ChromaDB Server/Cloud ChromaDB Persistent Folder
Suche / Volltext OpenSearch oder Elasticsearch SQLite FTS5, DuckDB FTS, Whoosh oder Tantivy
Backend / API FastAPI FastAPI
Frontend React oder Streamlit React oder Streamlit
Dokumentation MkDocs MkDocs
API-Dokumentation Swagger UI / OpenAPI Swagger UI / OpenAPI

Minimaler technischer Zuschnitt für ein MVP

Ein pragmatischer MVP kann bereits mit folgenden Bausteinen funktionieren:

  • Connectoren für 4 öffentliche Quellen
  • Rohdatenablage plus einfache Versionierung
  • DuckDB, SQLite, Parquet und/oder ChromaDB als kostenlose dateibasierte Speicher im Curated-Data-Ordner
  • PostgreSQL/PostGIS, MongoDB oder OpenSearch nur dann, wenn das Team später eine künftige Hosted-/Server-Infrastruktur wählt
  • FastAPI für Daten- und Indikatorbereitstellung
  • React- oder Streamlit-Frontend mit Karte und Zeitachse
  • MkDocs für technische und fachliche Dokumentation

Pragmatischer Fokus

Nicht jede optionale Komponente muss im Hackathon umgesetzt werden. Entscheidend ist, dass der Gesamtfluss von der Quelle bis zur Visualisierung nachvollziehbar funktioniert.