Im Dataset “Ist-Daten” scheinen die bereit gestellten CSV-Dateien teils deutlich umfangreicher zu sein als das, was das CKAN-API liefert.
Beispiel:
-
Für den Betriebstag 24.11.2015 liefert das API nur Daten zu den drei Betreibern DB, SBB und BB (das letztgenannte Akronym steht übrigens für ÖBB, die Umlaute lassen grüssen…).
Dies lässt sich im Data Explorer leicht nachvollziehen, indem man einen entsprechenden Filter auf BETREIBER_ABK setzt (z.B. BETREIBER_ABK=CJ liefert 0 Records für diesen Betriebstag). -
In der Datei 20161124-istdaten.csv werden dagegen Fahrten von über 50 Betreibern aufgeführt (u.a. auch die CJ)
Der Effekt ist auch deutlich sichtbar bei der Anzahl Datensätze, die in API und Data Explorer von Tag zu Tag stark schwankt, während die CSV-Dateien Mo-Fr alle etwa gleich gross sind (und am Wochenende naturgemäss etwas kleiner).
Wie verlässlich sind die Daten, die über das API kommen? Sollte man lieber die CSVs verwenden?
Andreas