Samstag, 28. August 2010

Bugs in OSM-Daten

Seit einiger Zeit arbeite ich wieder unregelmaßig an meinem Routenplaner. Beim Import neuer OSM-Daten bekam ich dann plötzlich NullPointer-Exceptions, ohne mir einer Schuld bewusst zu sein.
Einiges Debuggen brachte mich dann letztlich darauf, dass in dem Way, der zu dem Fehler führte, die gleiche Node zweimal hintereinander auftauchte.
Anscheinend wird das durch einen Bug in Potlatch verursacht, der schon seit einem Dreivierteljahr offen ist. Der Integrity-Checker xybot läuft dann zwar irgendwann drüber und korrigiert die Fehler, da sie aber täglich hundertfach neu entstehen, ist die Karte zu keinem Zeitpunkt fehlerfrei.
Offenbar ist der Fehler aber nicht so leicht zu reproduzieren, und der Potlatch-Autor scheint ihn auch nicht für sonderlich wichtig zu halten, jedenfalls klingen seine Kommentare im Ticket so.
Ich habe dann also in meinen Import-Code einen Workaround eingebaut und korrigiere die Fehler jetzt selbst. Außerdem habe ich den Bayern-Ausschnitt der Karte noch einmal neu heruntergeladen. Der Fehler, der ursprünglich zum Absurz geführt hatte, war schon behoben – und trotzdem bekam ich eine erschreckende Liste solcher Fehler, allein in der Bayernkarte waren es mehr als fünfzehn.
Ich mag OSM ja sehr, aber dass ich selber Fehler in der Datenintegrität korrigieren muss, für die kein Beitragender etwas kann, finde ich schon ein wenig schwach. Das hätte ich nicht erwartet.
Und natürlich kann ich mehr als nur verstehen, dass der Potlatch-Programmierer sich mit diesem Projekt sowieso mehr aufgehalst hat als ich mir auch nur vorstellen kann. Ein Fehler, der die Datenintegrität betrifft, ist meiner Ansicht nach aber kritisch, nicht nur wichtig, und müsste eigentlich schnellstmöglich eingegrenzt und gelöst werden, auch wenn die Fehler hinterher von einem Bot immer wieder gefixt werden.

Keine Kommentare:

Kommentar veröffentlichen