Open Data umfasst für mich zwei Dinge: zum einen das Aufbereiten und Nutzbarmachen von Daten, die von Dritten zur Verfügung gestellt wurden. Zum anderen das Sammeln und Teilen von Daten, die nicht verfügbar sind. Entweder, weil sie noch nicht in einer Form vorliegen, die man teilen kann oder weil der Besitzer der Daten diese nicht teilen möchte. Um letzteren Fall, die Datenbeschaffung, soll es hier gehen. Dabei spreche ich selbstverständlich nicht von Daten, die aus guten Gründen wie Wettbewerbsvorteilen oder gar aus Sicherheitsgründen nicht geteilt werden, sondern von Daten, die öffentlich sein müssten und bewusst verborgen werden, um z.B. ein Produkt als “Überraschungspaket” verkaufen zu können. Man sollte meinen, dass solche Geschäftsgebaren nicht legal sein. Das ist aber leider ein Irrglaube! Jeder, der einen DSL-Anschluss besitzt, hat bereits die Katze im Sack gekauft. Die vollmundig angepriesenen Geschwindigkeiten werden nie erreicht und was noch schlimmer ist, in den ABG auch nicht garantiert. Dort steht immer die Formulierung “bis zu”. Die wirklich verfügbare Geschwindigkeit wird erst messbar, wenn der Vertrag geschlossen wurde und die Leitung steht. Aus 16 Mbit/s werden dann ganz schnell knapp sechs. Eine ehrliche Vorab-Orientierungshilfe, die technisch problemlos möglich wäre, wird von den Providern nicht angeboten. Die Gründe sind offensichtlich: Von schwammigen Begriffen wie einer mobilen Datenflatrate, die es nicht gibt und Drosselungsplänen entgegen der Netzneutralität sollte jeder schon mal gehört haben. Nun aber zum eigentlichen Thema, dem Erfassen von Daten, die Firmen von sich aus nicht zur Verfügung stellen. Konkret geht es um ortsbezogenen DSL-Geschwindigkeitsdaten und die Aufbereitung und zur Verfügungstellung der selben zum Download als Open Data.
Ich habe dazu einen online Speedtest unter der sprechenden Domain - dslspeedtest.biz - implementiert und konnte bereits einige 100 Datensätze erfassen. Diese reichen natürlich bei weitem nicht aus, um ein verlässliches Bild der Versorgungssituation mit Breitbandanschlüssen in Deutschland zu zeichnen. Sie sind aber ein vielversprechender Anfang.
Es werden noch einige Vorabvalidierungen vorgenommen, um die Plausibilität der gemachten Angaben zu erhöhen. Dazu wird per Reverse DNS-Lookup geprüft, ob die IP-Adresse des Testers zum angegebenen Provider gehört oder nicht. Die IP-Adresse wird anschließend gelöscht. Das alles funktioniert problemlos. Die Datensätze werden monatlich zur Verfügung gestellt. Beginnen werden wir am 1. Juni. Wie so oft ist nicht die Umsetzung eines Projektes das Problem, sondern das Bekanntmachen. Ohne die Erwähnung in den Medien hat man wenig Chancen auf Aufmerksamkeit und die braucht man, schließlich es geht ums Mitmachen. Und da kommt ihr ins Spiel.
Über mich, Naden. Ich habe als Softwareentwickler bereits die erste große Internetblase miterlebt und dadurch interessante Einblicke in die Umsetzbarkeit von Ideen und dem Web an sich bekommen. Was sich durch die Neuverknüpfungen von vorher unabhängigen Datenquellen oder deren visuelle Aufbereitung entdecken lässt, hat mich schon immer fasziniert.
comments powered by Disqus