Apropos
\MAL\MAL.zip\16_2015-110-SDOS_1_Priloha_1_img-204111706-0001.pdf
Vazne mate pocit, ze toto se da vzit copy&paste?
Alternativne tu mame
draha\draha.zip\mapa-trati.pdf
Coz se da v podobe svg (tedy daleko vhodnejsi format) ziskat Tu https://commons.wikimedia.org/wiki/File:Map_of_Czech_railways.svg
A kdyz uz jsem u toho, co se tyce autobusu, vazne ma nekdo pocit, ze toto je pouzitelna informace?
"16","Na kotli","","","","","19","","","","","";
"17","Náhon","","","","","19","","","","","";
"18","Palachova","","","","","19","","","","","";
"19","Poliklinika 2","","","","","19","","","","","";
"20","Pouchov kostel","","","","","19","","","","","";
"21","Pouchov Sokolovna","","","","","19","","","","","";
"22","Sever střed","","","","","19","","","","","";
"23","Sídliště Sever","","","","","19","","","","","";
Vybrano namatkou, seznam zastavek, naprosto knicemu. I pokud by nekdo chtel obetovat cas, a linkovat zastavky na body v mape, veskera ta prace muze byt z minuty na minutu knicemu, nebot tu nejsou ani zadna ID, ktera by zastavku jednoznacne identifikovala. Podotykam, ze ty zastavky zcela jiste ID maji, dokonce celosvetove unikatni.
100% tech dat je jen hromada trusu.
Jednak je kopirovani zablokovane - mam tu Adobe Reader, SumatraPDF, MS Edge a Word a ani jeden mi ten text nevlozi do schránky.
Po odemceni a zkopirovani dostanu rozsypany caj - zejména nejde nijak poznat, kde zacina a konci jednotlive sloupce - napr. http://pastebin.com/gxL39wpV
ja myslim, ze si predstavujete pod pojmem otevreny standard neco jineho nez to je....
standard by mel mit sirokou platformu adopteru, to tenhle standard proste nema
ale myslim, ze se tomu venujeme az prilis vzhledem k dulezitosti
ostatne apriori by takovata data mela byt hlavne ve shode s nejakym narodnim standardem (to nevylucuje shodu s nejakym vyssim standardem) a to GTFS neni, to je zivelna specifikace v popredi diky monopolu (a ten bude pravdepodobne mit kratkeho trvani)
vzdyt to nepopiram... jen rikam proc ale to vynuceni cas nevraci... jako statni standard je to ale nebezpecna volba (stat nad nim muze ziskat kontrolu jen tim, ze ho prestane jako standard pouzivat) a vytvori si vlastni nezavislou vetec.
pak je ale lepsi zacit od nuly a lepe (with the hindsight)
Já si strojově zpracovatelná data představuji např. jako formát GTFS (https://developers.google.com/transit/gtfs/reference?csw=1)
na strojove zpracovani u tohoto typu nepotrebuji OCR (to je potreba u tech PDF Mezinarodnich autobusovych linek)
jo, copy paste jsem zkousel (predpokladam, ze umite cist a chapat text - viz muj prvni prispevek) - patrne narazite na problem s "fonty", ale ten ja narozdil od vas nemam a pro strojove zpracovani mi to nevadi..