Podepisovat pouze textový obsah dokumentu nemůžete, protože i jeho vizuální podoba nese podstatné informace (třeba na faktuře jenom z vizuální podoby poznáte, kdo komu má platit – z textového obsahu to poznat nelze). Ono to ani jinak než s možností toho balastu nejde – když si do dokumentu vložíte bitmapový obrázek, místa pro fixlování s otiskem tam máte až až. Možnost vkládat do souboru balast není z hlediska elektronického podpisu obrovská bezpečnostní díra – prostě se počítá s tím, že není možné s rozumnými náklady vytvořit kolizní dokument. MD5 kolize můžete dnes na běžném počítači hledat za méně než sekundu – v to by vám nepomohly sebepřísnější požadavky na formát, maximálně byste vhodný obrázek hledal třeba měsíc a ne vteřinu.
Podle mě se PKP tiskne na účtenku jen proto, aby to vyděsilo jak obsluhu pokladny tak zákazníka. Tím, že je tam nápadný, několikařídkový, škaredý kód.
Pokud by se nezaevidovaná účtenka od zaevidované lišila třeba jen v jednom znaku, vedlo by to ke snaze nečekat ani 2 sekundy a více účtenek evidovat dodatečně. A od toho by byl jen krůček je v mezidobí mazat.
Mám představu, jak se to používá při deduplikaci (systém, kdy se identické soubory ukládají jen jednou):
1. spočtu hash, a podívám se do databáze, zda k němu už mám uložený soubor
2. pokud ne, uložím do databáze
3. pokud ano, musím porovnat celý obsah
4. pokud je stejný, nový neukládám, jen zvýším čítač a zajistím propojení
5. pokud se liší, uložím do databáze jako další instanci se stejným hashem (a nějak je odliším)
Dokumenty z devatenáctého století pochopitelně perem a inkoustem psány byly. Nejstarší výtisky z laserové tiskárny mám z roku 1992 a čitelné jsou bez problémů. Skladovány jsou ale nastojato - buď v klasických šanonech nebo v závěsných pořadačích.
Skladování papírových dokumentů pochopitelně má svá risika a nástrahy, nicméně i běžný člověk je schopen po načtení základů, které se vejdou na jednu A4 uložit důležitý dokument tak, aby tento přečkal staletí. Pokud potřebuje něčí součinnost, je tato většinou jednorázová (například si člověk nechá důležitou smlouvu vytisknout na kvalitní papír archivním inkoustem).
Oproti tomu archivace digitálních dat je kontinuální proces, který znamená podstatně vyšší požadavky na vybavení, sledování vývoje kryptografických postupů, existenci řetězce vzájemně si důvěřujících autorit apod. Ne že by digitální archivace neměla svoje využití, ale myslím si, že to pokrokářské nadšení nad vším digitálním je potřeba občas korigovat.
Blokchain je elegantne riesenie tohto problemu. Blockchain je retaz zaznamov usporiadanych do blokov. Data sa skomprimuju do bloku (Merkle tree) a k ich hashu sa prida hash predchadzajuceho bloku a za za doveryhodnu chain sa povazuje ta najdlhsia. V kontexte clanku je na tomto rieseni najlepsie to ze cim hlbsie v chaine blok lezi, tym tazsie je ho zmenit. V praxi sa po 6 blokoch povazuje transakcia/zaznam za nemenny (immutable). Riesenie pre uchovavanie dat je napr.: factom.com
to je hlavní cíl admina, aby se vše dělo bez jeho zásahu :). Snad to je i účel počítačů, zadá se jim práce a dělají jí sami...
Pokud nějaký formát bude zanikat, dojde k jeho převodu. Stejným způsobem máme v počítači k dispozici tisíce let staré svitky, došlo k jejich převodu, stejně tak jako v minulosti docházelo k jejich přepisu.
Je otazka, jestli ta demonstracni PDF vyhovuji norme PDF/A potazmo PAdES. Skoro bych rekl, ze nevyhovuji, takze nejsou napr. zpusobile k prenosu pres datove schranky a take nemohou byt opatreny el. podpisem, resp. asi tomu nikdo nezabrani, ale technicky kdyz nekdo prijde s dokumentem nevyhovujicim temto standardum, tak bude snadne namitat, ze dane dokumenty nejsou platne/pravne zavazne.
Kazdy admin bude jiste potesen, az nastane okamzik, kdy se vse pod jeho spravou deje vlastne bez lidskeho zasahu a samo.
Stejne tak vam nic nebrani otevrit ten .602, dnes jeste zcela jiste najdete i popis formatu (a pokud nesejde na formatovani, on to byl vicemene text) pripadne i sw, ktery to otevre. Jenze je to take jen onech 20let, kdezto dokumenty se pouzivaji za 50, 80, 100let. V nasem pripade nam staci se vratit jeste o dalsich smesnych 10let, a jsem zvedav, jak si poradite s 30 let starym dernym stitkem nebo paskem.
Uvedomte si, ze na to vase XML se za 30let budou soucasnici divat presne stejne jako vy dnes na ten derny stitek. O existenci derneho stitku budou pak mit poneti jen fanousci historie a sberatele. Bezte se dnes zeptat, klidne i techniku, jak funguje cyklostyl.
Mimochodem, vazne si mysliste, ze ten schovany pocitac za 10let jeste pujde zapnout?
v tom máš pravdu, pokud si tohle chceš řešit doma a ručně. Bavím se o datových archivech, které tuhle práci dělají sami, bez lidského zásahu.
Dopředná kompatibilita je vždy problém a musí se s ní nějak počítat, naštěstí word dokument nebo pdf je xml a to lze přečíst relativně snadno, stačí si schovat dokumentaci nebo celý počítač, který to umí přečíst.
nemáš pravdu, viz dokumentace svn https://github.com/apache/subversion/blob/1.9.x/notes/wc-ng/pristine-store#L11
Mohu ti ještě ukázat zdrojáky pokud něvěříš ;)
Ano, a zkoušel jste někdo vytáhnout 10-20 let uložený výtisk z laserovky? Jo, papír napsaný na psacím stroji, nebo dokonce ručně perem a inkoustem, to jo, to může vydržet opravdu dlouho.
Laserovka z padesátých let nebude, ale z konce osmdesátých už ano a někdy (zvlášť, když byl papír zatížený hromadou dalších), jsou výsledky nejisté.
Casova razitka ale nic neresi.
Znamena to znasobeni nakladu - jak financnich tak casovych na vubec udrzbu dokumentu.
Pokud budu chtit dobre uchovat pisemnou smlouvu a kvalitne ji zajistit, ulozim dva stejnopisy ve dvou trezorech dvou ruznych bank (pripadne dvou ruznych statech) a pravdepodobnost, ze o oba prijdu je miziva. Nic dalsiho nemusim resit.
V pripade razitkovani musim neustale hlidat terminy expirace, a razitkovat minimalne 2x, protoze pripadnou revokaci nijak neovlivnim, a retez nesmi byt prerusen ani na jedinou vterinu. V pripade prolomeni algoritmu, ktere muze nastat zcela kdykoli, muze dojit ke globalnimu zneplatneni vsech dokumentu. Nadto musim pravidelne obmenovat HW a opakovane resit migrace na nove technologie, pripadne dokonce konverze formatu - coz u elektronicky podepsaneho dokumentu bude obzvlastni zabava. Umi vas stavajici textovy editor otevrit .602 ? Je to smesnych 20 let.
I v pripade, ze nepozaduji zadne specielne zajisteni daneho dokladu, je radove efektivnejsi papir v supleti, nez data na disku ktery umre. Pokud budete argumentovat pozarem, ztrata dat na disku je v horizontu 50let 100% jista. Pozar ve stejnem horizontu predstavuje jen pomerne nizke riziko.
Promiňte možná blbý dotaz laika, ale když jsem se před více než 20 lety trochu elektronickými podpisy zabýval, tak tenkrát se uvažovalo o podepisování normalizovaného textu, vytaženého z dokumentu a zbaveného veškerého formátování. A takto šlo podepsat i dokument papírový (i když to dalo spoustu práce). Skutečně mě překvapuje, že se dnes můžou podepisovat a považovat za bezpečné soubory se spoustou balastního místa, které si přímo říká o hledání kolizí. Minimálně by ty soubory měly mít definovaný formát tak, aby tam žádné balastní místo nebylo (tedy třeba, že nevyužité misto musí být nulované apod.) a porušení tohoto formátu by znamenalo, že dokument není věrohodný. Proč se ten systém nakonec zavedl s takovou obrovskou bezpečnostní dírou, když už před dvaceti lety se hledaly mechanismy, jak právě takovýmto kolizím zamezit?
ano, je to špatně a změna sha-1 byla v připomínkách. Prakticky to ale není tak zlé, množina údajů, které se podepisují je jasná a není možné si tam cpát libovolná data k podpisu, riziko je tedy velice malé a v současné době u těhle dokumentů není možné udělat kolizi ani s md5.
PKP dávat na účtenku je zajímavý úkaz, spíše to ukazuje na neporozumění tématu od zákonodárců.
řešením je opakovaně dávat časová razítka. To zaručí, že dokument vypadal právě takhle v době časového razítka. Pokud letos došlo k "prolomení" sha-1, lze předpokládat, že před 3 lety tomu tak nebylo.
V archivaci dokumentů, kterou jsme dělali v jedné firmě se časová razítka dávají každý rok na všechny dokumenty (několik TB dat) a lze to procesně dobře zajistit.
Asi ano. Jakmile to začnou řešit soudy, tak vznikne poptávka po soudních znalcích v této oblasti. Představme si řešení situace, kdy existují 2 odlišné - tedy "kolizní" - a podepsané dokumenty. Certifikát původce již expiroval. Teď babo raď! Pokud byly použity časové značky, tak to může být ještě zajímavější! Podepsala jenom jedna strana nebo obě? Jsou značky platné a byly správně "přepodepsány"? Obzvláště různé typy "chybotisků" (tj. vad podpisů) budou mimořádně chutné...
Naprostý souhlas. Před časem jsme převáděli nějakou nemovitost a pracovalo se tam s dokumenty z padesátých let devatenáctého století a odkazy do katastrů ze století osmnáctého. Prostě se ty dokumenty vytáhly ze šuplete, resp. archivu a bylo to. Ještě že v té době neměli elektronické podpisy a podobné vymoženosti...
A proto slavné EET navržené v roce 2016 také používá SHA-1 pro vytvoření otisku BKP z PKP :-) Což zdaleka není jediný problém tohoto paskvilu. Že by to byl ten důvod, proč vyžadují na účtenku tisknout PKP který má 344 znaků (místo jeho BKP otisku co má "jen" 44 znaků) při výpadku spojení ? No logiku zde asi nehledejme.
Takže pokud chceme uchovávat své elektronické dokumenty...
Bude nejlepsi si je vytisknout. Je to radove efektivnejsi a bezpecnejsi, protoze to ze ja nebo vy nebo nekdo dalsi nevi, ze je v nejakej algoritmu nejaka dira jeste neznamena, ze to nevi vubec nikdo.
Elektronicky podepsana vec ma smysl pri pouziti v radu dnu az tydnu. Ve skutecnosti i to muze byt problem, pokud dojde k revokaci nebo expiraci. Dlouhodobe platne dokumenty ma smysl skladovat vyhradne v papirove podobe.
"Například v nejrůznějších systémech pro práci se soubory a jejich verzemi se mohou shodné soubory detekovat právě podle jejich otisku. Ale pokud se již nelze spoléhat na to, že dva různé soubory mají různé otisky, přestává být takováto detekce použitelná."
Toto je trochu nafouknuté, na to nejde 100% spoléhat ani při SHA-512 (množina souborů bude vždy větší než množina hashů) a zároveň tu ještě pro SHA-1 nemáme kolizi 2. řádu. Že něco nezafunguje pro 2 složitě a záměrně upravené soubory se dá předpokládat, ale že by nám synchronizační/verzovací systém pomotal běžné soubory je stále stejně nereálné.