Tady je popis z jejich webu:
How it works?
1) It's easy. Take photos. Don't edit them.
2) Upload photos and you'll get verification proof.
3) You'll get a link to share or embed your photos and trustworthiness verification.
Pes je zakopaný v tom "Don't edit them.".
To znamená, že fotka musí být originální soubor z foťáku, nezmenšený, neořezaný, neupravený kontrast, stíny, šum, atd, tj. věci které se běžně s fotkou dělají, než ji někam pošlu nebo vystavím na web. Pokud s fotkou udělám jakoukoliv uvedenou úpravu, ten jejich program o ní prohlásí, že je zfalšovaná. To je to jejich 100% rozeznání falzifikátů...
Na druhou stranu i u tak omezeného programu si umím představit jeho využití - např. když policie fotí trestný čin, tak by soud mohl ověřovat, zda s důkazy (soubor s fotkou) nebylo nikterak manipulováno.
Jenže to zase není nic nového - např. Canon ve svých digitálních zrcadlovkách má systém digit. podpisu fotek "Canon Original Data Security", tj. aby bylo možné ověřit že ta fotka přesně takhle vylezla z foťáku: http://www.canon.co.jp/imaging/osk/osk-e3/index.html
Bohužel i tento systém byl "hacknut": http://www.elcomsoft.com/canon.html -mimochodem jsou tam zeditované fotky, které systém Canonu považuje za originální. Vyzkoušejte je někdo s verifeyed.
Patentovat konkrétní technické řešení je samozřejmě původní princip. Jenže dnes už to tak uplně nefunguje.. zváště v USA se nejdřív patentuje a až poté se u soudu řeší, že jste patentoval trivialitu nebo něco co už je dávno známé.
Proti okopírování sakumprásk Vás chrání autorský zákon a patenty naopak ne, součástí patentové přihlášky je (měl by být..) totiž přesný popis technického řešení.
Bohužel právníci to už dnes poněkud zobecňují a kamuflují.. takže se z toho patentu nic nedozvíte (dokud Vás na jeho základě nezažalují).
Vzhledem k tomu, že patent to zveřejnění vždy vyžadoval a za to poskytoval exkluzivitu, je dnes díky právním kličkám patent spíše obchodní tajemství s právem vydírat ostatní na základě vágního popisu typu - načtu video, přenesu ho přes síť - dekóduju - zobrazím - plaťte.
Ale to se muze stat i tak, v US muzu klidne kohokoli zalovat ze pouziva nejaky muj patent, prakticky bez ohledu na to zda to je nebo neni pravda ho tak muzu dokonale znicit. Prave proto je treba takovouhle patentovatelnost zrusit uplne, protoze brani konkurenci.
Pokud dojde ke stretu s vetsim (movitejsim) souperem, nemate proste zadnou sanci ten spor ustat, a to ani v pripade, ze ho nakonec vyhrajete.
Nevím zatím o žádném programu do kterého by se nacpal padělek a vyšel z toho nerozpoznatelný padělek (tedy takový, co projde všemi statistickými testy) - např. u copy & paste příkladu s odpalem rakety by náprava nemusela být snadná (musela by se jedna z těch raket nějak překreslit aby nebyla kopií některé z ostatních, což automaticky půjde asi celkem dost obtížně, i když pokud si člověk pohraje s nástroji typu resynthetization v gimpu, tak by to možná i nějak šlo ...)
I když automatická oprava obrázku pro projití některými testy by jít mohla (např. automaticky doupravit interpolaci pixelů aby to odpovídalo bayerovu senzoru, atd ...)
Co by ale šlo určitě je napsat podobný program, který u falza prozradí proč to neprošlo (aneb by řekl podle čeho poznal že je to falzum, případně by na obrázku označil oblasti podle kterých to v testu detekoval) a navrhl by způsob jak obrázek upravit aby tím testem prošel.
O takovém programu nevím, ale IMHO se něco takového časem objeví :)
Problem je pak ale v tom, ze by mohl prijit nejaky patentovy troll, ten algoritmus si patentovat misto nich a pak po nich chtit penize za pouzivani jejich vlastniho algoritmu. Soud sice nakonec vyhraji, ale dotycny troll se bude tak dlouho odvolavat a soudy protahovat, az puvodni autori prosoudi majlant.
Optimalni reseni by bylo prekopat cely patentovy system v USA, ale toho se asi jen tak nedockame ...
V diskuzi se objevilo dost pochybovačů. Pánové, dokažte, že umíte poznat falešné fotky. Vyzývám tímto ty co pochybují, aby poslali do 30/4 2 fotky - jednu upravenou a druhou neupravenou - do redakce Lupy - redakce AT lupa.cz a na můj email - pavel.curda AT gmail.com. Přepošleme to VerifEyed a zveřejníme výsledek testu formou minizprávy. Ukažte prosím i originál upravené fotky. Nepodvádět :)
Patrick Zandl: "tak hezký, ale přesně jak jsem čekal, se rozjela diskuse o tom, jak to funguje a že to fungovat nemůže :) "
Typická reakce technika. Program není vyřešen technicky dokonale ==> program je k ničemu (dovolil jsem si zhutnění Vašeho příspěvku). A to je přesně to, kde musí nastoupit člověk s čichem na prachy. Není nic lepšího, než mít alibi proč musí vznikat nové verze a mít je důvod znovu prodat ;-). Stejný princip jako u antivirů. Myšlenka je stejná, lovec je neustále pozadu za kořistí. Pánům gratuluji a pokud to nepodělají obchodně, mají skvělý business.
Zajimavy produkt. Patent je zcela na miste. Patentuje se technicke reseni, nikoliv zakladni myslenka. Jde o to aby to nekdo nezkopiroval sakum prask a neprodaval sam (napriklad cinani).
Produkt nema odhalit vsechny podvody. Staci aby lidem usetril praci a uz se vyplati.
Samozrejmne ze to jde obejit. Ale ja mit redakci, ktera publikuje fotky z jinych zdroju, tak to redaktorum poridim, abych se vyhnul trapasum (zalezi na cene samozrejmne). To same pojistovny a podobne. Nemusi to odhalit dokonale podvody, staci par normalnich podvodu a uz se to vyplati.
Tak ci tak, gratulace autorum a .... polovine diskutujicich.
By mě zajímalo, kolik z vás má zkušenost s tím, že si nějaký podobný program v pojišťovně rozmyslel, že pojistná událost byla fingovaná a místo plnění vás budou honit po soudech.
Po přečtení nadpisu jsem se těšil, že software bude sloužit k odhalování propagandistických montáží z médií a ono je to pro tyhle zm… :-(
Ach jo.
Vážený pane. JPEG komprese je stručně řečeno frekvenční filtr. Kdyby byl obrázek hudbou, pak by měl význam odflitrování určitých tónů.
Jestliže v RAWu se vyskutuje ve foťácích určité spektrální rozložení (tedy určité rozložení frekvencí), pak po filtraci Fourierovou řadou (tedy JPEG transformací) taky z toho určité frekvenční rozložení vyleze.
Jakmile do toho zanesete jiný zdroj obrázku – a PC, stejně tak jako grafické programy mají RGB, nebo CMYK vzor, který je frekvenčně jiný, než snímač foťáku, pak bude mít jiné frekvenční rozložení.
Protože JPEG ukládá výsledek frekvenční transformace (tedy JPEG kosinové transformace) do maticového vzoru – není náhodou, že jejich program porovnává vzory.
Doufám, že jsem neprozradil něco, co si tvůrci onoho zázračného programu kuchtí pod pokličkou, ale jsem ze staré školy, jako starší programátor bylo samozřejmé mít vynikající základy matematiky a teorie algoritmizace. To za co se dnes dávají ceny a obdovně mezinárodně chválí dřív byla naprosto samozřejmá řadová výbava programátora.
Nemohu tu ovšem psát traktáty a donekonečna rozebírat na stovkách stran.
Jenže jak píšu a trefně poznamenávám níže, jakmile se tento program rozšíří, každý běžný novinář si stáhne jiný program, který obrázek upraví aby vše prošlo.
Funkčnost programů tohoto typu je závislá na svém neúspěchu. Pokud tento program dojde většího komerčního úspěchu, či bude aspoň jednou nasazen na významném místě (úřadě), kde větší počet lidí bude stát o to aby nebyly problémy – velmi rychle vznikne program, který obrázek zdokonalí proti rozpoznávači padělků a rozpoznávač pozná kulové.
A i ten nejtupější novinář či podvodník, dokáže spustit program, kliknout na tlačítko a hotovo.
Znovu píšu, ten rozpoznávač bude buď účinný, ale komerčně neúspěšný (tedy zbytečně minuté peníze na vývoj), nebo bude komerčně úspěšný, ale rychle se stane neúčinným (a tím možná programátorům vrátí peníze na vývoj, ale také rychle vše skončí a po nás potopa). Jiná varianta je možná jenom na Marsu, či na Alfa Centauri.
Jako programátor s desítkami let praxe tuším, že tento typ programů je přesně to, kde algoritmické řešení kulhá na obě nohy, ještě máý obě kolena křivé, a přeražené všechny hnáty. Právě pro takovýto typ problémů je algoritmické řešení slabé a skoro nevhodné. Člověk v těchto úlohách je baziliónkrát lepší.
Právě pro tyto případy se zkoušela umělá inteligence, neuronové sítě, různé pravděpodobností a jiné algoritmy, stejně jako fuzzy logika, predikáty, bayesovké věci, atd.
Ale pořád prostě není schopno cokoli toho základního, tedy chápat smysl toho co je na obrázku. Obrázek nejsou žádná přesně počítačově určená data.
Zkrátka, tento rozpoznávač velmi rychle zhasne a bude z toho kulové. Buď zhasne pro neúspěch, nebo pro úspěch a následnou odvetu a de facto vykastrování jeho fuknce jak píšu o pár odstavců výše.
Prca je, ze kazdej normalni fotograf foti do RAWu a teprve po nejaky ty uprave to pripadne zkomprimuje (na PC samozrejme) a posle kamsi (na web/do redakce/...).
Takze IMO ten jejich soft ani tak nesrovnava kompresni artefakty, ale spis hleda stejne vzory (vetsina podvrhu se vyrabi kopirovanim), muze hledat oblasti s ruznou urovni rozmazani/zaostreni (ruzne vlepovani obsahu), ruznou urovni sumu .... tohle vsechno me napada jen tak z voleje a napadne to kazdyho. Jedina vec co stim treba je udelat je vyladit pomer jednotlivych slozek = urcit vahu tak, aby se minimalizovala pravdepodobnost falesnyho vyhodnoceni.
Vyhodnocovani vad cocek a spol to by bylo IMO prilis vypocetne narocne (a to je jeden z mnoha napadu ktera padly v diskusi tady).
99% podvodníků volí triviální cestu. Ty ten soft odhalí určitě. To máš jako s plagiáty diplomových a semestrálních prací. Nedám-li si práci a obšlehnu to i s chybama a stylistickejma pitomostma, odhalí mě snadno. Dám-li si práci a text převyprávím, přehážu slovosled, zvolím jinou stylisticku, odhalovat mě budou obtížně...
Software asi dobrej, i když ta myšlenka (dá-li se něco pochopit z bla-bla-článku) mě napadla už hodně dávno. Každej foťák i scanner má specifický způsob zakódování dat (ztrátová komprese), asi tak jako každej motor vrčí jinak. Při jakémkoliv zásahu z editoru se tam vloží něco jiného, co je zase typické pro ten který editor. Vysledovat rozdíly však musí být šílená piplačka. Je otázka, co si kluci patentovali. Jestli nápad (co mě napad před deseti lety a spoustě lidí jsem ho převyprávěl), nebo tu programátorskou piplačku. Kdybych si chtělů nechat patentovat každej nápad, co dostanu, měl bych celej den co na práci ještě dlouho v důchodu.
Ovšem článek je šílenej. Stačila by jedna věta "Kluci vymysleli něco nového, dobrého a dostali za to cenu". Pan autor je asi placen od počtu písmen. Přečíst celý článek, který se hemží marketingovými bláboly, start-upy a jiným balastem, kterým se úspěšně živí řádově více lidí, než vymýšlením chytrostí, je k zblití.
Ale dobrý perex, nebo ještě lépe trefný titulek, by to vyřešil.
Přesně tak. A kdyby se to nasadilo více, tedy stala se z toho někde důležitá technologie, tak se jednoduše dá naprogramovat program, který upraví obrázek tak, aby jejich programem prošel.
Pokud program jako automat něco rozpoznává, jiný program jako automat dokáže zakamuflovat aby nic nepoznal.
Takže úspěšnost toho programu je založena právě hlavně na tom, aby se neuchytil a aby byl neúspěšný. Pokud program bude mít úspěch, bude rychle eliminován – a tento typ programu nebude žádné velké lumen, aby to byl větší problém.
Tedy znovu opakuji: Jen malé rozšíření programu, tedy komerční neúspěch, zaručí jeho rozumné rozpoznávání padělků. Nic jiného.
Tento program bojuje přesně na frontě, kde mu velmi chybí důvtip a flexibilita člověka a kde hrubý automat je proti MOTIVOVANÉMU člověku velmi slabý.
Stroj byl vždycky horší v odhalování padělků a i tento program bude. Stačí to mít chvíli v rukách, odhadnout jak program funguje a následně se mohou bez problémů a s minimální prací šířit padělky, které tento program hrdě prohlásí za nejpravější na světě.
Program totiž nemá základ a to je mozek. Program může pouze otrocky hodnotit pravěpodobnostně nějaký předpoklad daný programátorem, tedy odhalit malé ryby v padělání.
Pravděpodobně bychom si velmi posmutnili, kdybychom zkusili reálný výstup tohoto programu poté co by padělky neprovádělo úplné pako.
Nejde o to, že by programátoři byli špatní, ale o celkové možnosti programu. Je jasné, že JPEG kosinová transformace nějaké standardní vzory zanechává a že lze provést více způsoby a s různou kvalitou. Foťáky jako takové mají slabé procesory a tak to dělají nedokonale. Počítač to udělá daleko dokonaleji – tento princip bych si mohl nechat patentovat, ale dávám to zde volně k dispozici a pravděpodobně bych byl schopen na jeho základě udělat stejně dokonalý rozpoznávač padělků jako program v článku. Stačí jen zanalyzovat způsob a určité artefakty JPEG komprese – současné PC programy jsou příliš podezřele dokonalé při kompresi. Dělají to trochu jinak. Když k tomu přidám ještě nějakou heuristiku – pravděpodobnostní práh při opakování do puntíku stjeného vzoru, případně natrénuji navíc nějakou neuronovou síť, možná i schopnosti programu v článku překročím.
Nicméně program stále není schopen pochopit smysl děje. A stejně tak je bezradný vůči tomu, kdybyněkdo opravud stál o to zakamuflovat vše co nejlépe – a to i tehdy, kdyby oku jasně došlo, že jde o pitomost a reálný děj jako na obrázku probíhat nemůže.
Všechny dnešní programy na rozpoznávání padělků jsou o tom, že uživatelé jsou technicky nevzdělaní, ale umí používat Photoshop, zatímco detaily formátů jdou mimo ně. Dnešní doba jim říká nemusíte nic umět, můžete být úplně blbí, hlavní jsou peníze, známosti, případně 14denní rychlokurz. To se pak odhalují padělky! Jedna radost!
Nemluve o tom, ze ten plagiat muzu vyrobit analogovou cestou + samozrejme neupravovana fotka se prakticky nikdy nepouziva.
Napr ten odpal udelam uplne jednoduse tak, ze nafotim dve fotky a slozim je - pokud to udelam dobre (= ve stejnou denni dobu ...) tak nikdo nema sanci poznat, ze jde o podvrh.
Nechápejte mě špatně, já vůbec nesnižuji hodnotu toho SW co kluci napsali a přeji jim úspěch - vyladit ten algoritmus jistě muselo být náročné, ale osobně se domnívám, že nejvíce peněz spolkly právě právníci, patenty a podobné nesmysly co komplikují vývojářům naprosto zbytečně život. Celkem mě ta poznámka o patenovaném algoritmu, zvlášť v našem právním prostředí rozladila a trošku jsem si po ránu uplivl.
Metod možná mají více, ale jedna z nich využívá slabiny většiny foťáků co mají Bayer senzor (senzor co je v naprosté většině foťáků, jen některé z těch dražších mají např. Foveon), kdy každý z pixelů zachytí jen jednu složku barvy (R, G, B) a zbylé barvy se pak dopočítají interpolací z okolí. Pokud ale někdo s fotkou manipuloval, tak tam ta interpolace na některých místech nebude sedět (nebude průměrem z okolních pixelů, protože tam bylo něco jiného vloženého nebo domalovaného odjinud)
Další metoda je detekovat nedokonalosti na objektivu (špína, chromatická aberace, atd ....) a pokud se neprojevují správně, tak je to známka manipulace.
Viz tahle publikace, kde je několik metod vysvětleno
http://www.cs.dartmouth.edu/farid/publications/spm09.pdf
... a komu to nestačí, tak v závěru té publikace jsou odkazy na konkrétní papery kde v některých je i přesně vysvětlen konrétní algoritmus.
Nicméně tahle služba jde poměrně triviálně zneužít i podvodníky - tak dlouho tam budou cpát nějaký upravený obrázek k ověření (a dále ho upravovat pokud neprojde) dokud se jim nepodaří, aby ho ta služba vzala jako pravý.
Bojím se, že jste tedy poněkud hodně nepochopil.
Vaše tvrzení "rozpoznává vzory (v článku nazvané matice)" je tedy pěkný nesmysl. Matice je jasný matematický pojem. Viz http://en.wikipedia.org/wiki/Matrix_%28mathematics%29
Cituji z článku: "Technologie VerifEyd je postavena na analýze dat, která reprezentují danou fotografii. Typicky se jedná o číselné matice, které podle určitých klíčů kódují veškerou obrazovou informaci."
Je to založené na analýze dat! Tedy číselných matic! Více viz http://en.wikipedia.org/wiki/JPEG#Encoding Ty řady a sloupce čísel v hranatých závorkách, kterým asi moc nerozumíte, to jsou právě ty matice.
Každý encoder formátu JPEG (ve foťáku natvrdo zadrátovaný v hardware, případně firmware) totiž má jinak zvolené koeficienty a každý vzniklý obrázek si nese jeho "otisk". Pokud přeuložím jpeg ve photoshopu a budu o tom tvrdit, že takhle to vypadlo z foťáku, lze to odhalit.
Pokud ale podvod udělám jinak, nemá software šanci.
Asi jste to nepochopil. Ten soft prochází obrazová data a rozpoznává vzory (v článku nazvané matice), které v tomto obrázku být nemohou. Obrázky mohou být (a dávno jsou) rozpoznávány nejen podle popisu (EXIF apod.), ale i podle obsahu.
Ukázkový příklad: jeden odpal je zkopírovaný. Což je jedna z velmi častých forem fotomontáže. Soft zjistí, že stejný vzor je v obrázku vícekrát. Nejde o pořadí jedniček a nul, ale o určitou formu charakteristiku obsahu. I když nějakou část obrázku zkopírujete a upravíte (zesvětlíte, deformace...), tak si pořád zachovává nějaký vzor. Podle míry úpravy se potom vyhodnotí (nebo taky ne) jako podobný.
Navíc prakticky všechny retuše (byť jsou sebedokonalé) přináší do obrázku nějaké nepřesnosti, které mohou vést k identifikaci padělku. Lidské oko je sice nemusí vidět, stroj ano.
Moc nerozumím funkci tohoto produktu. Podle popisu se zdá, že jen hledá odpověď na otázku, zda tento konkrétní snímek mohl vyjít z nějaké dané značky fotoaparátu nebo skeneru.
Takže pokud vezmu nějakou fotku, upravím ji a poté ji přeuložím, tak produkt může zjistit, že se z ní po vyjítí z fotoaparátu nějak manipulovalo (??)
Pokud udělám montáž a tu například přefotím opět totožným fotoaparátem, tak to produkt nezjistí a ani to zjisti nemůže. Stejně tak fotografie ze skeneru padají jako holá obrazová data, takže závisí až na programu, ze kterého fotku uložím. Pokud ji zmanipuluji v tomtéž programu, opět je to bez šance to poznat.
Takže nejde o nic jiného než o eliminaci hloupých a amatérských podvodníků a to ještě v několika ojedinělých případech. Ale zákazníci na to asi slyší, anebo pořádně principu funkce neporozumněli.