No ano, můžeme to bagatelizovat, ale realita je taková, že OpenAI se řídí zákony EU, mimo jiné umožňuje kompletní výmaz dat na základě žádosti, jak požaduje GDPR, také má nastavení míry ukládání dat pro trénování.
DeepSeek naopak podobně jako všechny ostatní technologie vlastněné čínskými společnostmi dodržují Čínskou legislativu, která obsahuje např. tzv. Zákon o zpravodajské činnosti (viz https://sinopsis.cz/cinsky-zakon-o-celonarodni-spionazi/, článek 7 je nejzajímavější), podle kterého musí každý jednotlivec i firma napomáhat a podporovat státní zpravodajskou činnost a udržovat veškeré informace o této spolupráci v tajnosti.
Pokud se dotazujete DeepSeeku na recept na koprovku, asi to nebude tak rizikové, jako pokud ho zaměstnanec vládní instituce použije k formulování oficiálního dopisu nebo shrnutí nějakého veřejně nedostupného dokumentu. Ale dneska těžko říct, co jsou a co nejsou zajímavé informace, pojem data mining a big data už dneska není tak zajímavé téma, byť je to základ financování webu.
Jinak samozřejmě jediné ideální řešení je provozovat vlastní AI na vlastním hardware ideálně zcela offline, aby se předešlo takovým těm pocitům, že "je to za firewallem ok", jako když kolega v práci nasadil Hikvision kamery a tvrdil, že je to ok, protože DVR má na GW zakázaný přístup na net. Už ale nějak neřeší, že k prohlížení videí z DVR používá obskurní .exe malware stažený čertví odkud a nainstalovaný s adminovskými právy na lokální počítač, který má plný přístup na net...
copy&paste marketingových deklarací také nabírá na obrátkách, že jo?
Zkoušel jsi ten DeepSeek trénovat lokálně? Jak jsi se zbavil toho předtrénovaného deepseek-coder? Zkoušel jsi deepseek-coder natrénovat sám? Kdepak jsi k tomu našel fine tuned dataset, na kterém trénovali?
Sice si můžeš DeekSeek natrénovat sám, ale výsledek rozhodně není takový jako stažený DeekSeek. To netrvdím, že jejich kód a model je k ničemu, ale rozhodně to není náhrada.
> Pokud se dotazujete DeepSeeku na recept na koprovku, asi to nebude tak rizikové, jako pokud ho zaměstnanec vládní instituce použije k formulování oficiálního dopisu nebo shrnutí nějakého veřejně nedostupného dokumentu.
Zaměstnanec vládní instituce by neměl používat libovolný jazykový model pod správou komerční firmy nebo v jurisdikci vlády, která je otevřeně nepřátelská vůči EU, pro tvorbu oficiálního dopisu nebo shrnutí nějakého veřejně nedostupného dokumentu.
Nemám absolutně důvěru v to, že pokud by aktuální US prezident, který aktuálně testuje místní právní systém, a používá cla jako nátlakový nástroj, měl nějaké zábrany použít libovolnou výhodu, kterou je schopný získat. Včetně obsahu promptů v jazykových modelech provozovaných firmami v USA.
"realita je taková, že OpenAI se řídí zákony EU" Coz je ovsem pritezujici okolnost, protoze pokud o mne vsechno vi nekdo, kdo se ridi mistnimi zakony, tak je to az na vzacne vyjimky mnohem horsi situace, nez kdyz je to nekdo, kdo se jimi neridi a s mistnimi urady treba ani ochotne nespolupracuje. Idealni samozrejme je, kdyz je nema nikdo.
OpenAI podlieha aj americkým zákonom. A už máme napr. rozhodnutie z 05/2025 kde americký súd rozhodol, že musia uchovávať všetky konverzácie (vstup/výstup) vrátane privátnych a zmazaných konverzácií. S výnimkou chatGPT Enterprise, EDU a API so zmluvne dohodnutným neuchovávaním.
OpenAI sa musí riadiť EU právom už len z toho dôvodu, že sa tu aktívne snaží predávať, takže extrateritorialita by ho aj tak neminula. Samozrejme sa tak môžu tieto dva právne systémy dostať do sporov, ktoré sa riešia - povedzme ťažko - a je tam hromada nejasností a rozporov. Často sa ani nedá oprieť o nejaké judikáty/precedensy, pretože ak sa podobná situácia stala, tak nemusela riešiť verejne.
Nespoliehal by som teda na to, že OpenAI skutočne niečo zmaže. Veril by som, že s tou informáciou nebudú pracovať a poskytnú ju len keď budú musieť. Podobne ako napr. taký ProtonMail
A tak zrovna ten lokalni stazeny opensource model zakaz nezahrnuje.
Ale jinak je tam ta od NUKIBu prepapouskovana pitomina s "pridruzenou spolecnosti" taky... to jsem fakd zvedavy, jak si to budou povinne urady kontrolovat :) Samozrejme kazdej urad sam za sebe... aneb proc nedelat ve statni sprave jednu a tu samou vec duplikovane Xkrat... zeano.
ano, nevztahuje, protože pak se data neposílají mimo. Reagoval jsem ale na to, že ho může přetrénovat, prakticky nemůže, může si udělat jen vlastní pokročilý model.
Jo, tohle dělání stejné věci u každého znovu je celkový problém české správy. Všichni musí dělat to stejné a stát minimum věcí připravuje dopředu.