Odhalte chyby v ChatGPT a získáte odměnu, láká bug bounty program

12. 4. 2023

Sdílet

AI - ChatGPT Autor: Depositphotos

Společnost OpenAI vypsala odměnu za odhalení chyb a zranitelností v jejích službách umělé inteligence, včetně ChatGPT. Odměny se pohybují v rozmezí od 200 dolarů za „objevy s nízkou závažností“ až po 20 tisíc dolarů za odhalení zvlášť závažných chyb. Hlášení je možné podávat přes crowdsourcingovou platformu pro kybernetickou bezpečnost Bugcrowd.

Odměna se ale nevztahuje na případy, kdy bude model ChatGPT zneužit ke generování škodlivého kódu nebo textu. „Problémy související s obsahem zadání pro jazykový model a jeho výstupů jsou mimo tuto výzvu a nebudou odměňovány,“ uvádí OpenAI na stránce Bugcrowd.

A povolený není ani takzvaný jailbreaking, kdy se útočníkovi do systému podaří vložit kód, který mu umožní obejít jeho vlastní bezpečnostní filtry. Tyto scénáře pak mohou zahrnovat povzbuzování chatbota k tomu, aby hrál roli „zlého dvojčete“ a umožnil uživateli povolit jinak zakázané reakce, jako jsou nenávistné projevy nebo návody na výrobu zbraní.

OpenAI tvrdí, že tento typ chyb se nehodí do bug bounty výzvy, „protože se nejedná o jednotlivé, ohraničené chyby, které lze přímo opravit.“ Společnost poznamenala, že „řešení takovýchto chyb vyžaduje rozsáhlé zkoumání a širší přístup“ a hlášení takových závad by měla být zasílána prostřednictvím stránky pro zpětnou vazbu.

Ještě před vypsáním výzvy se například minulý měsíc hackerovi známému jak Rez0 podařilo odhalit 80 „neveřejných pluginů“ pro rozhraní API ChatGPT. Šlo o dosud nevydaných nebo experimentálních doplňků pro chatbota. Rez0 poznamenal, že zranitelnost byla opravena do následujícího dne od zveřejnění na Twitteru.

Našli jste v článku chybu?

Autor aktuality

Redaktor serveru Lupa.cz se zaměřením na telekomunikace, média, IT a právo. Dříve šéfredaktor Právního rádce a mluvčí Českého telekomunikačního úřadu.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).