Čínská společnost DeepSeek pokračuje v publikování svých AI modelů. Poté, co rozvířila trh zveřejněním svých opensource modelů R1, které se výkonem vyrovnají modelům americké OpenAI, ale podle společnosti jsou mnohem levnější na vývoj i používání, přišla s multimodálním modelem Janus-Pro.
Také ten je k dispozici jako opensource (licence MIT). Podle firmy nabízí pokročilou analýzu obrazu a generování nových obrázků na základě textového zadání (promptu). DeepSeek tvrdí, že v některých testech (GenEval) jeho výsledky předčí model DALL-E od americké OpenAI nebo model Stable Diffusion 3 Medium.
Janus-Pro je k dispozici ve dvou verzích: ta menší zahrnuje 1 milardu parametrů, větší 7 miliard. Model má ovšem i některá omezení: tím hlavním je limit pro velikost analyzovaných či generovaných obrázků na 384 × 384 pixelů.
Janus-Pro je založen na starším modelu Janus. Natrénovaání nového modelu podle DeepSeek zabralo asi dva týdny a probíhalo na clusteru vybaveném výkonnými kartami Nvidia A100 (40 GB). Pro trénování většího modelu DeepSeek použil celkem 256 karet (32 serverů po 8 kartách).