Jazykový model Seznamu se jmenuje Šelma, firma pracuje na zapojení AI do služeb

31. 5. 2024

AI - umělá inteligence - ilustrační foto

O tom, že Seznam.cz trénuje vlastní velké jazykové modely, jsme už psali. Produktový manažer vyhledávání Martin Kirschner teď na sociální síti X zveřejnil vlákno s podrobnostmi o tom, v jakém stadiu se vývoj nachází. Nabízí také zájemcům, že mohou napsat své prompty, které pak na LLM vyzkouší.

Velký jazykový model Seznamu se jmenuje SeLLMa (čte se Šelma) a jde o doučené opensource modely LLaMa of firmy Meta a Mistral od francouzské společnosti Mistral.ai. Seznam je dotrénoval metodou continued pretraining.

„Continued pretraining je vzhledem objemu našeho korpusu celkem compute-heavy, ale na to jsme mysleli a máme GPU cluster, kde protočit všechny tokeny z českého korpusu 70B modelem trvá zhruba 1 měsíc,“ píše v jednom z příspěvků Kirschner.

Seznam má podle něj na trénování k dispozici desítky až stovky GPU Nvidia H100.

Model se podle Kirschnera povedl. „Máme 7B modely, které v konkrétních úkolech překonávají GPT-3.5, máme 70B model, který obecně překonává GPT-3.5 a na konkrétních úkolech je srovnatelný s GPT4,“ říká.

K nasazení LLM na konkrétních službách Seznamu by podle něj mělo dojít během letošního a příštího roku. Momentálně mají lidé ve firmě rozpracováno přes 20 produktových vylepšení.

TIP: Netypické chlazení i napájení. Podívejte se do nového datacentra Seznam.cz:

Slavnostní přestřižení pásky. Kokura 3 je přístavbou k budově datacentra Kokura v Horních Počernicích, které Seznam otevřel v roce 2015.

Dalších 31 fotografií

Vstoupit do diskuse

Zasílat nově přidané názory e-mailem

Našli jste v článku chybu?

David Slížek

Šéfredaktor Lupa.cz a externí spolupracovník Českého rozhlasu Plus. Dříve editor IHNED.cz, předtím Aktuálně.cz a Českého rozhlasu. Zaměřuje se na telekomunikace, umělou inteligenci i na média. Najdete ho na Twitteru nebo na LinkedIn.

Sdílet

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5

Autor aktuality

David Slížek

Témata:

Jazykový model Seznamu se jmenuje Šelma, firma pracuje na zapojení AI do služeb

Sdílet

Seznam.cz chystá vlastní umělou inteligenci. V češtině už je o něco lepší než GPT-3.5

Autor aktuality

David Slížek

Témata:

Další aktuality

Policiie vyšetřuje kyberkriminalitu, podklady sbírala i v rozhlase. V případu zadržela dvě osoby

V Česku se i díky 3D tisku rozjela výroba ovladačů pro letecké simulátory

Čip z Česka se začal masově vyrábět. Tropic Square jako první na světě nemá tajnosti

Streamovací služba HBO Max zvyšuje ceny předplatného v České republice

Kvíz týdne

Dále u nás najdete

Průměrná mzda se utrhla ze řetězu. Vzroste i ta minimální