Ondřej Klimeš (Newton Technologies): Beey dokáže rozpoznat, který poslanec mluví

16. 12. 2024
Doba čtení: 2 minuty

Sdílet

Autor: Beey, publikováno se svolením
Poslanecká sněmovna začala letos v září používat pro přepisy jednání aplikaci Beey od české společnosti Newton Technologies. Už delší dobu ji mají k dispozici i tuzemské soudy nebo policie. Aplikaci využívají ale například i úřady v Chorvatsku.

Důvod, proč aplikace Beey vznikla, souvisí se sesterskou společností Newton Media. Ta se specializuje na monitoring tisku a z toho důvodu už v devadesátých letech začala pořizovat přepisy televizního a rozhlasového vysílání.

„Takový přepis je velmi náročná ruční práce, takže když se zhruba před patnácti roky objevila možnost ji přenechat strojům, začali jsme se tím vážně zabývat. V zahraničí tehdy existovaly systémy pro převod hlasu na text, pro češtinu to ale nebylo dostupné,“ říká v podcastu produktový a marketingový manažer Newton Technologies Ondřej Klimeš.

Celý podcast si můžete pustit přímo zde:

Firma se proto spojila s lidmi z Technické univerzity v Liberci a začala vyvíjet vlastní software, který by byl k dispozici především tuzemským zákazníkům. Klimeš zmiňuje, že aplikace prošla několika stádii, firma například stále také nabízí program Newton Dictate. Na Beey se pracuje intenzivně posledních pět let. Aktuálně má aplikace kolem 60 tisíc uživatelů z padesáti zemí světa.

Společnosti pomohlo, že má obrovský archiv nahrávek a na nich mohla aplikaci testovat. Trénování jazykových modelů v případě češtiny bylo podle Klimeše složité nejen kvůli gramatice, ale také kvůli omezenému množství tréninkových dat. „Zatímco angličtina má díky své globální popularitě obrovské databáze, čeština takové možnosti neměla. Využili jsme však naše archivní záznamy, což nám umožnilo vyvinout jeden z nejlepších modelů pro češtinu,“ říká Klimeš.

Nabízíme vám také přepis části podcastového rozhovoru do textu. Kompletní transkript mají k dispozici podporovatelé Lupa.cz.

Software Beey dnes slouží nejen Poslanecké sněmovně (viz text Poslanecká sněmovna nasadila umělou inteligenci pro přepis jednání, stenografů ubývá), ale i Ministerstvu spravedlnosti, kde pomáhá soudům s přepisy jednání. A například policie využívá Beey v zabezpečeném režimu, aby ji oddělila od internetu. Svůj vlastní uzavřený systém má i zmíněná sněmovna.

Outstream Placeholder

„V případě sněmovny bylo nutné model upravit, aby dokázal identifikovat jednotlivé řečníky. Pro více než dvě stě lidí tak vznikl takzvaný voiceprint, díky kterému Beey pozná, který poslanec mluvil,“ dodává Klimeš.

Co dále v podcastu zaznělo:

MM Influenceři

  • Jaké technologie Beey využívá? 
  • V čem funguje jinak než třeba Whisper AI nebo další aplikace na převod mluveného slova na text?
  • Které instituce v ČR i v zahraničí systém využívají?
  • S jakými jazyky umí Beey a na které se specializuje?
  • Jaké další plány Newton Technologies má?

V podcastu, který běží od poloviny roku 2018, zpovídáme zástupce české e-commerce, IT scény, mediálních domů i osobnosti z dalších souvisejících oborů. Pro poslech stačí mít k dispozici počítač, tablet, nebo jen mobilní telefon. Nejjednodušší cestou je využití speciální aplikace.

Podcast serveru Lupa.cz najdete na všech hlavních platformách: Apple Podcasts, Spotify nebo PodBean. Sledovat můžete i náš kanál na YouTube.

  • Chcete mít Lupu bez bannerů?
  • Chcete dostávat speciální týdenní newsletter o zákulisí českého internetu?
  • Chcete mít k dispozici strojové přepisy podcastů?
  • Chcete získat slevu 1 000 Kč na jednu z našich konferencí?

Staňte se naším podporovatelem

Seriál: Rozhovory
Neutrální ikona do widgetu na odběr článků ze seriálů

Zajímá vás toto téma? Chcete se o něm dozvědět víc?

Objednejte si upozornění na nově vydané články do vašeho mailu. Žádný článek vám tak neuteče.


Autor článku

Autor je od ledna 2018 ředitelem médií vydavatelství Internet Info. Předtím 6 let vedl zpravodajskou sekci portálu iDNES.cz, ještě předtím byl několik let reportérem celostátní redakce MF DNES. Občas si rád něco napíše.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).