No, toho bych se nebal. Ono spise jde o to, kdy je to prestane bavit. Jako zapis do CV to je dobre a je to zcela jiste opravdu zajimava prace. Ale strojove porozumeni psanemu textu je tak komplikovane tema, ze na to nestaci jednotky studentu. Na to musi byt tymy. A kdyz se to dodnes nepovedlo Googlu, ani Facebooku, kteri maji penize na to, aby takovy vyvoj financovali....
Casem se vam z toho vyloupne spoustu malych "nepresnosti" se kteryma si modely neumi poradit, ale jsou pak v celku dulezite a ty musi postupne nekdo resit. A to vam nafoukne backlog takovym zpusobem, ze nebudete vedet co drive. Vysledek nejaky bude, ovsem jestli to bude v realnem svete pouzitelne, to nikdo nedokaze rict.
glorifikovat velké společnosti se může vymstít. Např. na strojovém porozumění textu a strojových překladech v Googlu, Facebooku, Microsoftu pracoval český student (v té době) Tomáš Mikolov, který je i autorem např. knihoven word2vec, fastText. Od loňska se objevuje v týmu CIIRC pod ČVUT. Nepodceňoval bych ty "jednotky studentů" :).
Zrovna právě naše ČVUT na tomhle poli dělá hodně práce na evropském měřítku, má řadu velice schopných lidí a spolupracuje s komerčními firmami, za sebou úspěšné projekty. A to u nás nejsou jediní, kteří se tomu hodně věnují a mají za sebou historii.
Tak urcite to nechci podcenovat, ano word2vec je urcite velice dobry pocin i dalsi projekty jsou velmi kvalitni. I kdyz maji svoje chyby.
Co jsem tim chtel rict je, ze toto neni jednoduchy projekt a vyzaduje dlouhodobejsi pristup. Neda se to vyresit za pul roku, ani za rok. Nechci to rozhodne shazovat, vim, ze JŠ udelal pro to, aby se studenti realizovali v realnych problemech hodne. Jenom jde o to, zda a v jake kvalite to bude kdy bude hotove.