Vlákno názorů k článku Seznam.cz vede v bitvě o data z jízdních řádů 1:0. Zastal se ho krajský soud [AKTUALIZOVÁNO] od Roman Nepšinský - Např. Ústav pro jazyk český při Akademii věd...

Článek je starý, nové názory již nelze přidávat.

Podle hodnocení
Podle vláken
Nejnovější

27. 9. 2013 13:30

Roman Nepšinský

Např. Ústav pro jazyk český při Akademii věd financovaný z našich daní sedí na českém jazykovém korpusu a slovníku češtiny, který velmi omezeně zpřístupňují veřejnosti (např. http://prirucka.ujc.cas.cz/). Dal by se skvěle využít např. pro pokročilé online kontroly pravopisu, zlepšení vyhledávání atd. Ale na dotazy o zpřístupnění této databáze veřejnosti nebo spolupráci s komerčními subjekty reagují odmítavě, a to proto, že už prý s nějakým konkrétním komerčním subjektem exkluzivně pracují... Pokud by se Seznam.cz "nudil", mohl by svou pozornost zaměřit i sem, z takových dat by mohlo profitovat více subjektů i nadšených amatérů se svými projekty (viz třeba známý skript na doplňování diakritiky Ohákování http://nlp.fi.muni.cz/cz_accent/)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 9. 2013 15:50

Christof

český národní korpus má na starosti Ústav českého národního korpusu FF UK http://ucnk.ff.cuni.cz/

existují i další české korpusy, třeba http://trac.sketchengine.co.uk/wiki/Corpora/czTenTen2

předpokládám, že pro kontrolu pravopisu apod. byste měl zájem spíš o projekt ajka/majka http://nlp.fi.muni.cz/projekty/nlp-portal/go.py?tool=1 http://nlp.fi.muni.cz/projekty/ajka/
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 10:39

Christof

ten nlpportal? to se nějak upravovalo pro noc vědců v pátek, tak je možná něco rozbité
v podstatě je to lepší rozhraní k http://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph.cgi?jazyk=0
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
27. 9. 2013 14:01

Aleš Miklík

Poznámka pouze k poslední větě: v laboratoři pro zpracování přirozeného jazyka na FI MUNI jsem korpus používal už někdy v roce 2000, takže tam s jeho získáním problémy mít nebudou - což ostatně bude asi platit pro celou akademickou sféru.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 10:26

Roman Nepšinský

Díky za odkazy! Ten pythonosvký skript ale nejede, tak nevidím, co to má umět.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 11:03

Roman Nepšinský

Jo, jede, už i ten první skript když dám kratší text. Koukám, že každý projekt si řeší svůj vlastní systém tagování/kategorií (ČNK "N", NLP "k1"), není to škoda? :) Rozpoznávání správného tvaru má taky nějak fungovat v kontextu věty? Zkoušel jsme tvoje ("tak je možná něco rozbité") a u "je" háže první variantu vždycky zájmeno, sloveso až v alternativách.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 13:46

Christof

ten brněnský systém je samozřejmě lepší :D (mám pocit, že se mezi nimi dá snadno převádět)
morfologická analýza funguje jen na slovo a nabídne všechny varianty bez ohledu na kontext, nad tím je potom úroveň, která se snaží vybrat ten správný druh (http://nlp.fi.muni.cz/projekty/rule_ind/index.cgi)
a další úroveň je syntaktická analýza vztahů ve větě

https://nlp.fi.muni.cz/web2/cgi-bin/index.py?page=main_topics&language=cs
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 14:12

Roman Nepšinský

Tak ta syntaktická analýza už je docela pěkná, většinou některý z prvních stromů se i trefí :). S tím by mě bavilo si pohrát pro tvorbu ultimátního korektorského nástroje... jen kdyby to někdo zpřístupnil i soukromníkům mimo akademickou sféru (a nemyslím tím jen online dotazování vůči serveru s korpusem, to není dostatečně pružné pro vyhodnocování variant)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
29. 9. 2013 15:20

Christof

něco je úplně volně, např.
http://nlp.fi.muni.cz/trac/set/wiki/download
http://nlp.fi.muni.cz/ma/free.html

a většinou se dá nějak dohodnout, nemusí jít nutně o peníze :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 10. 2013 13:29

dustin (neregistrovaný)

Hm, nevím co dělám špatně

http://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph-analyser.cgi?jazyk=0&slovo=Tento+software+vznikl+v+r%E1mci+projekt%F9+LC536+and+2C06009+a+jeho+vlastn%EDkem+je+Masarykova+univerzita%2C&akce=3&kodovani=0

Aktuality

Za sobotním kolapsem na železnici může selhání databáze na serveru v systému GSM-R, řekl ministr

Šéf ČT: Kromě zpravodajství jsme šetřili i jinde, zmrazili jsme 50 milionů

Akademie věd spustila nový web o změně klimatu. Ukazuje, jak se do konce století změní počasí v Česku

Vlákno názorů k článku Seznam.cz vede v bitvě o data z jízdních řádů 1:0. Zastal se ho krajský soud [AKTUALIZOVÁNO] od Roman Nepšinský - Např. Ústav pro jazyk český při Akademii věd...

Aktuality

Za sobotním kolapsem na železnici může selhání databáze na serveru v systému GSM-R, řekl ministr

Šéf ČT: Kromě zpravodajství jsme šetřili i jinde, zmrazili jsme 50 milionů

Akademie věd spustila nový web o změně klimatu. Ukazuje, jak se do konce století změní počasí v Česku

Dále u nás najdete