Vlákno názorů k článku Lesk a bída českých vyhledavačů od Radek Doležel - Chtěl bych touto cestou vyjádřit omluvu uživatelům ftxt.quick.cz...

Článek je starý, nové názory již nelze přidávat.

6. 12. 2001 12:12

Radek Doležel (neregistrovaný)

Chtěl bych touto cestou vyjádřit omluvu uživatelům ftxt.quick.cz za chybné zobrazení odkazů sama na sebe. Při rekonfiguraci robota (tj. části, jež stahuje obsah stránek z web serverů) jsme omylem vypustili definici zamezující cyklickému přístupu sama na sebe.
Chybu jsme neprodleně opravili a v brzké době bude k dispozici katalog stránek sestavený dle upravené konfigurace.

Ftxt.quick.cz využívá technologie Megatext. Unikátní vlastností je možnost vyhledávat česká ohýbaná slova ve všech jejich morfologických tvarech. Databáze, jež je pravidelně kompletně obnovována každé dva týdny, obsahuje 5 miliónů webových stránek s celkovým počtem 1,5 miliardy slov.

Radek Doležel
ČESKÝ TELECOM, a. s. - Imaginet, o. z.
Internet Content Group
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 12. 2001 15:59

Martin Kopta (neregistrovaný)

Nejsem si tím docela jistý, ale řekl bych, že skloňovat a časovat, stupňovat a negovat by měl umět i WebSeek. K čemu jinému by jinak využíval iSpell. Ovšem je pravda, že poslední iSpell, který jsem viděl, obsahoval jen asi 190.000 hesel. Je to sice více, než kolik obsahuje Slovník spisovné češtiny, Slovník spisovného jazyka českého nebo Pravidla pravopisu, ale i tak je to velmi málo. Chtělo by to, aby opensource komunita zapracovala, třeba by pro ten účel dostala svolení využít i Český národní korpus, mohla by to být třeba zajímavá ročníková či diplomová práce pro někoho z komputační lingvistiky třeba na MFF UK. Co říkáte.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 12. 2001 18:16

Marek Kubita (neregistrovaný)

Kdyby váš robot neignoroval robots.txt, mohli jste si ušetřit práci :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 12. 2001 18:43

Martin (neregistrovaný)

No on to ten robot mozna neignoruje, hlavne by robots.txt na ftxt.quick.cz musel byt :-) aby bylo co ingorovat.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
6. 12. 2001 19:05

Marek Kubita (neregistrovaný)

To taky, ale quick.cz opravdu ignoruje robots.txt, proto jsem na svůj web zakázal přístup z 194.228.200.8. Robot Megatextu neobtěžuje tak často, zatím jsem ho nechal být.
Je zajímavé, že se čeští roboti zpravidla nesnaží stahovat stránku v různých kódováních češtiny - autoři si dají tu práci s implementováním pravidel pro vyloučení URL s /toISO-8859-2/ apod., ale dodržovat všeobecně uznávaný Robots Exclusion Protocol je nad jejich síly.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 12. 2001 12:33

Roj (neregistrovaný)

Pro kazdeho, kdo poznal gooooogle, jsou vsechny omluvy bezpredmetne :-)

Aktuality

Za sobotním kolapsem na železnici může selhání databáze na serveru v systému GSM-R, řekl ministr

Šéf ČT: Kromě zpravodajství jsme šetřili i jinde, zmrazili jsme 50 milionů

Akademie věd spustila nový web o změně klimatu. Ukazuje, jak se do konce století změní počasí v Česku

Vlákno názorů k článku Lesk a bída českých vyhledavačů od Radek Doležel - Chtěl bych touto cestou vyjádřit omluvu uživatelům ftxt.quick.cz...

Aktuality

Za sobotním kolapsem na železnici může selhání databáze na serveru v systému GSM-R, řekl ministr

Šéf ČT: Kromě zpravodajství jsme šetřili i jinde, zmrazili jsme 50 milionů

Akademie věd spustila nový web o změně klimatu. Ukazuje, jak se do konce století změní počasí v Česku

Dále u nás najdete