Nalezení informace zadáním jednoho či dvou klíčových slov není hudbou vzdálené budoucnosti, ale vzdalující se minulosti, protože stránek, kde ta slova jsou, přibývá obrovskou rychlostí. Odpověď na specifičtější dotazy lze dnes získat jen fulltextovým vyhledavačem s booleanským hledáním.
Rozumět přirozenému jazyku potřebuje uživatel - dvě klíčová slova nejsou přirozený jazyk, ale dokumenty, které uživatel hledá, většinou v přirozeném jazyce jsou.
Nevěřím,že internet někdy odstraní nutnost používat vlastní hlavu - stejně jako při hledání v knihovně najdete specifičtější informace jenom, když už o tématu něco víte a během hledání využíváte zjištěné informace k tomu, abyste hledal cíleněji.
Jenom je mi záhadou, proč je snažší najít tu správnou stránku v angličtině pomocí třeba Altavista-advanced search nebo Infoseek Advanced Search, než v češtině pomocí Kompas-pokročilé vyhledávání: nenajde stránky, o kterých vím, že existují. Anglicky psaných stránek je přitom o mnoho řádů víc.
Nevěřím, že někdy bude existovat mašina, která bude odpovídat na základní lidskou potřebu :"Nevím, co chci, ale nedám pokoj, dokud to nedostanu".
V podstate souhlasim, take jsem uz zvazoval, zda odstupnovani bodu 3,2,1 je nejlepsi (prvni ma trojnasobek oproti patemu odkazu), nejspis to pri samotnem testu jeste poupravime smerem k mensi "prisnosti" ohodnoceni.
Delal jsem uz nejake predbezne testy (samotny test pro Lupu budou delat pokud mozno jini lide, ja bych nemusel byt povazovan za nestranneho) a "tve" Centrum si vede velmi slusne (coz jsem necekal ;-) ) - a po dukladnejsi analyze jsem dospel k necemu, co souvisi s tvym komentarem - Centrum velmi casto vrati pozadovanou stranku, ale ne vzdy na prvnim miste - oproti tomu Google ji vrati take a to presne na prvnim miste.
Myslim ze moderni vyhledavace uz se idealu (aspon takovemu, jaky budeme hodnotit) docela blizi. Co se telepatie tyce, Google 1.4.2000 vydal specialni utilitku (tzv. mentalplex)- animaci spiralovite se svijejiciho terce -> kdyz uzivatel usilovne mysli na to, co chce vyhledat a klikne na tercik, Google vrati patricny vysledek!
Clanek se mi velice libi, jen s jednou veci nesouhlasim: To,
zda se hledana stranka objevi jako prvni nebo jako ctvrta, je vetsine uzivatelu uprimne jedno, zejmena je-li z popisky ve vystupu vyhledavace snadno poznatelne, ze je to prave tato stranka. A tak bude popisovany system bodovani mit relevanci k realite (tj. pocitum uzivatele) neprijemne malou, ponevadz se podstatne rozdily (tj. zda se hledana stranka objevila na prvni strance vystupu ci nikoliv) utopi v sumu generovanem nepodstatnymi rozdily mezi prvnimi nekolika pozicemi. Lepsi by bylo, kdyby byly body ze zacatku vice mene konstantni a pote prudce klesaly k nule.
Z jineho soudku: Nalezeneim informaci na Internetu zadanim jednoho ci dvou klicovych slov (snad s vyjimkou hledani produktu ci firmy nejakeho konkretniho jmena) bude jeste dlouho hudbou vzdalene budoucnosti, jelikoz by v lepsim pripade od vyhledavacu vyzadovalo porozumeni prirozenemu jazyku (hle, opet Chomsky), v horsim pak telepaticke spojeni s uzivatelem, aby pochopily to, co se z textu dotazu ani vycist neda. A tak je pri soucasnem stavu techniky vice mene nutnosti, aby se nejen vyhledavace ucily nove triky, ale take aby se uzivatele snazili "te neme tvari trosku pomoci", to znamena neformulovat dotazy naprosto bezmyslenkovite a namisto toho se pokusit byt trochu vystiznejsi a treba uvest hned nekolik slov souvisejicich s tematem a pripadne je i nejak ohodnotit. A proto by vyhledavacove testy mely obsahovat i takoveto "sofistikovanejsi" dotazy, nejen "humpolactinu".
Zminujete Google a Megatext. Oba maji sve vyhody i nevyhody - Google ma skvelou relevanci, Megatext ne. Megatext ma vetsi a nejspis i aktualnejsi databazi stranek v .cz, Google zase umi najit ceske stranky i jinde (ale zase si je plete se slovenskymi, jugoslavskymi a polskymi). Google neumi moc operatoru, Megatext zadne. A k tomu mame jeste dalsich minimalne 10 vyhledavacu. Je to tedy slozite tema a tento clanek se pokousi najit zpusob, jak mu porozumet.
Jan Zacek o neco vyse rika: "Přesné cílení a vystižení tématu je velmi významný přístupový rozdíl a tento článek to uživatelům jenom zase znepřehlední" - vzdyt souhlasim - take si myslim, ze je to vyznamny pristupovy rozdil a PRAVE PROTO jsem to rozdelit na dva ruzne testy. Tedy se vyhybam te chybe, kterou mi vytykate... ne?
Obecne x odborne terminy: pokusime se o co nejsirsi zaber ruznych dotazu; rozliseni je totiz jeste slozitejsi (reallife x internetove informace, zabava x prace, muzi x zeny, casto kladene x obskurni dotazy, atd.)
Dale tvrdite (stale pan Zacek), ze "na obecne dotazy, vystizeni tematu jsou nejlepsi katalogy" - ja si myslim, ze toto je predsudek - zminovany Google si dobre poradi s obojim. Ale i toto je vec, ktera nas pri testu bude zajimat.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).