Vlákno názorů k článku Co opravdu očekáváme od vyhledávačů? od lukas.suchanek - Ave, jsem jen jeden z mnoha lidi co...

  • Článek je starý, nové názory již nelze přidávat.
  • 12. 5. 2003 8:06

    lukas.suchanek (neregistrovaný)
    Ave,
    jsem jen jeden z mnoha lidi co vyhledavani na webu cas od casu potrebuji a proto se me naroky meni pripad od pripadu.
    Kdyz chci vyhledavat v ceskych webech, je pro me dulezite, aby vyhledavac umel sklonovat, nebot kolikrat mnou hledana stranka obsahuje slovo nejakym zpusobem vysklonovane, musi si take umet poradit s diakritikou (zkuste zadat googlu 'akvarijni rybicky' a 'akvarijní rybičky' a pak totez v jyxu). Me pro vyhledavani na ceskem webu jyxo vyhovuje snad nejvic ze vseho co jsem zatim mel moznost otestovat.
    Vyhovuje mi i "dalsich XXX odkazu odtud", coz dost vyhledavacu umoznuje, nektere umoznuji i nahled stranky - to je taky fajn, aspon se netahaji obrazky, ale leckdy by mi stacil vetsi vysek nez jen jedna ci dve radky ve vysledku hledani, abych se zorientoval jestli me to zajima nebo ne.
    Nekdy zase clovek hleda obrazek a zde se mi treba libi pristup googlu, ze zobrazuje rovnou nahledy. Nevim sice jestli ty obrazky vyhledava jen podle nazvu, altu ci i neceho jineho, ale povetsinou jsem nasel co jsem hledal.
    Jindy clovek potrebuje najit diskusi na nejake tema a zde je dost problem, ale to nebude ani tak problem vyhledavacu, jako spis serveru s diskusemi, ze prispevku je tam tolik, ze uz se to prakticky neda dohledat ci uz zmizeli - zkratka je to bida.
    Vyhledavani souboru ci utilitek moc nepouzivam, ale dovedu si predstavit ze pouzit k tomu bezny vyhledavac by asi praci neusnadnilo. I tento druh vyhledavani ma sva specifika a jeho realizace by rade lidi mohla pomoci.
    Obdobne je to z vyhledavanim hudby, melodii, navodu ci manualu k vyrobku, cenikach apod.
    Zpresnovat by se dalo dost dlouho.
    Katalogizace odkazu (ala seznam) ma take sve vyhody, ale velkou nevyhodu spatruji v tom, ze rada odkazu se v nich nikdy neobjevi a jinak nez fulltextem se k nim neda dostat - takze ja katalogizacni vyhledavani pouzivam jen v pripade, ze selze fulltext - a i tak mi ve vetsine pripadu nepomuze (leda by ve fulltextu bylo obrovske mnozstvi odkazu, ktere nejde zpresnit a nechce se mi to prohledavat odkaz po odkazu)

    / Lukas Suchanek
  • 12. 5. 2003 11:51

    Jiří Donát (neregistrovaný)
    Zde se objevuje zajímavý námět: zánik katalogů. Sám si vzpomínám na to, že zpočátku jsem na internetu vyhledával prakticky pouze prostřednictvím katalogů. Dnes se naprostá většina mých dotazů uskuteční pomocí vyhledávací lišty Google. Vyhledávání prostřednictvím přímého dotazu je pravděpodobně přirozenější a více odpovídá analogii s dotazy v přirozeném životě; problém každého katalogu je zejména v tom, že každou informaci můžeme zařadit mnoha různými způsoby - přirozený dotaz tento problém odstraňuje. Toto je mimochodem vrozený a neodstranitelný problém XML standardu. Dokonce bychom mohli vyslovit hypotézu, že XML byl stvořen pro ideální svět, nikoliv pro ten náš, a proto nemá šanci se ujmout.

    Myslíte si, že vývoj na internetu spěje k zániku katalogů?
  • 12. 5. 2003 12:12

    Lukas Suchanek (neregistrovaný)
    Ave,
    takhle pesimisticky bych to nevidel. Katalogy mohou existovat v mnoha ruznych podobach a zvlaste ty, co si kladou za cil byt specializovane na urcitou omezenou oblast mohou mit slusnou budoucnost - konec koncu kde hledat "kompletni seznam neceho", nez ve specializovanem "katalogu"?
    Na prikladu seznamu lze ukazat, ze katalogizacni hledani je pro radu lidi porad jediny mozny zdroj odkazu. Procento internetovych laiku a zacatecniku vyhledavajicich pouze katalogove je znacne, dokud se na kurzech pocitacovych gramotnosti, zakladu internetu, na skolach s indosem bude vyucovat vyhledavani pres Seznam (Atlas, Centrum, ...) porad to bude mit vyznam.
    Zjednodusil jsem to jen na CR, protoze poznatky o tom jak je to ve svete nemam. Nepredpokladam, ze by se tam zacinalo hledat rovnou ve fulltextech, konec koncu prave hledani v katalogu je lidem zvyklim pouzivat Zlate Stranky tak nejak blizsi. Nevim jak moc je Google (ci jine fulltextove vyhledavace) marketingove agresivni, ale vim, ze Seznam si v tomto ohledu nevede nejhure - a fakt, ze defaultni vysledky jsou z katalogu a fulltext je az dalsi v nabidce take o necem svedci - konec koncu ze zobrazovani zvyhodnovanych odkazu jsou mimo jine take zivi.
    Ale fakt, ze katalogy nejsou schopny autokatalogizace (tj. ze by si podobne jako fulltext tahaly stranky z internetu a sami si je tridily do svych skatulek) je chte nechte stavi do jine roviny.

    Kdyz uz je ale rec o budoucnosti vyhledavani - objevily se zpravy o semanticke analyze obsahu stranek a pripadne i semanticke analyze vyhledavaciho dotazu. Mozna, ze tudy driv nebo pozdeji povede cesta, ale jsem spise skeptik. Mozna ze to bude fungovat nejdrive pro anglictinu, coby jeden z jednodussich (a nejrozsirenejsich) jazyku, ale pro cestinu se toho v dohledne dobe nedockame.

    / Lukas Suchanek
  • 12. 5. 2003 12:16

    Roger (neregistrovaný)
    Taky katalogy nepouzivam (a krom par vyjimek jsem ani nepouzival), ale i pri hledani googlem se AFAIK nejprve vypisi veci z katalogu. Ma to svou vyhodu - pro nektere veci (produkty, ...) jsou v katalogu jejich "opravdove" domovske stranky, takze vam nehrozi, ze budete bloudit nekde jinde.
    Ja osobne hledam fulltextem vsechno, co shanim :)
  • 12. 5. 2003 12:58

    Jiří Donát (neregistrovaný)
    Myslím si, že ne. Pokud já vím, nejprve se vypíší "sponzorované" odkazy, tedy takové odkazy, u nichž si jejich provozovatel zaplatil preferenční výpis na dané klíčové slovo. Ty se vypisují i do pravého sloupce. Zbytek je pak řazen sestupně podle Page Rank. Přesný algoritmus bohužel (a z jeho pohledu i pochopitelně) Google nezveřejnil...
  • 12. 5. 2003 13:04

    Jiří Donát (neregistrovaný)
    Tato problematika úzce souvisí s algoritmem, který je použit například pro automatické generování první stránky na news.google.com. Na této stránce máme různé kategorie ("World", "U.S.", "Business"...), ty jsou ale zřejmě převzaty ze stejných kategorií použitých zpravodajských médií. Pokud bychom tedy převzali hypotézu že od "hodnosti" konkrétních stran se nějakým způsobem přejde k "hodnosti" informačních zdrojů, postačilo by vyřešit kategorizaci těchto zdrojů. Ale to je dost vzdálená vize. Pořád by bylo zapotřebí vyřešit automatický algoritmus, jak stanovit hodnost zdroje. Podle vysokého počtu stránek s vysokou hodností? Jak ale ošetřit, že zdroj může být vysoce hodnotný pouze pro určitou specializovanou komunitu? Jeho celková hodnost pak může být průměrná...
  • 12. 5. 2003 13:34

    Fico (neregistrovaný)
    To s tim XML jsem nepochopil. Autor se asi ne prilis dobre orientuje v XML.

    Take bych navrhoval ustoupit z tech managerskych formulaci, kterymi je text doslova prosycen. Uplne mi tim unikl smysl nekterych odstavcu.

    Kdyz uz by to melo byt hi-tech, doporucoval bych neco o mobilnich agentech. Google je stara technologie a takhle hledac za par mesicu vypadat nebude.

    Jde-li naopak o katalogy, tak jejich zanik je spojen s lenosti tvurcu a neporadkem a nelogicnosti, kterou v tom maji. Projdu-li si katalogy 3 velkych ceskych vyhledavacu, tak je to tragedie. Vemte si treba Seznam - plagiat Yahoo jak vysity, naprosta impotence vlastni myslenky. Podobnou lenost myslet projevuji pri sprave katalogu, a pak to logicky umira.
  • 12. 5. 2003 14:13

    Jiří Donát (neregistrovaný)
    Omlouvám se, pokud jsou některé mé formulace nejasné. Z textu Vašeho příspěvku ale cítím, že přemýšlíme stejným směrem. "Lenost tvůrců" katalogů je přesně to, co jsem myslel, když jsem mluvil obecně o "lenosti" tvůrců obsahu. Navíc si myslím, že se tato vlastnost dá rozšířit i na druhou stranu pyramidy - na "lenost" uživatelů. Jinými slovy, vyslovil jsem hypotézu, že většina lidí na internetu je ochotna něco udělat pouze tehdy, pokud z toho oni sami budou mít prospěch. Samozřejmě existují i výjimky, ale s těmi není možné počítat při navrhování masových technologií. Masové technologie tedy mají počítat s lidmi takovými, jací jsou, jinak nemají šanci se uplatnit.
    XML je relativně složitou rodinou standardů, která předpokládá, že ji někdo dodefinuje a pak ji bude masivně, dlouhodobě a konzistentně používat. K tomu, aby se tak skutečně stalo, musí ale mít uživatelé dobrý důvod a motivaci. A ta mi v případě XML chybí. Aspoň zatím.
  • 12. 5. 2003 14:52

    Fico (neregistrovaný)
    S tim XML tomu asi nerozumim ja. Podle mne je to jen datovy format, semantiku logicky musi dat ten co to pouzije. Dalsi kouzlo v tom nevidim. Chapu opacnou analogii - spatna semantika "katalogu" se promitne do XML (kdyz to na to nekdo hodi), a proto to nepomuze. Takhle jste to myslel?

    S "obycejnymi" lidmi je to pravda, ale otocte to na pozitivum. Pak muzete vytvorit agenta s jednoduchou neuronovou siti a par heuristikami, co dokazi danou informaci hledat jako "jeho pan" (zde pozor na tu 1-1 vazbu na uzivatele), vytvaret JEHO pageranky (nikoliv ty globalni googlovske) a simulovat JEHO zpusob hledani a mackani odkazu. Potom staci aby tahle masinerie bezela non-stop, a kdyz "pan" neco hleda, aby parametry predala centralnim algoritmum. Pak se daji tyhle parametry clustovat (lidi jsou vesmes stejni), cimz vytvorite katalogy/clustery "lidi" a.k.a. jejich profilu. Vyhody to ma dve - marketing ve stylu big bro, a pak pro moznost cachovat vypocty na core uzlu.

    Razem jste v jinem svete. Dejte mi solidni konektivitu, unix masinu na pateri, stravenky, a do Vanoc to jede... :-)
  • 12. 5. 2003 15:09

    Michal Illich (neregistrovaný)
    > Razem jste v jinem svete. Dejte mi solidni konektivitu, unix masinu na pateri, stravenky, a do Vanoc to jede... :-)

    Tak poslete mail a muzete to mit :)
  • 13. 5. 2003 19:38

    Honza (neregistrovaný)
    Pokud budete mít zájem, tady je můj e-mail: andel@gigant.cz. Ozvěte se a můžem se domluvit. Napište jaké chcete servery, připojení máme - páteř GTS 2Gbps a můžeme se domluvit. Stačí když mi tam pošlete Váš mail a telefon a já se Vám ozvu. Díky
  • 26. 5. 2005 16:27

    Milan Kryl (neregistrovaný)
    Pokud jste myslel vasi nabidku vazne, tak se ozvete a jiste se domluvime.
  • 13. 11. 2007 19:36

    JenJenda (neregistrovaný)
    Ja osobne doporucuji hledat pomoci ekologickeho vyhledavace - http://hledej.uzasne.cz, nebo http://google.uzasne.cz - Vyhledavanim tam setrite energii a prispivate tak mnoha vecem - doporucuju precist si: http://hledej.uzasne.cz/proc.php - Velmi zajimave!
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).