Vlákno názorů k článku Co vlastně chcete po vyhledávači? od Marek Prokop - Pane Housere, jestli dovolíte, vypůjčím si váš supermarketový...

  • Článek je starý, nové názory již nelze přidávat.
  • 7. 5. 2003 18:01

    Marek Prokop (neregistrovaný)
    Pane Housere, jestli dovolíte, vypůjčím si váš supermarketový příměr a jen ho trochu zpřesním. V zásadě totiž funguje, ale je třeba vzít v potaz specifický charakter výběru a "konzumace" informací:

    1) Tentýž výrobek (stránku) skoro nikdy "nekoupím" opakovaně. Vybírám si tedy jen podle krabice, nikoli podle obsahu, neboť ten dosud neznám.

    2) Jestliže potřebuji větší množství určitého zboží, nikdy nekoupím víc balení téhož výrobku, nýbrž koupím vždy po jednom balení od výrobků různých.

    3) Vyhledavač tuší, co je v krabici lépe než já. Ukáže mi však jen ty krabice a na regálech je seřadí podle toho, co ví o jejich obsahu a toho, jak často se zmínky o výrobku objevují v jiných zdrojích (link popularity).

    Opravdu nevím, jak za dané situace může statistika "prodeje" jednotlivých výrobků pomoci vyhledavači k tomu, aby je na regálech lépe seřadil.

    Ještě dodám, že klikatelnost odkazů ve výsledcích je přímo úměrná jejich pozici a existují docela slušné odhady konkrétních procent pro jednotlivé pozice. Drobné odchylky způsobuje pouze titulek a popis, což jsou opět informace dodané vyhledavačem, které on může ovlivnit. Jinými slovy, je to vyhledavač, který rozhoduje o tom, jak často uživatelé kliknou na každý nalezený odkaz. Je tedy zhola zbytečné, aby podle tohoto kritéria nějak ovlivňoval řazení.

    Proč určovat řazení odvozenými kritérii, když už je určeno kritérii primárními.

  • 7. 5. 2003 11:18

    Pavel Houser, Science World (neregistrovaný)
    No ano, přes nepříliš pozitivní přijetí těchto úvah si stále myslím, že příslušná funkce by se hodila. Má totiž jednu výhodu oproti tomu, když by uživatelé hodnotili relevantnost "poté". Vše by se dělo automaticky. Hodně blbý příklad: v supermarketu samozřejmě můžete rozdat dotazníky a ptát se lidí, zda chtějí zlevněné zboží dát spíše k salámům nebo k pečivu. Jednodušší ale asi je oboje zkusit a zjistit, kde se ho prodá víc - netvořit žádné speciální dotazníky, ale učit se přímo z normálního chování.
    Nicméně: mým cílem nebylo jen to, aby vyhledávač lépe řadil dokumenty uživateli již takto "posouzené", ale aby se také učil a mohl lépe posuzovat dokumenty neznámé. Aby si vytvářel složitou síť hierarchie vztahů - kde je tento výraz, bývá s tou a tou vahou ještě tento výraz.
  • 7. 5. 2003 2:45

    Dan Lukes (neregistrovaný)
    Prvni odstavec je prikladem nespravne dedukce ze spravnych informaci. Je sice pravda, ze o odkazech vim jen tolik, co Google sam - ostatne, vsechny mam od nej, neni ale tak uplne pravda, ze tyto informace nemohu vyhodnotit zpusobem, ktery je strojove "inteliogenci" vyhledavac v zasade nedostupny. Sama pripadna informace, ze lidi prumerne klikaji na "vzdalene" odkazy, ergo, informace, ze aktualni ohodnocovaci algoritmus neni dostatecne dobry je dostatecnym duvodm pro zajem o takovou informaci. Nesouhlasim tedy s tvrzenim, ze neni jediny duvod, aby vyhledavac takovou informaci ziskaval - jakkoli souhlasim s tim, ze Google to nedela.
  • 5. 5. 2003 13:57

    Jiří Donát (neregistrovaný)
    Zde bych se pana Housera rád zastal. Je to nejen špičkový novinář, ale i velmi přemýšlivý člověk, který má dar vidět věci s nadhledem a v souvislostech. Důkazem toho je i tento článek, který svým námětem a hloubkou výrazně převyšuje průměr, který můžeme na internetu (a bohužel poslední dobou i na Lupě) vidět. Nejhorší chybou, kterou můžeme udělat, by bylo odsoudit kvůli několika věcným nepřesnostem celý článek. Rád bych, kdyby se nám podařilo tyto dvě věci - námět a případné věcné chyby - důsledně oddělit a pokračovat v diskusi dané titulkem článku.

    Řekl bych, že dnešní vyhledávače na internetu umí jen málo z toho, co by umět mohly. Co nám dnes nejvíc chybí? V jakých konkrétních situacích nám internet nepomůže, ačkoliv víme, že by mohl, protože hledané informace na něm jsou?
  • 1. 5. 2003 18:58

    Abraxis (neregistrovaný)
    Hmmmmm, bylo by docela zajimave napsat nejakeho "spiona" ala GoogleBar, ktery by sledoval, jak dlouho setrvas na strance po jejim vyhledani a kam pote jdes - jde jen o to, aby o tom uzivatel vedel.
  • 1. 5. 2003 18:58

    Abraxis (neregistrovaný)
    Pri hledani neceho specialniho preci neni problem tam dat parametr, ktery by toto hodnoceni stranek vypnul. Skoda, ze to na Google neni implementovano (ne to vypinani - pocitani kliknuti) - docela by me zajimalo zpresneni relevance vysledku.
  • 1. 5. 2003 6:24

    David Bubenicek (neregistrovaný)
    Tady jste to, myslím, trefil přesně. Google toolbar ma stáhnuto spousta lidi, protože to je pro určitou skupinu nutnost a bylo by podivné, kdyby Google tyto a dalsi informace nevyužíval.

    Kdyby google posuzoval miru kliknutí na vysledky vyhledavani u vsech uzivatelů, byla by objektivnost této metody vylepšení relevance dost pokulhávající a to z toho důvodu, jak velké procento uživatelů klikne na první předložený odkaz nebo několik prvních a tim by v podstatě působil kontraproduktivně. U zivatelu toolbaru se da predpokladat nejaka "hodnota" volby odkazu a IMHO to google s mensi dulezitosti pouziva - ale tento muj nazor je opravdu pouze odhad.
  • 30. 4. 2003 19:17

    Marek Prokop (neregistrovaný)
    Klikatelnost výsledků vyhledávání je dána *pouze* tím, co vyhledavač sám nabídne -- jednak pozicí a jednak textem popisujícím odkaz. Nevstupuje tam žádná další informace zvenčí a tudíž to nijak nelze pro zkvalitnění výsledků vyhledávání využít.

    Naopak, hodnocení zpětných odkazů, jejich váhy a kontextu, je založeno na tom, jak lidé hodnotí danou stránku nikoli podle toho, co jim o ní řekne sám vyhledavač, ale podle toho, jak ji sami znají a používají.

    Z toho, že jsou algoritmy vyhledavačů tajeny, nijak nevyplývá, že nejsou do určité míry známy. Stejně tak není pravda, že lidé "nepíší HTML-stránky tak, aby je relevantně nacházely web-searche." Lidé, kteří o Webu alespoň něco tuší, takovým způsobem stránky píší. Proto také nemám v devíti případech z deseti vůbec žádný problém najít v Googlu přesně to co chci, jediným dotazem a na první stránce výsledků.
  • 30. 4. 2003 17:53

    Martin Vobr (neregistrovaný)
    Správná připomínka. Pokud používáte "holý" IExplore nebo jiný prohlížeč tak máte 100% pravdu. Co ale v případě, že máte nainstalovaný Google Toolbar?

    Tam bych si už tak jistý nebyl. Před časem jsem API potřebné k programování toolbarů do IE docela podrobně zkoumal a zjišťovat kam uživatel kliká jde docela snadno.

    Takže technicky vzato takovéto monitorování určitě možné je. To ale nic neříká o tom, jestli se tak skutečně děje...
  • 30. 4. 2003 15:49

    J.Kastl (neregistrovaný)
    Jak můžete vědět, že posuzování kontextu převyšuje navrhovaný způsob klikatelnosti, když přesný způsob posuzování kontextu je tajen?
    A v tom je také problém, proč lidé nepíší HTML-stránky tak, aby je "relevantně" nacházely web-searche. - Nikdo přesně neví, podle čeho se řídí. Ale hlavně, že produkují hory dat (a reklam).
  • 30. 4. 2003 14:20

    Juraj Viktorin (neregistrovaný)
    Problém je samozřejmě v tom, že je-li nejrelevantjěší dokument na pozici 100, málokdo se k němu vůbec dokliká a vezme nakonec zavděk něčím z té titulní stránky.

    Este vacsi problem je v tom, ze pre kliknutim nemusite vediet, ci je dokument na 100. alebo ktoromkolvek mieste naozaj relevantny.

    Casto sa stava, ze pri vyhhladavani (viac slovne dotazy s log. operatormi) narazim na stranky, ktore sa zdaju byt vo vysledkoch vyhladavania relevantne, ale v skutocnosti nie su.

    Mozno by sa dala najst nejaka logika v spravani pouzivatelov - napr. pokial klikne na 1. web vo vysledkoch vyhladavania a neskor aj na 2., 3. atd. moze znamenat, ze hlada najrelevantnejsiu stranku. Podobne, ak dochadza k upresnovaniu stringu vo vyhladavani.

  • 30. 4. 2003 13:26

    Marek Prokop (neregistrovaný)
    Pane Housere, nejenom že to tak Google nedělá, ale není ani jediný důvod proto, aby to tak začal dělat. Klikatelnost odkazu, o kterém uživatel ví jen tolik, kolik mu sám Google ukáže, nevypovídá o hodnotě či relevanci stránky pro určitý dotaz vůbec nic.

    Co Google dělá, je posuzování kontextu, v jakém se objevují zpětné odkazy na cílovou stránku. To vámi navrhovaný způsob nejen nahrazuje, ale i vysoce převyšuje.
  • 30. 4. 2003 12:51

    Pavel Houser, Science World (neregistrovaný)
    to jest, pravda, zasadni namitka :-)
    na to mi nezbyva nez rict, ze by to tak Google proste delat mel :-) (a misto psani clanku jsem mohl dumat o tom, zda, ac jsem si to sam nevymyslel, se ta myslenka neda nejak vyuzit)
  • 30. 4. 2003 12:40

    Pavel Houser, Science World (neregistrovaný)
    pokud hledáte něco, co zajímá jenom vás, pak google (alespoň za předpokladu, že používá zde popsaný postup) žádný "předpis" ještě nemá :-). když se vámi zadané slovo vyskytuje v jediném dokumentu, hodí prostě tento dokument a basta. má to smysl tam, kde možných dokumentů je milion a zbývá problém, jak je seřadit. eventuálně snad i tam, kde google nezná žádnou odpověď a chce se vám zavděčit alespoň nějak.
  • 30. 4. 2003 10:25

    Vašek (neregistrovaný)
    Jako pravidelný čtenář Lupy bych docela uvítal, aby šarlatáni z IDG do tohoto kvalitního internetového média nepřispívali. Média IDG jsou celosvětově koncipována jako přežvykovadlo tiskových zpráv a vydávání zpráv z tzv. "celosvětové zpravodajské sítě IDG" za vlastní žurnalistickou tvorbu - přitom jde pouze o marketingovou masáž amerických počítačových firem. Kvalifikací redaktora v IDG Czech je řiťolezectví a absence vlastního názoru; stačí si číst, co publikuje ComputerWorld či cw.cz - tuto poslušnost počítačové firmy odměňují inzercí. To vše je doplněno občasnými interview s pupíky z počítačových firem ve smyslu "pane řediteli, prozraďte nám, jak je to možné, že jste tak úspěšní". Vím, o čem mluvím, dělal jsem tam nějakou dobu.

    Lupa si drží nezávislost a schopnost kritičnosti, to na ní oceňuji, bylo by moc dobré, kdyby nesklouzla do toho komerčního "ruka ruku myje".

  • 30. 4. 2003 10:00

    Petr Klimovic (neregistrovaný)
    Finta je v tom, ze Google se o vasem kliknuti na odkaz nedozvi. Kod stranky s vysledky vyhledavani neobsahuje nic, co by to umoznovalo. Teda ja jsem ho dukladne neprohlizel. Ale samotne odkazy jsou ciste, tedy vedou pryc z google bez sance zjistit kliknuti. Leda, ze by tam byl nejaky javascript, nebo neco podobneho a to pochybuji.
  • 30. 4. 2003 9:54

    Martiner (neregistrovaný)
    Takovyhle zpusob bude vyhovovat mainstreamu, ale ve chvili, kdy hledam neco specialniho, co zajima "jenom me", tak je takovy system silne kontraproduktivni.

    Nastesti je to jenom autoruv vyplod a lide od Googlu urcite maji na to, aby vymysleli neco pouzitelneho.

    BTW formulace jako "...nebo jak to přesně počítá..." prozrazuje docela dost o autorove erudici... ;)
  • 30. 4. 2003 9:27

    Pavel Houser, Science World (neregistrovaný)
    Pokud vím, algoritmy Googlu jsou alespoň zčásti neveřejné. Berte tedy následující informaci ve stylu "už nevím, kde jsem k ní přišel".
    Představuju si to tak, že zadáte do Googlu slovo X a on vám vyjede stránky, kde je slovo X s největší frekvencí (nebo jak to přesně počítá, podle meta znaků, titulků apod.). Splu s adresami vám vyjedou základní anotace těch stránek. Na titulu uvidíte třeba 10 (nebo kolik) adres s anotacemi. No a vy kliknete ne na 1. v pořadí, ale na 8. Google si pak řekně "aha, takže dokument 8 skutečně je o X". Příště, až někdo zadá dotaz na X, postrčí dokument 8 trochu víc nahoru.
    Problém je samozřejmě v tom, že je-li nejrelevantjěší dokument na pozici 100, málokdo se k němu vůbec dokliká a vezme nakonec zavděk něčím z té titulní stránky. Takový dokument pak může těžko stoupat po žebříčku.
    Doufám tedy, že Google dělá i následující věc, a to shazování dolů - řekne si: "fajn, na dotaz X jsem tohle kvůli frekvenci 1000krát zobrazil ve výpisu jako číslo 1 a všichni klikali jinam. takže tenhle dokument asi není o X".
    samozřejmě pro zjednodušení předpokládáme, že anotace skutečě vystihuje obsah dokumentu.
  • 30. 4. 2003 9:21

    Robert Němec (neregistrovaný)
    Ano, tak to skutecne nefunguje. :-)

    Staci se napr. podivat na zdrojak po vyhledani nejakeho slova. Dřív tak fungoval např. Atlas, ale i ten od toho ustoupil.
  • 30. 4. 2003 9:05

    PeT (neregistrovaný)
    ... bylo by možné objasnit jak je realizováno toto?:

    Vezme nejenom stránky, kde se toto slovo vyskytuje s největší frekvencí, ale také stránky, na které lidé, kteří před vámi hledali Borgese, z Googlu skutečně klikli.

    Bylo by to hezké, ale myslím si že tak to nefunguje.

Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).