"Do pořadí výsledků nejsou započteny reklamní odkazy."
To je docela škoda. Tím spíš pokud nejsou jako reklama označené a o to víc pokud uživatel pod nimi najde "doporučujeme". Na subjektivní dojem z nalezeného výsledku to má dle mého názoru velký vliv.
"To, že tu máme zákon o regulaci reklamy, asi ještě nezaznamenaly." (portály)
To mnohé vypovídá o jejich přístupu k etice a hodnotám. Na druhou stranu pokud někdo slovy zástupce ředitele seznam.cz - Tomáše Kapalína tvrdí, že už nedokáže rozlišovat mezi Seznam.cz a trhem ... pak jsou ostatní z obliga (jsouli tak malí nezbývá jim nic jiného než dělat totéž nebo jít dělat něco úplně jiného). Skoro je mi jich líto, že jsou do toho natlačeni.
"Portály před standardní výsledky přidávají nalezené sekce ve vlastním katalogu a samotné odkazy z katalogu."
Co jim také zbývá. Katalogy odchází do věčných lovišť a s tím se těžko smiřuje. Podívejte se na Seznam.cz. Od excesu se spuštěním Nového Seznamu uběhl už rok a půl!! a téměř nic se nezměnilo! Jestli tohle není důkaz odumírání katalogu, pak už nic!
??? Opravdu? A jak byste to chtěl jednoznačně definovat?
"horoskopy", "erotické povídky", "ester ládová", "slovník cizích slov", "java hry", "spanking", "autobazary", "mapa evropy", "pohlednice", "porno video", "O-Zone", "maturitní otázky"
A jak chcete u těchto slov jednoznačně určit, které odkazy uspokojí vyhledávání uživatele, průměrného uživatele (a to plošně!).
Souhlasím, že testovaných dotazů mělo být více, také jsem jich mnohem více testoval. Z vašeho seznamu to např. byly horoskopy, něco v souvislosti s auty a ještě myslím mapa evropy. Jenomže do výsledné tabulky jsem je nezařadil z jednoho prostého důvodu. Např. při hledání oné mapy evropy mi google vrátil nějaký český mapový server, který mi postačoval, ale ostatní, např. Jyxo nějaký obrázek punkové mapy evropy a prodej nějakých map s jejich náhledy. A měl jsem brát tyto odkazy za relevantní? Někomu postačit mohli a někomu ne. Do seminárky bych je opravdu použít nemohl. Ale psal jsem o tom již v úvodu článku v metodice.
Poznámka: V době testování Jyxo indexovalo něco přes 50 miliónů dokumentů, zatímco Morfeo přes 58 mil. Proto ta informace o menší databázi v odstavci u Jyxa.
Dále přidávám svůj názor k vyjádření Michala Illicha pod článkem:
1. Nejprve k jedné nepravdě, k tvrzení že Jyxo má "oproti konkurenci menší databázi". Jak si čtenář může lehce zjistit, tak pro těch 8 autorem vybraných dotazů vrátí Jyxo v šesti případech více odpovědí než Google, a v sedmi více než Morfeo. Osobně se mi zdá, že právě větší databáze Jyxa pak pomohla k horšímu výsledku v tomto testu - pro yhledavač je těžší z nich vybrat.
Celková databáze indexovaných dokumentů Jyxa je opravdu menší než Morfea, ale příliš na ní nezáleží. V celém článku jsem se snažil zdůrazňovat, že tolik nezáleželo na různých „pokročilých funkcích“ vyhledávače atd. ale na skutečné prospěšnosti pro uživatele. Z tohoto pohledu nám může být celkem jedno, kolik ve skutečnosti vyhledávač má ve své databázi stránek. Ostatně, Google jich pro český web indexuje nejméně a výsledky má nejlepší.
2. Test zkoumal jen dost úzkou oblast dotazů. Zatímco skuteční uživatelé pokládají v 40% případů jednoslovné dotazy, a jen málokdy (8%) víc jak trojslovné, tak test neměří žádné jednoslovné dotazy, naopak z poloviny je zaměřen na mnohoslovná spojení. Druhý zdroj zkreslení je diakritika - zatímco v testu je důsledně užívána, v praxi je asi polovina položených dotazů bez českých znaků. Kdyby používání diakritiky v testu odpovídalo skutečnosti, tak by se Google výrazně propadl. Uživatelé chtějí také od vyhledavače různé věci - najít firmu, kontakt, informaci, provést důkladnou rešerši, poradit s jazykem, najít citát, dohledat, co už jednou viděli, atd. Ale test samotný je zaměřen jen na jeden druh dotazů. Vybraná témata jsou málo obvyklá, nejčastější je Jaroslav Seifert s 0,001% hledanosti, ostatní jsou řádově méně časté. Kdyby se nazýval "Hodboďův subjektivní test mnohoslovných, s diakritikou psaných informačních dotazů na neobvyklá témata", tak prosím. Ale prezentovat jej za "test vyhledavačů" je trochu troufalé a nepodložené.
Metodiku testu jsem vybíral dlouho a je mi jasné, že cokoli bych zvolil, bylo by založené na subjektivitě autora. Je to problém jakéhokoli testu. Pokud navrhnete takovou metodiku, která bude jasná a zřetelná, bude zohledňovat především uživatele a jeho běžné chování, prosím, potom můžeme výsledky porovnat. Těžko se vám to ale povede...
K tomu "vymyslet a popsat co mel hledajici na mysli") Zároveň by se tam neměla přidávat žádná dodatečná informace ("zadal jsem jen 'lolita', ale uznám pouze Nabokova!" nebo "zadal jsem mapa evropy, ale tajně si myslím, že je to do seminárky"). Dokud neumějí telepatii ani lidé, nebylo by úplně fér to vyžadovat od vyhledavače :)
Náhodný výběr a hodnocení více lidmi je výborný základ. Ale jsou také různé typy dotazů (např. 'český telecom' má jen jedinou správnou odpověď, objektivně testovatelnou, ale 'mp3' je zase nutné hodnotit jinak a to dost subjektivně, a docela objektivně se dají testovat i ty 'datum narození pavla nedvěda').
V práci máme silně ořezaný net (to je koneckonců právo zaměstnavatele) a tak nelze mj. hledat přímo přes jyxo. Máte totiž http://www.jyxo.cz přesměrované na http://jyxo.cz. Náš proxy zahazuje (kromě dalšího) vše co nemá po http:// řetězec www. nebo web. Jediné, co se mi podařilo omylem spustit byl nslookup:
Non-authoritative answer: Name: jyxo.cz Address: 212.71.128.65
Můžete s tím zkusit něco provést = ať je funkční i www.jyxo.cz? Google (s www ;-)) funguje a pokud něco hledám, můžu svého nadřízeného požádat, ať mi dočasně povolí přístup na nalezenou adresu. Admin to bez jeho povolení neudělá.
Dle mého je v České republice se svými aktuálně 58% podíly s využíváním vyhledávání jednoznačně nejlepší vyhledávač Google.cz a jeho využití mezi uživateli českého internetu se každý rok zvyšuje. Podle informací z odkazu výše lze dedukovat, že seznam.cz ztrácí na oblibě, jelkož relevantnost jeho výsledků je daleko, daleko za výsledky google, o tom nyní reálně není pochyb.