http://www.ucw.cz/holmes/#authors
"In short: Holmes has been written by Martin Mareš and Robert Špalek. The development has been heavily sponsored by Netcentrum s.r.o. which is also one of the most important users and works as an exclusive distributor of the commercial version"
Ano, NetCentrum má ale i hlavního architekta Sherlocka, Martina Mareše. BTW - snad si nemyslíte že technologie, kam nacpali desítky mega, dají někam na web zadarmo? Ano, jistá verze se odpíchla před skoro reseti lety od Holmese, ale jinak tepe na centrum.cz už trošku něco jiného. Atlas něl SE postavený na Microsoft Information Retriever server. A Google na Bacrubu.
Máte pro své tvrzení nějaké důkazy? Subjektivně mi morfeo připadá lepší než ten seznamácký šmejd, který se mi zdá být dokonce i za jyxem.
Mohl by to být i tip na zajímavý článek, bohužel většina zdejších redaktorů se asi pořádné práce štítí a radši dělají výtahy z tiskových zpráv. Pořádné články musí přetiskovat z blogů.
Vymyslete chytrou metodiku a máte jistou volnou cestu publikovat srovnání třeba právě na Lupě. Ohodnotit kvalitu vyhledávačů je strašně obtížné. Zapotřebí je větší vzorek klíčových slov. Reflektování způsobu, jak se lidé ptají a na co. Objektivní ohodnocení, kdo odpověděl nejlépe, a definice toho, co to nejlépe vlastně znamená. (Jak relevantní je první výsledek? Kolik relevantních výsledků je v první desítce? Kdo nejrychleji poskytl tu informaci, co člověk hledal?) A konečně by bylo potřeba vymyslet způsob, jak ohodnotit doprovodné služby a vůbec prezentaci výsledků. Vyhledávač není jen 10 odkazů, spokojenost uživatele může být dána i reklamou, jaký text se k odkazu přiřadí a v jakém designu, co dokáže odpovědět i bez dalšího klikání atd.
Obávám se, že cokoliv méně by bylo čtenáři Lupy oprávněně zkritizováno jako subjektivní hodnocení stojící na vodě, či minimálně nereflektující všechny faktory ovlivňující kvalitu vyhledávačů z pohledu uživatele.
Ma tu nevyhodu, ze je pomerne zameren na osobu autora, ale ono je dost tezke postihnout kvalitu vyhledavace pro vsechny ruzne cilove skupiny.
Takze pokud ma nekdo chut, muze ji pouzit a aktualizovat ten muj dvojclanek.
Kdyz uz jsme u toho porovnavani... Zrovna dneska jsem hledal vzorec pro vypocet pivotu a prislusnych S-R urovni pri technicke analyze akcii. Jako dotaz jsem zadaval "pivot akcie" (bez uvozovek). Vysledky:
Morfeo: 2. odkaz vede na clanek zabyvajici se problematikou
Jyxo: 6. odkaz vede na ten samy clanek co naslo Morfeo
Seznam: Na prvni strance zadny pouzitelny odkaz
Google: Na prvni strance zadny pouzitelny odkaz
Váš test jsem tehdy samozřejmě četl a je asi tím nejlepším, k čemu se u nás kdy kdo dostal. I informace, jaký vyhledávač by pro člověka s přibližně Vaší úrovní používání internetu mohl být nejlepší, je zajímavá. Ostatně kdo si někdy jen tak pro svoji potřebu nějaký test udělal a nepoužívá ten svůj oblíbený vyhledávač spíše ze zvyku, sympatií či víry. Ale abych si po jeho přečtení mohl říct: "Vida, takže Exalead je asi obvykle nejlepší", to prostě nemůže nabídnout. Co se toho týče, nejlepší nápad měl v tomto směru test, který návštěvníkům podstrčil výsledky ze 3 vyhledávačů a nechal je zvolit to nejlepší. Jak se však hledání posunulo z primitivní podoby 10 odkazů, je hodnocení stále obtížnější.
Vyhodou meho testu je ze ho muze udelat clovek sam bez nejakeho velkeho vyzkumneho zazemi a dava pomerne slusne porovnani byt s tim, ze volba a formulace dotazu je dana profilem vyzkumnika.
Ono i ten odkazovany test trpi tim, ze jeho respondenti nebudou nejspis moc strukturou odpovidat strukture lidi na internetu.
Všichni vědí, že jste pracoval pro Centrum - to trochu snižuje nezávislost vašich testů.
Když Seznam a Google jsou tak špatné vyhledávače, tak mi vysvětlete, proč je využívá tolik lidí, a úžasné Morfeo je službou okrajového významu? Centrum je na trhu už dost dlouho na to, aby se vymlouvalo na náskok Seznamu, už má za sebou mnoho relamních kampaní v tisku i v TV - znalost značky je skoro 100% ... a stále se netěší takové oblibě jako Seznam a Google... je prostě horší.
Nerikam ze jsou spatne a je to opravdu nahoda, ze zrovna v tomhle testu propadly. Ale hezky to kontrastuje s vykriky "Google je jednicka!", "Morfeo je spatne!" atp. ;-)
IMHO jsou Centrum (Morfeo), Jyxo a Google pro vyhledavani v ceskem internetu zhruba rovnocennymi souperi. Seznam nejspis taky, ale ten moc nepouzivam, tak nemohu soudit.
Stejne se muzete ptat, proc neni pouzivanejsi Jyxo, kdyz ma takovou povest skveleho vyhledavace ;-)
Proste Google je znacka (a jeho znacka ma rozhodne lepsi jmeno nez Centrum) a hlavne umi vyhledavat ve svete, coz zadny cesky vyhledavac neumi. Takze lide co vyhledavaji ve svete vyhledavaji pres nej no a proc by pro CR pouzivali neco jineho, kdyz Google na ktery jsou zvykli dava dostatecne dobre vysledky.
Pro Seznam plati pro znacku totez, ale spis mezi laickou verejnosti, zatimco Google je znacka mezi techies a VS.
Souhlas!
Presne proto si myslim, ze MSIE je nejlepsi internetovy prohlizec! Proc by ho preci jinak pouzivalo tolik lidi?
Jo - a Skoda dela nejlepsi auta! A www.seznam.cz/index.html je ta uplne nejlepsi internetova stranka na ceskem internetu!
hmmm, tyhle výkřiky miluju... přetože se pokoušíte o ironii, tak máte vlastně pravdu. Úspěch jakékoliv služby nehodnotí její poskytovatelé, ale její uživatelé.
Vysvětlete mi prosím, proč tak podle vás špatné produkty jsou stále a dlouhodobě nejpoužívanější?
Protože v současném tržním prostředí není možné o produktech získat objektivní informace a rozhodnutí z velké části tvoří podvědomé dojmy a pocity?
Zkuste si někdy objektivně a čistě rozumově vybrat z nepřeberné nabídky zboží z oboru, o kterém nemáte ani páru. Třeba šampón, nebo prací prášek. Teoreticky byste musel sám vyzkoušet všechny produkty (nebo najít výsledky takových provedených testů), porovnat jejich výkon s cenou a vybrat jediného vítěze. Toto testování byste musel opakovat pro každý nový typ (nové a ještě lepší složení). Sám uznáte že to nejde a vyberete si podle reklamy, rady známého, přitažlivosti balení, přitažlivosti obsahu.
A teď si představte, že úplně stejně si lidé vybírají auta, MP3 přehrávače, browsery, vyhledávače, mobily a další krámy běžné spotřeby. Čímž může vyhrát nejznámější anebo ten s nejlepší reklamou.
U vyhledávačů je to navíc dané i tím, že spousta BFU v ČR má nastavený Seznam jako úvodní stránku a je to pro ně synonymum "toho internetu".
Ano Martine Hruško, nespravedlnost vládne světu. Přál bych vám abyste někdy začal podnikat a uvědomil si realitu, která je jiná něž váš názor připomínající nějakého "ajťáka",
Hruška-nehruška, co takhle reagovat na jeho názor a ne osobu? A s názorem jako takovým musím než souhlasit. Zkuste být přístě víc konstruktivní, nebo se raději nevyjadřujte vůbec.
Ne že bych měl pana Hrušku rád :) ale ona to není pravda?
Podle čeho jste si vybral váš prací prášek?
A podle čeho si vaše přítelkyně vybrala mp3 přehrávač?
A vaše babička si nainstalovala 10 internetových prohlížečů, než si vybrala ten pravý?
A kolik uživatelů Atlasu/Centra/Seznamu kdy ostatní dva portály a následně se rozhodlo na základě racionální úvahy?
Upřímně - toaletní papír jsem si třebá já osobně vybral podle ceny - na základě zřejmě naivní doměnky, že ten nejdražší bude nejlepší. A přitom jsem možná koupil ten nejhorší, co se drží na trhu jen díky tomu, že je víc takových, kteří nezkusí žádný jiný...
Ten test byl urcite dobry pokus, ale k objektivite mu chybi:
- pouzit vic hodnotitelu
- vysledky hodnotit naslepo (hodnotitel nevi, z ktereho jsou vyhledavace)
- pouzit trochu vic dotazu (tak 15-20)
- pouzivat nahodne dotazy vybrane z logu (nikoliv z top zebricku)
Na druhou stranu, pri splneni techto podminek uz pak neni potreba ty jednotlive dotazy tolik komentovat a psat tu omacku kolem, pak staci nechat mluvit jen cisla.
Zaroven je potreba si uvedomit, ze takovy test hodnoti jen relevanci vysledku. U vyhledavace je take zahodno zhodnotit obsahlost databaze a jeji aktualnost.
4: Nemohu souhlasit - pak nevite, co vlastne dotycny hledal a nemuzete rozumne urcit relevanci odpovedi. Velkou vyhodu sveho puvodniho testu vidim v tom, ze umoznuje pomerne objektivne zhodnotit vysledek: nalezl jsem hledanou informaci ano/ne a pokud ano tak jak moc prace mi dalo se k vysledku doklikat. Pokud bych bral dotazy z logu, tak by IMHO hodnoceni dost zalezelo na tom, co by si hodnotitel pod hledanou frazi predstavil.
S poslednim odstavcem opet nemohu souhlasit. Mne ABSOLUTNE NEZAJIMA kolik ma vyhledavac dokumentu a jak jsou aktualni. Mne zajima jen a pouze zda dostanu odpoved na svoji otazku. Pokud bude mit vyhledavac 15 dokumentu rok starych, je mi to jedno, jestlize budou obsahovat odpovedi na moje dotazy.
Rozsah databaze je dulezity, kdyz hledate neco neobvykleho.
Aktualnost databaze je dulezita, kdyz hledate neco noveho.
Pokud byste delali test, kde bude cca 100-200 hodnocenych dotazu, tak samozrejme vasi metodikou dojdete k dobrym vysledkum. To proto, ze mezi temi stovkami dotazu se vyskytnou i takove, ktere jsou citlive na rozsah a aktualnost. Ale pokud budete testovat jen na 10-20 dotazech, tak je spis sazkou do loterie, jestli mezi nimi takove dotazy budou ci ne. A to pak nahradi prave ty specializovane testy na rozsah a na aktualnost.
Ad nahodnost dotazu: on to nemusi byt log vyhledavace, ale klidne log z prohlizece hodnotitele (tim se vyresi vase pripominka). Ale velmi dulezita je ta nahodnost dotazu - jakmile dotazy kdokoliv vybira, je to napadnutelne. Pro objektivni test je nutny nahodny vyber z dostatecne reprezentativni mnoziny.
Chtěl bych někdy vidět do hlavy lidem, kteří hledají "Britney Spears", "sex" nebo třeba "sms". Co vlastně chtějí ti lidé najít? Jasně, v "dlouhém chvostu" najdeme milióny smysluplnějších dotazů, ale celově těch s více slovy či pokročilejšími konstrukcemi a operátory je stále menšinový podíl.
Objektivního zhodnocení, které odpoví "který SE je nejlepší, nejvíce relevantní, indexuje nejvíce webu ..." nějakými pokusy s dotazy pokládanými SE bez následných rozhovorů a rozborů informačních potřeb s uživateli podle mě nejde dosáhnout. Nakonec je to jako hledání odpovědi na otázku, které auto je nejlepší. Záleží pro kterou cestu, pro jaký účel a hlavně kdo bude řidič. S obyčejnou tužkou se také může někdo maximálně tak rýpat v nose a druhý klidně napsat skvělý román (když nebude moc tlačit a bude šetřit tuhu). Pak ale také může přijít otázka, který spisovatel je nejlepší? Bude to ten, který prodal nejvíc knih?
Co třeba najít odpověď na otázku, kolik lidí v ČR používá Google? Kolik Google vyřídí dotazů od českých uživatelů? Ví tohle někdo, kromě Googlu? Když hledáme Googlem cizojazyčné věci na světovém webu, kdo je schopen toto technicky zachytit resp. kdo to opravdu sleduje? Toolbary českých SE? Provideři? Správci ve velikých podnicích? Agentury pro výzkum trhu? Jan Tleskač? Protože současné měření tržních podílů přes referery posbírané různými toplisty je také dost nedokonalé.
A co ekonomické srovnávání? Bude u nás Google "tržní jednička", až utrží od českých občanů více než Seznam? On ale může Google na českém trhu vydělávat i tak, že mu někdo z ciziny zaplatí za inzerci na českém webu. Nebo tak, že nějaký český exportér zaplatí za reklamu na webu v některé z mnoha jiných zemí mimo ČR. Takže porovnávat se, když jeden působí téměř výhradně na lokálním trhu a druhý na globálním a když obsah nezná hranice, to přece moc nejde.
Google do rozšíření svých aktivit na "český trh" investoval jistě nepoměrně méně, než kolik Seznam ze svých tržeb zase někde utratil, aby vůbec mohl fungovat. A když se teď Seznam podělil o technologii s Atlasem, Google z toho těžil též - všude se o něm mluvilo - a zadarmo! Není tedy jedička aspoň ve vlastním marketingu?
Koukam, ze jste spravne pochopil, co jsem mel na mysli :-) Ano, rozsah by mel byt tak velky, aby tam mely sanci byt i dotazy citlive na rozsah a aktualnost. Ale je nesmysl to hodnotit zvlast - pro uzivatele je dulezita relevance a rozsah a aktualnost by se meli bray pouze v takove mire, v jake ji podporuji (a nekdy jsou mozna i na skodu(?)).
Nahodnost: Souhlasim. Presne takhle byl delany muj puvodni test pred nekolika roky. Zapisoval jsem si co hledam a pak na tech dotazech udelal test.
Hruško, tvé vyjadřování dosahuje úrovně řeznického psa. Když se ti nelíbí co Lupa píše, napiš něco sám. Aspoň konečně uvidíme, že Martin Hruška není jen spamer špatné nálady, ale něco i umí.
Ale co chtít od člověka, který kvalitu podnikatele posuzuje dle jeho jazykových schopností, že?
NetCentrum bude mít vlastní neveřejná rozšíření, ale základ je dostupný pod GNU GPL pro kohokoliv zdarma:
"Currently, two versions of Holmes exist. The freely distributable version is licenced under the GNU General Public License (GPL). Some libraries and support modules are distributed under the GNU Lesser General Public License (LGPL) and some example programs are public domain. In all such cases, it's clearly stated in comments at the start of the module."
Komerční verzi se hodí pro někoho kdo by chtěl i vlastní rozšíření, které asi Centrum vyvinulo a nebo by chtělo Sherlocka rozvíjet pod jinou než GNU GPL licencí.