http://www.ucw.cz/holmes/#authors
"In short: Holmes has been written by Martin Mareš and Robert Špalek. The development has been heavily sponsored by Netcentrum s.r.o. which is also one of the most important users and works as an exclusive distributor of the commercial version"
Ano, NetCentrum má ale i hlavního architekta Sherlocka, Martina Mareše. BTW - snad si nemyslíte že technologie, kam nacpali desítky mega, dají někam na web zadarmo? Ano, jistá verze se odpíchla před skoro reseti lety od Holmese, ale jinak tepe na centrum.cz už trošku něco jiného. Atlas něl SE postavený na Microsoft Information Retriever server. A Google na Bacrubu.
Máte pro své tvrzení nějaké důkazy? Subjektivně mi morfeo připadá lepší než ten seznamácký šmejd, který se mi zdá být dokonce i za jyxem.
Mohl by to být i tip na zajímavý článek, bohužel většina zdejších redaktorů se asi pořádné práce štítí a radši dělají výtahy z tiskových zpráv. Pořádné články musí přetiskovat z blogů.
Vymyslete chytrou metodiku a máte jistou volnou cestu publikovat srovnání třeba právě na Lupě. Ohodnotit kvalitu vyhledávačů je strašně obtížné. Zapotřebí je větší vzorek klíčových slov. Reflektování způsobu, jak se lidé ptají a na co. Objektivní ohodnocení, kdo odpověděl nejlépe, a definice toho, co to nejlépe vlastně znamená. (Jak relevantní je první výsledek? Kolik relevantních výsledků je v první desítce? Kdo nejrychleji poskytl tu informaci, co člověk hledal?) A konečně by bylo potřeba vymyslet způsob, jak ohodnotit doprovodné služby a vůbec prezentaci výsledků. Vyhledávač není jen 10 odkazů, spokojenost uživatele může být dána i reklamou, jaký text se k odkazu přiřadí a v jakém designu, co dokáže odpovědět i bez dalšího klikání atd.
Obávám se, že cokoliv méně by bylo čtenáři Lupy oprávněně zkritizováno jako subjektivní hodnocení stojící na vodě, či minimálně nereflektující všechny faktory ovlivňující kvalitu vyhledávačů z pohledu uživatele.
Ma tu nevyhodu, ze je pomerne zameren na osobu autora, ale ono je dost tezke postihnout kvalitu vyhledavace pro vsechny ruzne cilove skupiny.
Takze pokud ma nekdo chut, muze ji pouzit a aktualizovat ten muj dvojclanek.
Kdyz uz jsme u toho porovnavani... Zrovna dneska jsem hledal vzorec pro vypocet pivotu a prislusnych S-R urovni pri technicke analyze akcii. Jako dotaz jsem zadaval "pivot akcie" (bez uvozovek). Vysledky:
Morfeo: 2. odkaz vede na clanek zabyvajici se problematikou
Jyxo: 6. odkaz vede na ten samy clanek co naslo Morfeo
Seznam: Na prvni strance zadny pouzitelny odkaz
Google: Na prvni strance zadny pouzitelny odkaz
Váš test jsem tehdy samozřejmě četl a je asi tím nejlepším, k čemu se u nás kdy kdo dostal. I informace, jaký vyhledávač by pro člověka s přibližně Vaší úrovní používání internetu mohl být nejlepší, je zajímavá. Ostatně kdo si někdy jen tak pro svoji potřebu nějaký test udělal a nepoužívá ten svůj oblíbený vyhledávač spíše ze zvyku, sympatií či víry. Ale abych si po jeho přečtení mohl říct: "Vida, takže Exalead je asi obvykle nejlepší", to prostě nemůže nabídnout. Co se toho týče, nejlepší nápad měl v tomto směru test, který návštěvníkům podstrčil výsledky ze 3 vyhledávačů a nechal je zvolit to nejlepší. Jak se však hledání posunulo z primitivní podoby 10 odkazů, je hodnocení stále obtížnější.
Vyhodou meho testu je ze ho muze udelat clovek sam bez nejakeho velkeho vyzkumneho zazemi a dava pomerne slusne porovnani byt s tim, ze volba a formulace dotazu je dana profilem vyzkumnika.
Ono i ten odkazovany test trpi tim, ze jeho respondenti nebudou nejspis moc strukturou odpovidat strukture lidi na internetu.
Všichni vědí, že jste pracoval pro Centrum - to trochu snižuje nezávislost vašich testů.
Když Seznam a Google jsou tak špatné vyhledávače, tak mi vysvětlete, proč je využívá tolik lidí, a úžasné Morfeo je službou okrajového významu? Centrum je na trhu už dost dlouho na to, aby se vymlouvalo na náskok Seznamu, už má za sebou mnoho relamních kampaní v tisku i v TV - znalost značky je skoro 100% ... a stále se netěší takové oblibě jako Seznam a Google... je prostě horší.
Nerikam ze jsou spatne a je to opravdu nahoda, ze zrovna v tomhle testu propadly. Ale hezky to kontrastuje s vykriky "Google je jednicka!", "Morfeo je spatne!" atp. ;-)
IMHO jsou Centrum (Morfeo), Jyxo a Google pro vyhledavani v ceskem internetu zhruba rovnocennymi souperi. Seznam nejspis taky, ale ten moc nepouzivam, tak nemohu soudit.
Stejne se muzete ptat, proc neni pouzivanejsi Jyxo, kdyz ma takovou povest skveleho vyhledavace ;-)
Proste Google je znacka (a jeho znacka ma rozhodne lepsi jmeno nez Centrum) a hlavne umi vyhledavat ve svete, coz zadny cesky vyhledavac neumi. Takze lide co vyhledavaji ve svete vyhledavaji pres nej no a proc by pro CR pouzivali neco jineho, kdyz Google na ktery jsou zvykli dava dostatecne dobre vysledky.
Pro Seznam plati pro znacku totez, ale spis mezi laickou verejnosti, zatimco Google je znacka mezi techies a VS.
Souhlas!
Presne proto si myslim, ze MSIE je nejlepsi internetovy prohlizec! Proc by ho preci jinak pouzivalo tolik lidi?
Jo - a Skoda dela nejlepsi auta! A www.seznam.cz/index.html je ta uplne nejlepsi internetova stranka na ceskem internetu!
hmmm, tyhle výkřiky miluju... přetože se pokoušíte o ironii, tak máte vlastně pravdu. Úspěch jakékoliv služby nehodnotí její poskytovatelé, ale její uživatelé.
Vysvětlete mi prosím, proč tak podle vás špatné produkty jsou stále a dlouhodobě nejpoužívanější?
Protože v současném tržním prostředí není možné o produktech získat objektivní informace a rozhodnutí z velké části tvoří podvědomé dojmy a pocity?
Zkuste si někdy objektivně a čistě rozumově vybrat z nepřeberné nabídky zboží z oboru, o kterém nemáte ani páru. Třeba šampón, nebo prací prášek. Teoreticky byste musel sám vyzkoušet všechny produkty (nebo najít výsledky takových provedených testů), porovnat jejich výkon s cenou a vybrat jediného vítěze. Toto testování byste musel opakovat pro každý nový typ (nové a ještě lepší složení). Sám uznáte že to nejde a vyberete si podle reklamy, rady známého, přitažlivosti balení, přitažlivosti obsahu.
A teď si představte, že úplně stejně si lidé vybírají auta, MP3 přehrávače, browsery, vyhledávače, mobily a další krámy běžné spotřeby. Čímž může vyhrát nejznámější anebo ten s nejlepší reklamou.
U vyhledávačů je to navíc dané i tím, že spousta BFU v ČR má nastavený Seznam jako úvodní stránku a je to pro ně synonymum "toho internetu".
Ano Martine Hruško, nespravedlnost vládne světu. Přál bych vám abyste někdy začal podnikat a uvědomil si realitu, která je jiná něž váš názor připomínající nějakého "ajťáka",
Hruška-nehruška, co takhle reagovat na jeho názor a ne osobu? A s názorem jako takovým musím než souhlasit. Zkuste být přístě víc konstruktivní, nebo se raději nevyjadřujte vůbec.
Ne že bych měl pana Hrušku rád :) ale ona to není pravda?
Podle čeho jste si vybral váš prací prášek?
A podle čeho si vaše přítelkyně vybrala mp3 přehrávač?
A vaše babička si nainstalovala 10 internetových prohlížečů, než si vybrala ten pravý?
A kolik uživatelů Atlasu/Centra/Seznamu kdy ostatní dva portály a následně se rozhodlo na základě racionální úvahy?
Upřímně - toaletní papír jsem si třebá já osobně vybral podle ceny - na základě zřejmě naivní doměnky, že ten nejdražší bude nejlepší. A přitom jsem možná koupil ten nejhorší, co se drží na trhu jen díky tomu, že je víc takových, kteří nezkusí žádný jiný...
Ten test byl urcite dobry pokus, ale k objektivite mu chybi:
- pouzit vic hodnotitelu
- vysledky hodnotit naslepo (hodnotitel nevi, z ktereho jsou vyhledavace)
- pouzit trochu vic dotazu (tak 15-20)
- pouzivat nahodne dotazy vybrane z logu (nikoliv z top zebricku)
Na druhou stranu, pri splneni techto podminek uz pak neni potreba ty jednotlive dotazy tolik komentovat a psat tu omacku kolem, pak staci nechat mluvit jen cisla.
Zaroven je potreba si uvedomit, ze takovy test hodnoti jen relevanci vysledku. U vyhledavace je take zahodno zhodnotit obsahlost databaze a jeji aktualnost.
4: Nemohu souhlasit - pak nevite, co vlastne dotycny hledal a nemuzete rozumne urcit relevanci odpovedi. Velkou vyhodu sveho puvodniho testu vidim v tom, ze umoznuje pomerne objektivne zhodnotit vysledek: nalezl jsem hledanou informaci ano/ne a pokud ano tak jak moc prace mi dalo se k vysledku doklikat. Pokud bych bral dotazy z logu, tak by IMHO hodnoceni dost zalezelo na tom, co by si hodnotitel pod hledanou frazi predstavil.
S poslednim odstavcem opet nemohu souhlasit. Mne ABSOLUTNE NEZAJIMA kolik ma vyhledavac dokumentu a jak jsou aktualni. Mne zajima jen a pouze zda dostanu odpoved na svoji otazku. Pokud bude mit vyhledavac 15 dokumentu rok starych, je mi to jedno, jestlize budou obsahovat odpovedi na moje dotazy.
Rozsah databaze je dulezity, kdyz hledate neco neobvykleho.
Aktualnost databaze je dulezita, kdyz hledate neco noveho.
Pokud byste delali test, kde bude cca 100-200 hodnocenych dotazu, tak samozrejme vasi metodikou dojdete k dobrym vysledkum. To proto, ze mezi temi stovkami dotazu se vyskytnou i takove, ktere jsou citlive na rozsah a aktualnost. Ale pokud budete testovat jen na 10-20 dotazech, tak je spis sazkou do loterie, jestli mezi nimi takove dotazy budou ci ne. A to pak nahradi prave ty specializovane testy na rozsah a na aktualnost.
Ad nahodnost dotazu: on to nemusi byt log vyhledavace, ale klidne log z prohlizece hodnotitele (tim se vyresi vase pripominka). Ale velmi dulezita je ta nahodnost dotazu - jakmile dotazy kdokoliv vybira, je to napadnutelne. Pro objektivni test je nutny nahodny vyber z dostatecne reprezentativni mnoziny.
Chtěl bych někdy vidět do hlavy lidem, kteří hledají "Britney Spears", "sex" nebo třeba "sms". Co vlastně chtějí ti lidé najít? Jasně, v "dlouhém chvostu" najdeme milióny smysluplnějších dotazů, ale celově těch s více slovy či pokročilejšími konstrukcemi a operátory je stále menšinový podíl.
Objektivního zhodnocení, které odpoví "který SE je nejlepší, nejvíce relevantní, indexuje nejvíce webu ..." nějakými pokusy s dotazy pokládanými SE bez následných rozhovorů a rozborů informačních potřeb s uživateli podle mě nejde dosáhnout. Nakonec je to jako hledání odpovědi na otázku, které auto je nejlepší. Záleží pro kterou cestu, pro jaký účel a hlavně kdo bude řidič. S obyčejnou tužkou se také může někdo maximálně tak rýpat v nose a druhý klidně napsat skvělý román (když nebude moc tlačit a bude šetřit tuhu). Pak ale také může přijít otázka, který spisovatel je nejlepší? Bude to ten, který prodal nejvíc knih?
Co třeba najít odpověď na otázku, kolik lidí v ČR používá Google? Kolik Google vyřídí dotazů od českých uživatelů? Ví tohle někdo, kromě Googlu? Když hledáme Googlem cizojazyčné věci na světovém webu, kdo je schopen toto technicky zachytit resp. kdo to opravdu sleduje? Toolbary českých SE? Provideři? Správci ve velikých podnicích? Agentury pro výzkum trhu? Jan Tleskač? Protože současné měření tržních podílů přes referery posbírané různými toplisty je také dost nedokonalé.
A co ekonomické srovnávání? Bude u nás Google "tržní jednička", až utrží od českých občanů více než Seznam? On ale může Google na českém trhu vydělávat i tak, že mu někdo z ciziny zaplatí za inzerci na českém webu. Nebo tak, že nějaký český exportér zaplatí za reklamu na webu v některé z mnoha jiných zemí mimo ČR. Takže porovnávat se, když jeden působí téměř výhradně na lokálním trhu a druhý na globálním a když obsah nezná hranice, to přece moc nejde.
Google do rozšíření svých aktivit na "český trh" investoval jistě nepoměrně méně, než kolik Seznam ze svých tržeb zase někde utratil, aby vůbec mohl fungovat. A když se teď Seznam podělil o technologii s Atlasem, Google z toho těžil též - všude se o něm mluvilo - a zadarmo! Není tedy jedička aspoň ve vlastním marketingu?
Koukam, ze jste spravne pochopil, co jsem mel na mysli :-) Ano, rozsah by mel byt tak velky, aby tam mely sanci byt i dotazy citlive na rozsah a aktualnost. Ale je nesmysl to hodnotit zvlast - pro uzivatele je dulezita relevance a rozsah a aktualnost by se meli bray pouze v takove mire, v jake ji podporuji (a nekdy jsou mozna i na skodu(?)).
Nahodnost: Souhlasim. Presne takhle byl delany muj puvodni test pred nekolika roky. Zapisoval jsem si co hledam a pak na tech dotazech udelal test.
Hruško, tvé vyjadřování dosahuje úrovně řeznického psa. Když se ti nelíbí co Lupa píše, napiš něco sám. Aspoň konečně uvidíme, že Martin Hruška není jen spamer špatné nálady, ale něco i umí.
Ale co chtít od člověka, který kvalitu podnikatele posuzuje dle jeho jazykových schopností, že?
NetCentrum bude mít vlastní neveřejná rozšíření, ale základ je dostupný pod GNU GPL pro kohokoliv zdarma:
"Currently, two versions of Holmes exist. The freely distributable version is licenced under the GNU General Public License (GPL). Some libraries and support modules are distributed under the GNU Lesser General Public License (LGPL) and some example programs are public domain. In all such cases, it's clearly stated in comments at the start of the module."
Komerční verzi se hodí pro někoho kdo by chtěl i vlastní rozšíření, které asi Centrum vyvinulo a nebo by chtělo Sherlocka rozvíjet pod jinou než GNU GPL licencí.
Není důležité "za kolik" to tam Seznam dodává nebo kolik nabídli ostatní. Důležitý je, jestli to Atlas bude schopnej využít, nasadit do výsledků fulltextu kontextovou reklamu. Zatím tam nemá nic, ale jestli není padlý na hlavu (on i Seznamn), tak se tam brzo objeví Sklik, a budou se se seznamem dělit o příjmy. Taky o tom napsali na http://www.bloc.cz/hlavni/art_49/seznam-se-spojuje-s-atlasem-tak-horke-to-zase-nebude.aspx
Zajímavý odkaz, ale na to jak je dlouhé a jak autor staví velkou část článku na tom, že SKLIK ve vyhledávání Atlasu není a on tam je, je vámi doporučovaný článek o ničem.
Velice se omlouvám Seznamu i čtenářům, ale po upozornění ze Seznamu musím uvést na pravou míru jednu věc. Spletl jsem se, bohužel, v jedné věci. V hledání zboží je již Seznam soběstačný a používá vlastní vyhledávač zboží. Jyxo bylo na hledání zboží na Seznamu nasazeno jen do 30. dubna 2006.
Přišel jednoho dne Neználek na Lupu a nevěděl, co je to ironie. Tak tedy místo toho, aby se zeptal nějakého kamaráda z Kvítečkova nebo Všeználků zde v diskusi, zeptal se vyhledávačů "co je ironie". Morfeo a Google mu odpověděly, jako první mu podstrčili odkaz na Wikipedii, na český záznam, který byl vysoce pertinentní. Kupodivu Jyxo ani Seznam moc neobstály - v tomto konkrétním případě. Díky Jyxu se ale jako bonus dozvíte "Jak být emo" a díky Seznamu něco o "stydké pysky" na doktorka.cz a ještě můžete vyhledat "co je ironie" i ve zboží! (nikoliv však Jyxem, ale přímo technologí Seznamu)
Samozřejmě tohle je pokus o podvečerní humor (co je humor, ví to nějaký vyhledávač?). Tento špatně položený dotaz v přirozeném jazyce mohl uškodit. Na pouhé ironie nakonec Seznam i Jyxo na první straně tu Wikipedii mají. Snad v ní nějaký vandal nepoupravil tento záznam :-)
Pro nějaké pořádné testování by se musely technologie pustit na stejném vzorku dat, viz http://trec.nist.gov/ atd. Pokud by do toho chtěly vyhledávače jít a toto dovolily, mohlo by se celkem objektivně otestovat aspoň něco.
Účelem vyhledávačů je vydělávat peníze. Lidé čekají, že vyhledávače jim pomohou uspokojovat jejich informační potřeby. Ty jsou subjektivně hodnocené, navíc záleží i na tom, jak se ptáte. Což se třeba raději lépe ptát, místo lamentování nad výsledky? Většina lidí hledá pomocí jednoho slova, to je z mého pohledu to nejvíce zarážející na vyhledávačích - teda spíš na uživatelích. A edukace ze strany vyhledávačů je mizivá.
Řekl bych to takhle. Laik šáhne po tom co zná - Atlas, Centrum, Seznam (abecedně). Kdo pozná google, toho potom ostatní nezajímají. Pokud ho používá jako vyhledávač. Tím nemyslím, že tam dá nějaké slovo co mu vyhodí 1000 výsledků.... ale třeba "posix ve windowsu" Tam se český "vyhledávače" nechytají a buď nenajdou nic, nebo nic odbornýho. Google ovšem najde to o čem, je řeč, že by náhoda? Ani omylem, pokud se chci něco dozvědět, šáhnu po google. Jyxo je u těch technickejch výrazů asi tak nejlíp z českejch.
A to je přesně ono - většina kritizujících lidí si neuvědomuje, že hledá velice odborné věci, ale většina uživatelů neví co je to posix a Google tak vůbec nepotřebuje.
Laik ano, kdo je znaly veci vi kdy se vyplati hledat na centru ci seznamu.
Napriklad kdyz hledate definici nejake konkretni veci v cestine a je vam jasne, ze se tato definice nikde nemuze nachazet oznacena jako definice, pak bez kvalitni morfologie jste proste nahrany.
No ale taková je praxe. Ten kdo má v ruce internet prvně, taky nezná google, ale zná reklamu s letadlem, bobíka a Čtvrtníčka. Takže český vyhledávač má do startu výhodu, ale je mu to na nic. Dobře můžeme se bavit o tom, že se bude někdo vymlouvat, že odborné výrazy neumí české vyhledávače hledat, no trochu rozpor s tím, co se tu píše, že prohlásil pan Lukačovič... sice zmonitorujeme každej chat,no ale odborný věci neumíme najít, i když tu jsou, že....
Laik hleda na Seznamu, profik na Googlu. Laik nenakupuje protoze ho na Nove strasej se zneuzitim. Profik nakupuje. Na penezich zalezi. Takze seznamu Zustaneme u sauto, sreality a tech ostatnich ssluzeb. Jyxo je pro hracicky, 100 mil. dolaru na rocni investice nema takze o cem se bavime? Myslim ze u vyhledavani uz je dobojovano jen ceska internetova "slechta" nechava nahore zastavy a mate sve poddane.
Sdílí všichni názor autora, že Atlas platí Seznamu za zobrazování fulltextu? Přesto, že v něm Seznam zobrazuje svůj Sklik a Google by byl určitě ochoten za zobrazování svého fulltextu platit?
A jak vy víte, že "Google by byl určitě ochoten za zobrazování svého fulltextu platit"?
Jistě jen v jednom případě, kdyby Atlas použil třeba Google Co-op :-)), pak by mu Google zcela jistě platil podíl z reklam, ale zase by si v takovém případě Atlas nemohl do výsledků míchat své reklamy. Možná by to přineslo kvalitní vyhledávání na Atlas a Atlasu i pár peněz.
Mimochodem, psal jsem, že cena je tržní a je tajemstvím, takže klidně může být nula, pokud to pak tahle bude nějak obhajitelné před Finančním úřadem. Dále rozebírám, kolik asi mohlo kdysi stát Jyxo, nic víc - protože pro nějaké další odhady podklady nejsou snadno získatelné. Atlas mohl udělat výběr partnera stylem - dejte nám výledky zadarmo, my to o tom vydáme tiskovou zprávu, budeme někde sto honů za našima reklamama nechávat vašich pár reklam a z nich si nechte těch pár peněz. Ale pak by se asi Seznam zase nehnal do slibu na Skliku umožnit zadavatelům pro "atlasí" hledání reklamy vypnout, nemyslíte?
Nechtěl jsem nijak útočit, jen mě zajímaly další názory.
Podle mě to mohlo být tak, že Google by byl ochoten přenechat část příjmů z AdWords, které by na Atlasu zobrazoval, ale nelíbilo by se mu, že by před jeho výsledky byly placené pozice Atlasu, čímž by si mohl kazit jméno.
Seznamu to pravděpodobně nevadilo, resp. asi vadilo, ale byl to ochoten obětovat za pár dalších uživatelů, které mu Atlas přinese, protože tím bude moci dobře argumentovat u svých inzerentů. Třeba se mohl domluvit i na tom, že nechají doběhnout už zaplacené pozice ve vyhledávání Atlasu a poté budou zobrazovat pouze Sklik.
Abych shrnul: myslím, že poskytovatel vyhledávání bude mít ze spolupráce prospěch a divil bych se tedy, kdyby Atlas za tuto službu platil. Dokonce jsem přesvědčen, že to bude spíše naopak.
Jsem zvedavy zda se pan reditel Duron nekdy vyjadri k tomu, ze se mu nepodarilo udelat z Atlasu dvojku v portalech nebo zda vysvetli svuj planovany odchod z Atlasu...ze by utikal pred svymi vykony jinam...
Řazení výsledků je ovlivněno ale Ivo v tom nejede, alespoň ne pro firmy, tam si přihrnují jiní, jedna paní povídala, že je zatím Ivův nejbližší. Stojí to 50 tis. na rok ale třeba toho po povýšení nechal, každopádně "placený zápis" na kw okna o kterém jsem věděl a byl stále třetí už je pryč.