Ad 2) Nevím, nevím, ale třeba Novinky začaly používat pro nadpisy sémantické značky, Sexus je celý v XHTML 1.0 Strict, Bílé zboží je napsáno strukturně, máme tu už několik týdnů strukturně napsané Živě, a pak je tu pomalu sílící trend osobních weblogů, pro které je sémantické využití značek a metadat celkem běžné (vím, zatím jde o pár desítek webů, ale jsou to většinou relevatní zdroje). Vlastnosti ALT vyžaduje dokonce norma a s rostoucím ohledem na osoby se specifickými potřebami se i atributivní metadata objevují, kde bychom je dříve nenašli...
Myslím, že u nově vznikajících stránek už si žádný profesionální webdesigner nedovolí zcela ignorovat (skromnou) sémantické rozrůznění HTML a u webů, které už stojí, je jen otázkou času, kdy dojde ke drobným úpravám.
Mimochodem, ta práce s diakritikami by mě zajímala -- a třeba i pokus o srovnání s jinými vyhledavači a porovnání výhod přístupu, který jste zvolil s repsketováním existujících diakritik, jak je pojímají Google a AllTheWeb (není pravda, že diakritiky neumějí, neumějí jen "doplnit" diakritiku u dotazů v ASCII nebo u zdrojů v ASCII). Přimlouvám se u Marka, aby to publikoval.
Ne, to jsem neprověřoval. Zvažoval jsem to, ale netuším, jak dosáhnout takového srovnání, abych vyloučil backlinky. Možná to zkusím na Dívce z autobusu, na tu je odkazů zatím málo.
Jinak jsem ještě zapomněl panu Illichovi vzkázat, že překvapených lidí bylo asi při pohledu na dnešní vydání Lupy více. Chodím občas na Pankrác na večeři (to je čtvrť, kde sídlí Atlas) a jednou večer jsem od vedlejšího stolu zaslechl, že Atlas mění vyhledavač ... moc možností není, tak jsem několika dobře mířenými hláškami v závěru roku vyvolal v pár lidech dojem, že vlastně o všem už vím a zainteresované strany odposlechnutou informaci potvrdily.
Tak tedy jen abyste věděli, že Lupa je horší než Mosad. :-) Jsme všude, slyšíme všechno. I když teda společnost v té restauraci mluvila tak hlasitě, že jsem to prostě přeslechnout nemohl. Slibuji, že seznam restaurací, které v Praze navštěvuji, napříště zveřejním na svém webu. :-)
Vsimnete si, ze na dane strance jsou 3 obrazky. Za soucasneho stavu techniky nedokaze ZADNY vyhledavac rozpoznat, zda na tech obrazcich jsou vyobrazene ponozky nebo cepice. Co tedy delat? Musi se spolehnout na textovou informaci, kde autor (nepravdive) tvrdi, ze na strance jsou ponozky.
*
A mimochodem, prohlednete si vysledky Google - vetsina vysledku tam ma take slovo ponozky v url a nadpisu. A kritizovana stranka je v prvnich patnactce odkazu taky. Trochu spatny priklad k dokazovani, kdo je lepsi :)
Nevím, nevím, tady jsou jiné výsledky Googlu, které ukazují, že se slovo ponožky na webu his.cz vůbec nikde nenachází.
Pokud žádný vyhledavač nedokáže rozpoznat, co na stránce, na které jsou jen obrázky bez ALTů, skutečně je, proč ji tedy indexuje? Taková stránka není platným HTML dokumentem a může se hodit maximálně pro vyhledávání obrázků (pokud mají něco rozumného alespoň v názvu). To je výtka všem vyhledavačům :-)
Nyní výtka specificky Jyxu a ostatním českým vyhledavačům. Na tomto příkladu je krásně vidět jak je filtrování/doplňování diakritických znamének ošidné. Není-li na stránce žádný text, jak Jyxo pozná, že je to česká stránka a že tedy ponožky = ponozky? Podle metadat je ta stránka navíc ve slovenštině.
Musím znovu opakovat to, co jsem už v této diskusi napsal. Uživatel si nechce (hloupé slovo, on nemůže) vybírat z 34 tisíc stránek, které Jyxo vrátí na dotaz ponožky. Uživatel chce a může využít maximálně pár desítek odkazů, zato však opravdu relevantních. Není tajemství, že mám Jyxo rád a že ho považuji za jednoznačně nejlepší český vyhledavač, ale větší přísnost na webmastery by mu hodně pomohla a čím víc bude u nás přibývat stránek, tím nutnější to bude.
Škoda, že nikdy nikoho ještě nenapadlo zaplatit si u mě nějakou reklamu ve článku, vzhledem k pondělní stávce by se mi možnost jízdy vlastní tramvají celkem šikla.
Jinak, Google opěvují jen lidé, kteří neznají AllTheWeb.
V takovem pripade (hledate-li jmeno) doporucuji zadat dotaz v uvozovkach do libovolneho jineho vyhledavace. Dostanete stejne vysledky (protoze presne tohle Megatext dela - hleda vzdy presnou frazi, pokud existuje alespon jeden dokument, ktery ji obsahuje; kvuli tomu v techhle pripadech vysledky pusobi dobre). V jinych vyhledavacich ziskate tech informace jeste daleko vic, protoze Megatext ma suverenne nejmensi databazi ze vsech :)