Vlákno názorů k článku Co vlastně chcete po vyhledávači? od Marek Prokop - Nevím, zda se shodneme na pojetí "absolutně neoptimalizované"...

  • Článek je starý, nové názory již nelze přidávat.
  • 6. 5. 2003 22:27

    Marek Prokop (neregistrovaný)
    Nevím, zda se shodneme na pojetí "absolutně neoptimalizované" podoby a zda se ta vaše představa shoduje s praxí. Já nacházím odkazy na dokumenty v PDF velmi často mezi prvními deseti výsledky v Googlu, čili nalezitelné jsou a optimalizované v jistém smyslu taky.

    Dále si možná nerozumíme ani v pojetí *hodnotné* informace. Každá informace na Webu má dvě části -- vlastní informaci a pak balík metainformací umožňující vlastní informaci nějak zatřídit, přiřadit ji určitou věrohodnost, časovou platnost, apod.

    Typickou "vlastností" špatně udělaných webových stránek je, že ten balík metainformací není dostatečný, nebo zcela chybí. Samotná informace pak má jen kvůli tomu hodnotu menší, malou a často dokonce žádnou, a to i v případě, že by se za jasně zřejmého a věrohodného kontextu jednalo o informaci velmi cennou.

    Jakožto blogger se často dostávám do situace, kdy bych velmi rád odkázal na nějaký článek, protože jeho obsah *vypadá* velmi zajímavě a *mohl* by mít značnou hodnotu. Jenže kvůli zdánlivým drobnostem, třeba proto, že není uveden autor, nebo článek není datován, na ceně prudce ztrácí. Někdy mám čas, abych kontext nějak dohledal a věrohodnost ověřil, ale někdy na to čas nemám, nebo to dokonce vůbec nejde.
  • 6. 5. 2003 19:19

    jk (neregistrovaný)
    "Nalezitelnost v hlavních vyhledavačích pro relevantní dotazy je dnes prostě základním atributem kvalitního webu. Ty nekvalitní nalézat není třeba."

    Opravdu?

    Nejhodnotnější informace jsou podle mé zkušenosti nalezitelné na webu v "absolutně neoptimalizované" podobě pdf, ps a podobně.

    Podíl "kvalitních webů" s téměř bezcenným obsahem typu weblogy, osobní stránky a firemní prezentace je tak velký, že jako "encyklopedie" nebo "knihovna" už je html část webu skoro nepoužitelná.

  • 3. 5. 2003 19:05

    L.Gombos (neregistrovaný)
    Daleko horší je, že většina těch, co tyto (sémantické) značky používá, je používá špatně. Viz typické zaměňování STRONG a B, EM a I nebo dokonce CITE, atd.
  • 3. 5. 2003 1:09

    Michal Kubeček (neregistrovaný)
    em, strong, cite, dfn, code, samp, kbd, var, abbr, acronym, q, blockquote, ...

    Že je (skoro) nikdo nepoužívá, to je věc jiná...

  • 2. 5. 2003 21:45

    Pavel Houser, Science World (neregistrovaný)
    ještě poznámka k sémantičnosti HTML/XML.
    nemůžu si pomoct, ale HTML podle mě nijak sémantické není. možná záleží na tom, co si pod pojmem "sémantické" představujeme. dívám se do zdrojového kódu této stránky. co je v něm sémantického?
    vlastně vůbec neznám žádný sémantický tag v html. to, že něco je titulek, něco odkaz, něco v tabulce a něco položka seznamu je přece stále syntax (třebaže nemusí nutně souviset jen s grafickým ztvárněním), ne sémantika.
  • 30. 4. 2003 18:57

    Marek Prokop (neregistrovaný)
    V tom bylo to přirovnání k Babylonské knihovně dobré -- v určitém smyslu existují všechny informace, aby však bylo možné konkrétní informaci využít, musí být splněny dvě podmínky: musím ji nalézt a musím si být jist, že to je ta informace, kterou chci.

    Na Webu to znamená jednak dobrou viditelnost (zejména prostřednictvím vyhledavačů) a jednak věrohodnost zdroje. Není-li splněna první podmínka, není většinou splněna ani druhá.
  • 30. 4. 2003 15:12

    Leo (neregistrovaný)
    "Informace, které tuto míru nenaplňují, reálně neexistují, neboť prostá přitomnost souboru kdesi na disku jakéhosi serveru připojeného do sítě prostě není existence na webu."

    Fakt? Pokud na nej vede odkaz z jine stranky, pak snad existuje. Leo

  • 30. 4. 2003 13:56

    Marek Prokop (neregistrovaný)
    Kdyz se vám dostane do ruky kniha vytištěná bílým písmem na bílém papíře, budete vinit své brýle, že vám ten text nechtějí ukázat? Nebo se smíříte s tím, že tiskař byl idiot a lempl, když knihu neoptimalizoval pro čtení?

    Web je něco jiného, než klasická média a k webovému obsahu neodmyslitelně patří určitá míra přístupnosti. Informace, které tuto míru nenaplňují, reálně neexistují, neboť prostá přitomnost souboru kdesi na disku jakéhosi serveru připojeného do sítě prostě není existence na webu.

    Všimněte si ale, prosím, že píšu o přístupnosti, nikoli o optimalizaci pro vyhledavače. Optimalizace pro vyhledavače vstupuje do hry tehdy, když je informací příliš mnoho a jde o to, najít mezi miliony stránek tu nejvíce relevantní. Přístupnost je naopak nezbytná k tomu, aby se šlo dostat k unikátní informaci, kterou by jinak vyhledavač vůbec nenašel.

    Nicméně i optimalizace pro vyhledavače v podstatě není nic jiného, než forma podání oné informace. Buď ji napíšu dobře, čitelně, srozumitelně a výstižně, a pak ji vyhledavač nejen najde, ale i upřednostní, a nebo ji napíšu blbě a pak zřejmě i hodnota té informace bude pochybná.
  • 30. 4. 2003 13:40

    pajout (neregistrovaný)
    Nac pouzivat Google, kdyz staci vytahnout z police Borghesovy knihovny tu spravnou knihu ... :)
  • 30. 4. 2003 12:47

    Pavel Houser, Science World (neregistrovaný)
    kritiku beru, polemizuji pouze s jedinou větou - "ty nekvalitní [stranky] nalézat není třeba".
    obavam se, ze pokud hledam nejakou informaci, pak ji proste chci najit. je sice mozne si rict "tvurce webu byl idiot/lenoch, ze svuj vytvor neoptimalizoval pro vyhledavace", nicmene toto ujisteni mi hledanou informaci jaksi nevynahradi.
  • 30. 4. 2003 12:08

    Marek Prokop (neregistrovaný)
    Paralela mezi Webem a Borghesovou Babylonskou knihovnou je sice zajímavá, má však minimálně jednu slabinu: zatímco knihy nikdo nepíše s ohledem na fulltextové vyhledavače, u webových dokumentů by tomu mělo být, a velmi často již je, přesně naopak. Nalezitelnost v hlavních vyhledavačích pro relevantní dotazy je dnes prostě základním atributem kvalitního webu. Ty nekvalitní nalézat není třeba.

    Jinak, na některé faktické chyby v článku již poukázali ostatní diskutující (hodnocení stránek Googlem), já bych se ještě zastavil u sémantického HTML/XML. Nevím, kde autor přišel k informaci, že "tagy HTML mají charakter spíše prezenční grafiky (určují barvu, styl písma, velikost atd.)." Předpokládám, že místo *prezenční* myslel autor *prezentační* grafiku, nicméně ani potom není toto tvrzení příliš pravdivé. HTML je jazyk vyznačující *strukturu* a částečně i sémantiku hypertextových dokumentů. Postupným vývojem se do něj sice dostalo pár skutečně prezentačních značek, ale jejich význam pro HTML jako takové je minimální a v poslední době se od jejich užívání již opět ustupuje.

    Úvahám o XML už pak nerozumím vůbec. Autor zřejmě žije v domění, že XML je jakousi modernější alternativou k HTML, což ovšem není pravda ani trochu. V této souvislosti by se snad dalo hovořit jen o XHTML, ale to oproti původnímu HTML žádné převratné sémantické ambice nemá.

    Na závěr bych si ještě dovolil polemizovat s větou: "Aby ale vyhledávače mohly podporovat sémantický web, musela by v něm nejprve být vytvořena nezanedbatelná množina stránek." V zásadě je to tvrzení sice správné, ale obávám se, že onou "nezanedbatelnou množinou" myslel autor řádově miliony dokumentů. Jenže to vůbec není potřeba. Kromě mainstreamových vyhledavačů existuje i plno alternativních, které mohou být velmi užitečné i pro malé soubory dokumentů, např. z určitého oboru, nebo dokonce jen z určitého webu.

    Shrnuto: inspirativní článek otevírající zajímavý pohled na možný vývoj Webu; jeho argumentace je však oslabena četnými faktickými chybami.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).