Vlákno názorů k článku Jyxo míří na Atlas, Webfast tu končí od Marek Prokop - OpenGrid sice neznám, ale jako docela zajímavý projekt...

  • Článek je starý, nové názory již nelze přidávat.
  • 4. 1. 2003 1:36

    Marek Prokop (neregistrovaný)
    OpenGrid sice neznám, ale jako docela zajímavý projekt na značkování webu mi připadá HTML. Sice se zatím ještě moc neujalo, ale jeho popularita začíná stoupat, takže dnes už na českém internetu pár desítek webů v HTML je (a některé dokonce v XHTML). Píše o tom ostatně Martin Kopta v sousedním příspěvku a já jeho víru v pozitivní trend sdílím.

    Co se týče RSS (a pro změnu vážně), ano, asi tak nějak vznikalo a začalo se šířit. Ale nebylo tomu s HTML stejně? To asi také původně vzniklo pro potřeby publikování informací v rámci velkých organizací a teprve o dost později se ho zmocnil Franta Vomáčka, aby v něm matlal svůj osobní weblog.

    Začarované kruhy jsou špatné jen tehdy, nenajde-li se někdo, kdo je rozetne :-)
  • 3. 1. 2003 23:16

    Martin Kopta, (neregistrovaný)
    Značkovat každý jednotlivý text je pracné, a když už se s tím někdo dělá, tak obvykle z nějakého důvodu. Každá redakce má nějaký style guide, vzpomínám si, že poměrně důsledné značkování ve článcích měla už loni i Lupa -- a platí si na to redaktora. Tam, kde je potřeba redakční systém zpřístupnit širšímu okruhu psáčů obvykle dobře funguje nějaký WYSIWYG (Živě) nebo Wiki (Sexus). To ostatní jsou šablony.
  • 3. 1. 2003 22:36

    Michal Illich (neregistrovaný)
    Zacarovane kruhy jsou hnusna vec :) - spousta skvelych myslenek kvuli nim zajde. Mimochodem zajimavy projekt na znackovani webu byl OpenGrid, ale protoze se nikdo nepridal, tak je vicemene mrtvy.

    (a kdyz odbocim, zacarovane kruhy jsou mimochodem duvody, proc na internetu neprogramuju chaty, bazary, seznamky, katalogy, atd. ale radeji fulltext - vsechno to jsou docela zabavne veci, ale ty prve jmenovane vetsinou trpi problemem "nikdo je nepouziva, protoze je nikdo nepouziva"; fulltext si vystaci sam: jeho kvalita neni zavisla na poctu uzivatelu).

    *

    S tim RSS (a RDF) to je trosku jina vec. Byly to nejdriv velke weby, ktere ucitily potrebu si vymenovat data. A tak rekli "Poslys Franto, webmastre z xyz, vyexportuj mi to do neceho hezky parsovatelneho". A kdyz se takhle domluvili dva (vetsinou spriznene) servery a nejaky programator to natlapal, tak uz byla skoda to nevyuzit a tak to bud dali verejne ke cteni nebo o tom aspon dali vedet zajemcum. A protoze podobnou domluvou prosli temer vsichni (kazdy vetsi web ma nejake partnery) a zacalo to byt podporovane vetsinou publikacnich systemu, tak byla otevrena cesta k tomu, aby tyhle informace zacaly odebirat portaly nebo specializovane vyhledavace.

    Tedy hnacim motorem tady byla spoluprace "velkych" a zaroven velka jednoduchost cele implementace (programujete jednou pro dany publikacni system). U dukladneho znackovani je potreba spoluprace autoru obsahu a znackovat kazdou jednotlivou stranku, coz je pracne.

    *

    Mimochodem, myslim, ze Google News take pouziva RSS.








  • 3. 1. 2003 19:33

    Lukáš Mižoch (neregistrovaný)
    Ad 1) Mám takový pocit, jako by to byl právě Martin Kopta, kdo Radima Hasalíka takto vynesl do záře reflektorů české blogařské scény. ;-)

    Ad 2) Já třeba ano a velmi rád. Jako fanoušek zrakově postižených uživatelů se jim snažím co nejvíce vyjít vstříc. :-)
  • 3. 1. 2003 18:46

    Martin Kopta, (neregistrovaný)
    Ještě jsem zapomněl k bodu 4) Diakritika doplnit, že homografie určitě není úplně zanedbatelný problém a Jyxo si s ní neporadí. Jak jinak si vysvětlit, že při pokusu najít šití Jyxo vrací odkazy na VDSL? :-)
  • 3. 1. 2003 17:29

    Michal Illich (neregistrovaný)
    Prave ze 'jej', protoze rec je o tom doplnovani.

    Pokud budete vetu cist s 'ji' nebo 'je', tak dojde k tomuto nedorozumeni:

    > (není pravda, že diakritiky neumějí, neumějí jen "doplnit"
    > diakritiku u dotazů v ASCII nebo u zdrojů v ASCII).

    Aneb jak jsou zajmena obcas dulezita :)
  • 3. 1. 2003 15:18

    Martin Kopta, (neregistrovaný)

    Ad 2) Nevím, nevím, ale třeba Novinky začaly používat pro nadpisy sémantické značky, Sexus je celý v XHTML 1.0 Strict, Bílé zboží je napsáno strukturně, máme tu už několik týdnů strukturně napsané Živě, a pak je tu pomalu sílící trend osobních weblogů, pro které je sémantické využití značek a metadat celkem běžné (vím, zatím jde o pár desítek webů, ale jsou to většinou relevatní zdroje). Vlastnosti ALT vyžaduje dokonce norma a s rostoucím ohledem na osoby se specifickými potřebami se i atributivní metadata objevují, kde bychom je dříve nenašli...

    Myslím, že u nově vznikajících stránek už si žádný profesionální webdesigner nedovolí zcela ignorovat (skromnou) sémantické rozrůznění HTML a u webů, které už stojí, je jen otázkou času, kdy dojde ke drobným úpravám.

    Mimochodem, ta práce s diakritikami by mě zajímala -- a třeba i pokus o srovnání s jinými vyhledavači a porovnání výhod přístupu, který jste zvolil s repsketováním existujících diakritik, jak je pojímají Google a AllTheWeb (není pravda, že diakritiky neumějí, neumějí jen "doplnit" diakritiku u dotazů v ASCII nebo u zdrojů v ASCII). Přimlouvám se u Marka, aby to publikoval.

  • 3. 1. 2003 11:53

    Marek Prokop (neregistrovaný)
    Michale, tvůj postoj k metadatům a sémantice (X)HTML vede k začarovanému kruhu. Webmasteři nezačnou sémantické prvky používat, dokud je vyhledavače nebudou brát v úvahu a naopak, jak píšeš, vyhledavače nebudou brát v úvahu něco, co většina webmasterů nepoužívá.

    S tímto přístupem by třeba nikdy nevznikl Daypop, protože RSS přeci na celém světe používá jen pár set webů. Přesto je to jeden z nejužitečnějších vyhledavačů, který svým způsobem předběhl i GoogleNews a dosáhl toho při skoro stejném efektu technologicky mnohanásobně jednoduššími prostředky.

    Myslím, že to jsou vyhledavače, které musí udělat ten první krok. Dokonce jsem přesvědčen, že ho udělají a některé už s tím i začaly. Bylo by škoda, kdyby tak progresivní vyhledavač jako Jyxo zůstal pozadu.
  • 3. 1. 2003 10:23

    Michal Illich (neregistrovaný)
    Precetl jsem si clanek az ted (a uprimne mne docela prekvapil :) ), takze opravim nektere nepresnosti:

    (1) Bombardovani - ano, v tomto je Jyxo velmi blizke Google; "hodnoceni zvnejsku" nebo "kolaborativni filtrovani" je velmi silna technika na hodnoceni relevance - v 99% jsou jeji vysledky naprosto skvele. To, ze se obcas par lidi rozhodne, ze pro jednu konkretni frazi vynese nejaky odkaz na vrchol, neni ZADNY problem. Frazi 'hasalik je vul' nehledal nikdo, kdo se o tom napred nerozvedel z blogu, ze?
    (a mimochodem, Jyxo je mene ovlivnitelne - v tomto pripade to zafungovalo pouze proto, ze ona fraze byla soucasti URL, coz cilovy web dovoluje a blogger toho zneuzil).

    (2) Metadata - Jyxo pouziva metatagy description a keywords. Ostatni metadata bohuzel prakticky nikdo nepouziva, tedy neni co podporovat :( - az se v dostatecne mire objevi, zacneme je samozrejme zohlednovat.

    (3) UTF-8 - ano, zde si sypu popel na hlavu. 30.12. mne na to upozornil Marek Prokop, o silvestru jsem lyzoval, opravim to az ted.

    (4) Diakritika - zde si naopak myslim, ze automaticke doplnovani diakritiky je velmi prinosne. FAST a Google ji nepodporuji a proto casto nenajdou co je potreba.
    A mimochodem, to doplnovani funguje sloziteji, nez je popsano v clanku (a zaroven sloziteji nez u jinych vyhledavacu). Chyby z homografie obvykle nenastaji - klidne o tom napisu presnejsi detaily.

    (5) cz versus cestina - Jyxo se snazi indexovat jak to, co je v .cz, tak to, co je mimo .cz a je psane cesky. To druhe se urcuje manualne a tak je to jako vsechno manualni trochu narocnejsi na udrzbu. Ale myslim, ze jsme vykrocili spravnym smerem.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).