To šifrování bych z úvahy klidně vynechal. Posílám-li někomu nešifrovaný email, je to taky soukromá zpráva a nikdo jiný nemá právo si ji číst.
Máte pravdu, že kdo si na IRC otevře veřejně přístupný kanál, nemá se divit když se na něj někdo připojí. Ostatně k tomu IRC slouží. Ke komunikaci. Pochybuji, že by se googlebot snažil vlámat do neveřejných kanálů, a ani nevím jak by to dělal :-)))
Máte pravdu, to omezení algoritmu na 999 výsledků jsem si neuvědomil...
Jistě je mírně nesmyslné srovnávat dvě přibližná čísla, ovšem možná jen o něco málo víc než odhadovat počet výsledků rozšířeného dotazu jako nižší než u zúženého. Snad se jedná o nepodstatnost, chtěl jsem jen zmínit, že mne zarazila.
Mně v tom textu nejvíce irituje zmínka o indexování SOUKROMÝCH zpráv v IRC. Elektronická komunikace je soukromá, pokud probíhá po soukromém šifrovaném kanále, k němuž zná helso jen autorizovaná osoba. Pak nemá Google šanci se tam vůbec dostat. Pokud se komunikuje po veřejném kanále, pak takový člověk automaticky souhlasí s tím, že obsah takových zpráv je veřejný. Jestli někdo nechápe, že soukromé důvěrné informace má šifrovat dobrým šifrovacím algoritmem, pak je to pouze jeho chyba, nikoliv chyba Googlu.
Pokud dáte hledat v Google hledat jakýkoli dotaz, vrátí vám vždy maximálně 999 výsledků. Je to normální omezení algoritmu (málokdo opravdu hledá tisíc výsledků). Není to tedy tak, že by ten syčák Google před vámi chtěl něco skrývat.
Když hledáte ty dotazy o Kábulu, dostáváte *přibližně* 830 tisíc výsledků. Jistě chápete, že je jak pro Google, tak pro uživatele je naprosto zbytečné počítat to přesně. Zadáním dalšího nesmyslného OR jenom donutíte Google znovu odhadnout počet výsledků, přičemž náhodou vyjde jiné číslo (odlišné o dvě procenta). Vskutku vypadá nelogicky to, že to číslo je nižší. Jenomže když porovnáváte dvě přibližná čísla zatížená nějakou chybou, tak se přece nedá jednoznačně říct, které z nich je nižší!
Článek na The Register, který v textu zmiňuji, je už staršího data a od té doby je hodně nalezených GoogleNACKů opraveno. I tak ovšem, mi "keyboard bracelet" vrátí 804 výsledků z "přibližně 28 800" Pokud opakuji výběr se zahrnutím vyřazených podobných výsledků, dostanu jich 999. To znamená, že cca 27 801 odkazů přede mnou Google skryl...
BTW, další podivností Googlu je např. operátor OR - je správné, že na výraz "kabul OR kaboul OR kaboel" mi vrátí méně výsledků než na "kabul OR kaboul"?
no jixo jede na atlasu a ten pouziva nemalo lidi, goolge pouziva(l) seznam ne?
takze zhodnotit pomer to je otazka, kolik BEZNYCH lidi naprimo pouziva Google? Take jich dramaticka vetsina nebude, bezna ovecka pouziva seznam, atlas, centrum, prost to co jim nekdo nastavil nebo co vidi v reklamach
Jak jsem uz rekl - vyhledavac hleda to co zadate, ne to co chcete. Pokud vite co hledate, umite obvykle polozit dotaz tak abyste dostal vysledek ktery chcete. Je to typicky problem prilis obecnych dotazu.
Nenechte se vysmát, že podíl Googlu je u nás menší kvůli Jyxu. Ano, trošku víc znalí uživatelé Jyxo znají, vědí o jeho výhodách a používají ho. Ale kolik jich je? Nebýt toho, že Jyxo dodává výsledky dalším katalogům -- kolik běžných Frantů používá přímo Jyxo?
Mám takovou zkušenost, že většina z nich nepoužívá ani Google. Ano, zní to strašně, ale je to tak. Nadávají, jak je to pomalé, nepřehledné a plné reklam, ale stále mají jako výchozí stránku Seznam, protože ji tak měli nastavenou, když k tomu přišli. A můžete jim radit, že Google je lepší, rychlejší, mluví taky česky a navíc se dá bezvadně nastavit... Sotva to ocení.
Profíci samozřejmě používají Google/ATW/Jyxo přímo z lišty svého prohlížeče, nebo ***toolbaru, ale ti netvoří většinu.
Ehm, vzdyt na Jyxu je na 3. miste, to co je na Googlu na 2. miste a na 2. miste to, co na Googlu na ctvrtem (tretim neodsazenem).
U Googlu *naprosto* stejne URL tedy hodnotite jako "stranku, ktera se naplno venuje danemu tematu" a u Jyxa je tataz stranka nesmyslna? Mozna jste krapet zaujaty :)
A IMHO je stranka, ktera je na prvnim miste u Jyxa take skvela (jsou tam veskere ceske a anglicke titulky ke vsem dilum futuramy). Ale uznavam, ze tento odstavec je subjektivni a ze muzete hodnotit kvalitu konkretni stranky jinak.
Pokud ale mluvite o vyhledavaci "Joxo", jak trikrat pisete v textu, a ne o Jyxo.cz, tak se branim zbytecne :)
Dejte si hledat Googlem české stránky a jako klíčové slovo uvedte FUTURAMA. Pak totéž zkuste v Joxo. Dostanete dva naprosto rozdílné výsledky. Google zobrazí mezi prvními třemi odkazy dvě stránky, které se opravdu plně věnují klíčovému slovu (ta třetí sice také, ale "blbě").
Vedle toho Joxo najde neuvěřitelné množství stránek, které se klíčovému slovu vůbec nevěnují, ale je na nich uvedeno (např.: mě se líbí FUTURAMA). Až na 21 stránce ukáže odkazy na stránky, které mají z pohledu klíčového slova "hodnotný obsah". Z mého pohledu tedy Joxo postrádá "inteligenci", která by dokázala oddělit zrno (weby k věci) od plev (výkřiky do tmy).
Pánové naštěstí je na mě, který výsledek použiji...., globálně mi ale vždy pomohl GOOGLE.com . Pracuje česky, a i české weby má dobře zmapované, jinak souhlasím s Trojlístekem Google, Jyxo, AlltheWeb.
Jinak i ALTAVISTA není špatná, ale google ...rychle a bez otravné reklamy..a popup.....a zdůrazňuju rychle najde hodně......a téměř vždy ve výsledku najdu to co hledám. Je to prosté, zadejte si stejné dotazy třeba do quicku, nebo seznamu....... a výsledek nic moc - prostě hrůza a to nepočítám reload stránek vyhledavačů zahnojených reklamou,google je prostě špička jak na český web tak svět..... Takže ať si dělají u googlu statistiky a preferují někoho před druhým, to mi nevadí, pokud najdu vždy to co hledám.A nevadí mi že to je na druhé či třetí stránce.....ono se taky musí umět správně položit dotaz.... A GOGGLE.com je opravdu nejlepší....doufám že bude v této podobě i do budoucna.
Celosvetove Google a pak Alltheweb
V Cesku Jyxo, Morfeo. WebSeek a Empyreum nejak uhnily.
Bohuzel se mi parkarat stalo, ze na ceskem webu Google a AllTheWeb nasly to co Jyxo a Morfeo nenasly ackoliv maji na starosti o nekolik radu mensi pisecek.
Celosvetove Google a pak Alltheweb
V Cesku Jyxo, Morfeo. WebSeek a Empyreum nejak uhnily.
Bohuzel se mi parkarat stalo, ze na ceskem webu Google a AllTheWeb nasly to co Jyxo a Morfeo nenasly ackoliv maji na starosti o nekolik radu mensi pisecek.
Mohl by nekdo rozvest, jak Google indexuje IRC? Mne to prijde jako nesmysl: bud by musel mit prime napojeni na IRC servery; nebo by musel provozovat boty, kteri by lezli na kazdy kanal, ktery existuje...
Pokud kliknete v Google na nejaky odkaz, protoze se vam libi titulek, popisek nebo/a domena, jeste neznamena, ze na strance je obsah, ktery jste hledal. Takze tim nezjistite, "jestli skutecne odpovidaji tomu, co clovek hledal". Jen ze ma pritazlivy popisek. :-)
Docela by mě zajímalo, jaké používáte vyhledavače, když ne (jenom) Google.
Když jsem se poprvé dostal k Internetu (1995)tak jsem používal Yahoo a Webcrawler. K tomu český Seznam. Celkem dlouho jsem si s tím vystačil (hlavně proto, že jsem neměl moc povědomí o existenci a kvalitě ostatních).
Google jsem začal používat až s příchodem Redboxu. Prostě jsem časem zjistil, že Redbox mi dává užitečnější výsledky než Seznam, no a protože Redbox byl vlastně převlečený Google, tak jsem z něj plynule přešel na Google. A zatím jsem nenašel nic, co by mi vyhovovalo líp. Někdy se mi osvědčí Alltheweb.
Např. na Googlu se mi nejvíc líbí cashování stránek a barevné označení hledaného slova. Když najdu nějakou stránku, tak téměř výhradně tam jdu přes odkaz Cache, protože pak na ní okamžitě najdu ve změti textu slovo, které jsem hledal a při "prokousávání" se spoustou stránek je to asi nejrychlejší.
Docela rád si nechám poradit, napište jaké vyhledávače vám v praxi nejvíc vyhovují.
Vsak to je naprosto v poradku, nakonec uspesnost stranek neni dana nejakym PageRankem a zpetnymi odkazy a ostatnimi blbostmi, ale tim, jestli skutecne odpovidaji tomu, co clovek hledal, a to se da zijstit tak, ze na ne kliknul... Leo
to sem presne cekal .. je videt, ze google takle dokaze zmast kazdou lamu :)
tak se podivejte do kodu ...
u kazdy vasi radoby prime URL je totiz
<a href="http://www.lupa.cz/ onmousedown="return clk(1,this)">
funkci clk() uz snad dohledat umite, nicmene dela to, ze naloaduje dummy obrazek z url (new Image()).src="/url?sa=T&start="+n+"&url="+escape(el.href);
tzn. url stranky (kde je search string) a misto n dosadi pozici ..
mno a kdo i tak neveri, tak si muze nahodit sniffer a pri kliku na odkaz se mu zobrazi neco jako
GET /url?sa=T&start=1&url=http%3A//www.lupa.cz/ HTTP/1.1
Accept: */*
Referer: http://www.google.com/search?q=lupa&ie=UTF-8&oe=UTF-8&hl=cs&lr=
Accept-Language: cs,en;q=0.5
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)
Host: www.google.com
Connection: Keep-Alive
HTTP/1.1 204 No Content
Cache-control: private
Content-Type: text/html
Server: GWS/2.1
Content-Length: 0
Date: Fri, 30 Jan 2004 09:35:18 GMT
A jestlipak jste si take vsimli, ze google sbira informace o tom, na ktery odkaz z jeho vysledku jste klikli a na ktere se vam zobrazil pozici?
tfuj tfuj ..
Podíl uživatelů používají google je obrovský. Podíl se navíc stále zvětšuje kvůli katalogovým vyhledačům využívají google indexy. U českých uživatelů to není tak velký podíl díky Jyxo.cz To je mocným nástrojem pro vyhledávání českých stránek. Skloňování, časování a doplnění diakritiky google prostě nemá.
Google si zvoji monopolni pozici dobyl kvalitou sluzby za rozumnou cenu a nic nebrani komukoliv jinemu prijit s necim lepsim. Ja jako vyhledavajici mam moznost volby a muzu si kdykoliv vybrat libovolny jiny vyhledavac. To ze je 90% uzivatelu internetu neschopno si vybrat jiny nastroj nez ten pred ktery je poprve posadi nejaky pokrocilejsi uzivatel je vec jina a nesouvisi s googlem. Ruzne clanky v tomto duchu hodne zavani konspirativnimi teoriemi ala Akta X a k pravde maji hodne daleko. Nicmene tento clanek na lupe je strizlivy, pekne napsany a jasne shrnuje problemy ktere trapi a budou trapit kazdy uspesny vyhledavac.
Kritici klidne muzou psat jak google manipuluje se zaznamy, ale zajimalo by me jaky obecny vyhledavac sami pouzivaji ;-)
Ad: "Co je ještě zrádnější a z hlediska vnější manipulace zneužitelnější, je vlastnost Page Ranku, při které u negativně hodnocených stránek vztahuje toto hodnocení i na jiné stránky, na které odkazují."
Takhle to IMHO nefunguje. Spíše budou penalizovány ty stránky, které na dané link farmy aj. odkazují.
Prijde mi to, ze vetsina popisovanych problemu jsou problemy vyhledavaneho, nikoliv vyhledavajiciho. (To neni kritika clanku, to je konstatovani faktu.)
Jako vyhledavajiciho me tolik nezajima, ze pri dotazu "nejakou firmu na recovery dat" tam jedna konkretni firma neni (i kdyz vas jako vlastnika te firmy to muze stat majlant) a jako vyhledavajiciho me tolik nezajima, ze mezi odkazy nekdo propasoval nejaky nesouvisejici (proste ho preskocim). Jako vyhledavajiciho me dokonce ani tak nezajimaji ruzne spekulativni metody zvysovani page ranku (spatny odkaz poznam bud z anotace nebo po otevreni "cached" odkazu - cilove strance ani nezvysim pocet hitu!).
Jako vyhledavajicimu mi ovsem vadi, pokud nejaka stranka neni zaindexovana vubec. Pak se na ni nedostanu.
"...Blogeři podle nich tvoří jen zanedbatelnou část uživatelů Internetu, avšak dokáží ovlivňovat informace a mínění, předávané většině jen díky tomu, že snadno pronikají do vyhledávacích priorit Googlu..."
Nic nebrání novinářům, aby využívali obdobné metody. Metody blogerů nejsou nijak "nečestné". Nic nebrání novinám, aby byly jejich weby lépe optimalizované pro čtenáře (a tím i pro vyhledávače), aby psali tak, že stojí za to je odkazovat apod.