to není tak jednoduché :). Ne každý web má stejný obsah na http a https například. Pokud máš pro vyhledávání vytvořený rozhodovací strom, těžko můžeš něco sečíst, proto jim asi dělá velké problémy následovat přesměrování.
Oni přímo https nedownrankují, ale jejich domácí mazlíček se naučil, že http stránky mají povětšinou lepší obsah, tak vracel raději je :).
Můžeme se seznam smát a říkat, že jiní to dokázali, ale seznam má velice malý tým a malý rozpočet, obdivuji ho, jak dokázal udržet krok a není outsider.
100 lidi je malo? Na jeden produkt, jeden jazyk?
Jen tak pokusne - kolik lidi asi dela na vyhledavani Googlu? Maji asi 10 000 vyvojaru, ale cca 50 produktu, mozna stovku jazyku? Ve finale to nemusi byt zas tak silene vic, nez kolik by se zdalo pri pohledu na vesmirne jinou kvalitu obou sluzeb.
teď jste to trochu domotal, nejprve chcete srovnávat týmy pro vyhledávání, ale pak řeknete, že Google má 50 produktů. To má i Seznam, to není jen vyhledávač, to je i portál, sklik, mapy, novinky atd. a pokud vím, tak v Seznamu pracuje celkově do 1000 lidí, kdežto Google jich má kolem 20tis.
Ano, seznam může mít klidně tým 8 lidí, kteří dělají na fulltextu, zbytek pokryjí ostatní produkty a doprovodné práce.
Další roli hraje i báze potenciálních vývojářů na fulltext, seznam čerpá defacto z ČR/SR, google z celého světa, dokáže tedy vyselektovat schopnější lidi.
Ono stačí seznamácký tým zdvojnásobit a zvednout mu rozpočet a kvalita bude zase někde jinde.
Nikoliv, tech 100 lidi u Seznamu dela prave jenom to vyhledavani, coz je jejich vlastni informace (napr. http://e-svet.e15.cz/internet/vyhledavac-seznamu-roste-a-vyrazne-posiluje-hledani-z-mobilu-1030621).
Ten pocet produktu u Googlu zminuji, protoze zjistit pocet lidi v search teamu je slozitejsi nez u Seznamu. Je ale cca znamy pocet vsech jejich vyvojaru, to je tech 10 000. Samozrejme vyuzivaji efektu uspor z rozsahu, a globalniho poolu lidi/prilezitosti, ale prece jenom, ten rozdil miry zisku na zamestnance a urovne sluzeb je mnohem vetsi.
Už to bylo zmíněno, ale 100 lidí neznamená 100 programátorů. Jsou v tom testeři, produkťáci, analytici atd. A v jiném příspěvku jsem zmiňoval, že také záleží na tom, jakou důležitost vyhledávači přisuzuje management. Pro Google je to společně s adwords/adsense klíčová služba, ale pro Seznam vyhledávač takovou prioritu mít asi nebude.
Vypadá to, že pro Seznam má hodně velkou prioritu právě Sklik. Ostatně tam se během pár desítek milisekund musí kvůli reklamě zpracovat mnohem více dat, než při vyhledávání. Při srovnání Sklik - fulltext se jeví, že Sklik tým umí řešit mnohem složitější věci, lidé z jeho týmu jezdí jako řečníci po zahraničních konferencích (tohoto dojmu vyšší složitosti a priority jsem nabyl z přednášky Tomáše Komendy a soukromého rozhovoru s ním před přednáškou). A v Skliku se vydělávají peníze - několik milionů denně. Takže se domnívám, že jestli fulltext hledá nebo nehledá dobře je vlastně jedno, důležité je prodat v těch výsledcích (nejen, samozřejmě, i v obsahové síti) reklamu. IMHO když už někdo ten Seznam fulltext používá, tak si myslím, že nakonec ani pořádně nepozná, jak moc dobře to hledá. Kdyby chtěl hledat lépe ..., však víme ;-)
Ano, na zjisteni toho, zda na http/s variante je nebo neni totez, je treba vyvinout expertni system, a to pochopitelne potrva nejmene nekolik let.
Pritom problem neni ani zdaleka jen v tom, stranka na tom bude (vyrazne) hure i v pripade, ze pouzije zcela korektni presmerovani z http na https. A na to uz je treba nejmene 100 let vedeckeho badani, protoze to jen tak nekdo nevymysli.
Zrejme to neni tak jednoduche jako "secist dve cisla". Jelikoz jsou stranky navzajem provazane odkazy a pocty odkazu jsou taky soucasti "signalu", tak je potreba prepocitat vsechny signaly. To pak zase vynuti kompletni preuceni radiciho algoritmu. A takovy preuceny algoritmus je nutne radne otestovat, aby se zjistilo, jestli se nenaucil neco spatne (nebo hure nez pred zmenou). Dovedu si zive predstavit, ze je to vcelku narocny ukol.
Druha vec - downrankovani https stranek ve stare verzi neni s velkou pravdepodobnosti "cilem", ale jen "vedlejsim produktem" uciciho algoritmu, ktery zrejme (naprosto spravne!) poznal, ze na https stranky lidi moc nechodi, tak co by jim je cpal, ze...