Vlákno názorů k článku Petra Mikesková (ChciPráci.cz): Stížnosti nechápu, fungujeme podobně jako Google od Michal Lupečka - Nevím, jestli fungují jako google, ale moc bych...

Článek je starý, nové názory již nelze přidávat.

8. 1. 2016 11:26

Michal Lupečka

Nevím, jestli fungují jako google, ale moc bych tomu nevěřil. On totiž Google má od začátku zásadní a důležitou funkci omezení indexace. Každý web si může pomocí robots.txt (případně meta tagů v hlavčce stránky) nastavit který konkrétní obsah se má indexovat (ve výchozím stavu veškerý) a který ne. Takže pokud bych třeba provozoval pracovní portál a nechtěl bych, aby si google moje výsledky prezentoval ve svých výsledcích hledání můžu to snadno a rychle dosáhnout. Proto nikdo nemůže říct, že ho google vykrádá, pokud o to nestojí nemusí na googlu být vůbec.

No a jde takovýto nesouhlas se zařazením vyjádřit i v tomto případě ? To je podle mě ten rozdíl mezi vykrádáním a odkazováním s citacemi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 12:31

Danny (neregistrovaný)

I z Google vypadnou konkretni nabidky zverejnene treba na jobs.cz. A z URL + robots.txt je zrejme, ze indexovani te konkretni nabidky omezeno prokazatelne nebylo. Takze bud na jobs.cz chteli, aby to indexovane bylo, nebo pani programatori/administratori nekde udelali chybu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 12:50

Tomáš2 (neregistrovaný)

přece nemůžeš dávat rovnítko mezí "chtít" a "aktivně nezabránit", roboty jedou opt-out. Jestli něco neudělám, neznamená to, že nejsem proti :)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 12:58

Michal Lupečka

Tady bych si troufl tvrdit, že určitě chtěli, aby to indexované bylo. Nevím přesně kolik návštěvníků jim přes google chodí, ale standardně i na takové větší weby chodí většina návštěvníků přes google.

Pokud odříznou google, odříznou velkou část návštěvníků a potencionálních zájemců o práci (třeba i nadpoloviční), v tomto směru jim google pomáhá. Kdyby jim nepomáhal, tak ho můžou kdykoliv odříznout. Jenže můžou odříznout i chcipraci.cz ?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 13:29

Tomáš2 (neregistrovaný)

nenašel jsem na chcipraci informaci o tom, jak se představuje jejich crawler a jak je možné mu přístup zakázat.

Když začínali, neměl jejich crawler označení jako bot a tvářil se jako firefox. To ale odhaduji podle metada které k nimi vedly.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 13:59

Danny (neregistrovaný)

Tak samozrejme pomoci robots.txt jde rict i to, kdo indexovat muze a kdo nikoliv (tedy i to, ze Google se neodrizne), pripadne jsou i dalsi techniky, jak onu cinnost zneprijemnit...

Vykriky typu "jejka, on nas nekdo novy zindexoval a my to nechteli" pusobi spise usmevne... kdyz tam maji jednoduchou wildard politku :-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 15:18

Tomáš2 (neregistrovaný)

to sice lze udělat, ale chcipraci.cz nemají nikde na dohledatelném místě informaci o tom, jak se jejich robot představuje a tím trochu zabíjí možnost je slušně přes robots.txt odříznout.

Poslal jsem jim dneska odpoledne dotaz, uvidíme co odpoví :).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 15:41

Danny (neregistrovaný)

Takovych se najde... treba betaBot robots.txt ignoruje zcela ;-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
11. 1. 2016 10:43

dino

robots.txt není zeď, ale žádost. A že jí zrovna crawler této služby vyhoví, na to bych si nevsadil.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 1. 2016 14:56

Tomas3 (neregistrovaný)

Robots.txt neni zadny standard a navic je urcen (primarne) k tomu, aby crawler nespadl do pasti, tj. nekonecne a zbytecne smycky, napr. pri prochazeni kalendare az pred narozeni Krista.

Zabranit prochazeni weboveho serveru je netrivialni uloha, zvlaste pokud proti vam stoji profesionalni nastroj schopny simulovat cele mesto virtualnich lidicek. Jinak podobne ne-uplne-koser systemy pouzivaji take "solidni" firmy, aby overily, ze jejich crawlerum nepodvrhujete jiny obsah nez pak davate lidem.

Aktuality

Policiie vyšetřuje kyberkriminalitu, podklady sbírala i v rozhlase. V případu zadržela dvě osoby

V Česku se i díky 3D tisku rozjela výroba ovladačů pro letecké simulátory

Čip z Česka se začal masově vyrábět. Tropic Square jako první na světě nemá tajnosti

Vlákno názorů k článku Petra Mikesková (ChciPráci.cz): Stížnosti nechápu, fungujeme podobně jako Google od Michal Lupečka - Nevím, jestli fungují jako google, ale moc bych...

Aktuality

Policiie vyšetřuje kyberkriminalitu, podklady sbírala i v rozhlase. V případu zadržela dvě osoby

V Česku se i díky 3D tisku rozjela výroba ovladačů pro letecké simulátory

Čip z Česka se začal masově vyrábět. Tropic Square jako první na světě nemá tajnosti

Dále u nás najdete

Průměrná mzda se utrhla ze řetězu. Vzroste i ta minimální