Budete nám vodit návštěvníky a informovat o našich článcích a budete nám za to platit. Geniální. Ukázal bych jim zdviženej prostředník. Nejsem žádnej programátor, ale nemyslím že by byl problém do každý stránky vložit kus kódu, kterej by tu stránku vyloučil z indexace a vyloučil ji z vyhledávačů. Nešel by do toho ani jeden vydavatel.
Budete nám vodit návštěvníky (...)
Právě, že nebudou a v tom je ten problém: vykradou obsah a sami ho předhodí uživateli.
Nejsem žádnej programátor, ale nemyslím že by byl problém do každý stránky vložit kus kódu, kterej by tu stránku vyloučil z indexace a vyloučil ji z vyhledávačů.
Takové věci samozřejmě existují (robots.txt), ale crawler vyhledávače na to samozřejmě může kašlat (a taky to často dělá).
Profitují oba, jak vyhledávač, tak médium.
Ono by možná stačilo začít respektovat sémantické značky a hlavičky v html. Pokud povolíme vyhledávači použít pouze obsah meta, tak si každý může sám rozhodnout co zpřístupní agregátorům a co bude součást chráněného obsahu. Dokonce můžete udělat A/B testování a zjistit jak se Vám ta návštěvnost změní.
Extrémní případ této regulace by mohl být popis prodávaných knih (je obvykle volně k přečtení na zadní straně obálky). Zejména, pokud by tam vydavatelství v honbě za vyšší návštěvností rovnou napsalo zápletku.
robots.txt je mimo diskuzi, protože noviny nechtějí zmizet z vyhledávání, ví moc dobře, že by je to zničilo. Proto taky v českém zákoně je zákaz odstranění z vyhledávání, pokud se nedohodnou. Což je chucpe, protože to opravdu je "vy nám budete _povinně_ vodit lidi a ještě za to platit".