Jaké TB smetí? Když někdo smaže fotku a ta se smaže z databáze, tak se pochopitelně nenahradí prázdným bílým jpeg souborem, prostě se z DB vymaže a odkazy na ni přestanou být platné. Pouhé výmluvy, nic jiného. Pravdu má DD, že fotografie jsou velmi cenné zboží, zejména pokud je možné je používat pro identifikaci osob na nich zachycených.
Jak pro koho. Pro vás jako uživatele možná ano, ale podívejte se na to z pohledu majitele té databáze. Jednoho dne by mohl zjistit, že terabyty dat, které pracně a draze udržuje, zálohuje a sdílí jsou v podstatě smetí. A kdo by stál o to provozovat velmi drahé smetiště plné dat, která se nedají nijak využít, jen zabírají diskový prostor a výpočetní kapacitu?
To není dobré řešení. Pro uživatele ano - ze začátku. Jeho obrázek už není vidět. Ale brzy by tak na facebooku byla spousta prázdných fotek, a majitelé FB by s hrůzou zjistili, že jejich databáze je plná slepých uliček vedoucích na bílou plochu... Facebook je typický přiklad toho, jak provázanost a komplexnost a pestrost služeb může přerůst vývojářům přes hlavu.
Podle mě bude největší problém v provázanosti jednotlivých objektů - každý profil, fotka, příspěvek... Všechno ukazuje na všechno, odkazy jsou propleteny mezi sebou, a vymazat ze systému jen jednu věc by mohlo rozbít celou databázi. Facebook tak dojíždí na svoji komplexnost a provázanost. Pouhým smazáním fotky bez odstranění veškerých vazeb by mohli vyvolat chybu, která by ohrozila celý Facebook. Viděli jste někdy jak někdo praštil do skla a praskliny se šířily všemi směry jako pavučina? Tohle je stejné. Musí se to udělat opatrně, odstranit nejen fotku, ale i všechny odkazy na ni, popisky a "like" odkazy.
Náhodou jsem loni zjistil, že nemaže i Youtube. Po natažení videa jsem po kontrole za několik dnů zjistil, že je nějaký špatný zvuk. Celý záznam jsem vymazal. Stejné video jsem do Youtube nahrál pod novým výstižnějším označením. K mému překvapení za asi měsíc, kdy jsem ho pro známé dohledával, byly na Youtube vyhledány oba záznamy. Nahlédnul jsem na svůj účet, tam však byl jen novější.
Napriklad taky Google tie fotografie (ale ani emaily, ani nic ine) pravdepodobne ani nikdy nezmaze. Maju vlastny Google File System a ten je stavany na rychle pridavanie novych dat a ich citanie. S mazanim je ale velky problem a deje sa dost komplikovane a prakticky skoro vobec. Preto sa data tiez len oznacia za "vhodne na zmazanie" a ponechaju sa napospas osudu.
Cize ak Facebook deklaruje, ze fotky naozaj zmaze, tak robi nieco, co take G+ vobec nerobi a pravdepodobne ani robit nebude.
No jo, jenže tak velké systémy se nezálohují prostým kopírováním dat. Dělají se inkrementální zálohy, kde jsou zaznamenané operace s daty, a z nich něco smazat nejde, protože se naruší jejich konzistence a jsou pak nepoužitelné. Takže k opravdovému smazání může dojí jen když se dělá dump celého systému, a to klidně může být i jednou do roka.
Navíc ta data můžou hnít v různých keších a proxynách na cestě k příjemci, a to už je zcela mimo dosah původního vlastníka dat.
Další problém bude, že systémy typu Facebook budou optimalizované na rychlost čtení a zápisu, a z toho něco vymazat může znamenat přeindexování celé databáze, což je operace kterou nejde dělat každý den.
To porad nic nemeni na tom, ze smazani souboru je radove rychlejsi operace. Kdyz nekam neco replikuju, musim zapisovat hromadu dat. Smazani souboru = zapis maximalne nekolika desitek bytu.
Nehlede na to, ze v pripade podobnych webu, se prevazne obrazky nahravaji do databaze => jejich smaznuti, vcetne replikace, je otazka maximalne minut.
Tak už jen proto, že fotografie není na jediném místě, ale rozhozená v nějaké distribuční síti, není možné smazat ji ihned. Ta fotografie je nejspíš fyzicky umístěná na mnoha místech a než se informace o smazání prošíří, chvíli to trvá. Zálohujete? A jak rychle dovedete odstranit soubor ze všech záloh, co máte?
Jak je to možné, že to nelze technicky zajistit, aby se fotka okamžitě po kliknutí na odkaz smazala??? Jediné co mě napadá, je to, že by to při milionech příkazů za minutu mohlo zkolabovat, ale to je kravina, protože každou chvíli tam přece někdo nahrává fotky a dokonce i videa, tak mi neříkejte, že to je technicky nemožné, kord pro takovej gigant jako je Facebook. Nebo je chyba někde jinde?