Co dělat, když hledáte obsah, který již na webu není?
Říká se, že co se jednou dostane na internet, to už tam zůstane. Z vlastní zkušenosti však vím, že v některých případech je opravdu náročné dohledat obsah, který již někdo předtím smazal. Stává se to především při editaci podstránek, kde občas něco nechtěně smažete, a migraci webu, kde se občas zapomene přemigrovat některá podstránka, či dokument. Ani v tomto případě však není nic ztraceno a i tento obsah lze nalézt. Jen to chce vědět, jaké nástroje použít. Pojďme si nyní ukázat 3, se kterými mám nejlepší zkušenost.
Starší verze stránek a zálohování hostingu
Pokud nemigrujete obsah z jednoho webu na druhý, ale pouze děláte úpravy na svém webu, dost často nechtěnou úpravu vrátíte během několika málo kliků. Moderní redakční systémy totiž obvykle zálohují celou historii obnovy stránek. Stačí tedy jen načíst předchozí verzi stránky. Takhle to vypadá třeba v celosvětově nejrozšířenějším redakčním systému WordPress.
U složitějších programátorských úprav obvykle můžete využít zálohy prováděné hostingem. Standardem v dnešní době bývá, že poskytovatel hostingu provádí denní zálohu úložiště a databáze webu, kterou uchovává 2 týdny. Stačí tedy jen obnovit web z patřičné zálohy.
web.archive.org – všechny weby od roku 1996
Účinnou pomůckou pro hledání starého obsahu je webový archiv https://web.archive.org. Provozuje ho nezisková organizace Internet Archive, která usilujeo uchování nejrůznějších knih, hudebních nahrávek, filmů a také webů. Webové stránky tento archiv uchovává již od roku 1996, takže na něm můžeme najít opravdové klenoty.
Například takhle si mohu dohledat, jak vypadal web naší agentury před zhruba deseti lety.
Archive.org samozřejmě neindexuje weby celé, ale jen jejich nejdůležitější části. Z vlastní zkušenosti vím, že obvykle není problém dohledat obsah textových stránek, či vložené obrázky. Horší to ale bývá s mediálními soubory, kde jejich archivace téměř neprobíhá.
Google Cache
I Google si v rámci indexace webů vytváří jejich záložní kopie. Ty jsou z mé vlastní zkušenosti výrazně obsáhlejší než tomu bývá u Archive.org. Obvykle nebývá problém dohledat ani mediální soubory jako jsou PDF dokumenty (ty však obvykle bývají konvertovány do ryze textové HTML podoby). Háčkem však bývá, že Google u každého dokumentu indexuje jen jeho nejnovější verzi, a to obvykle po dobu několika málo týdnů.
Problémem Google Cache také bývá jeho nepříliš uživatelská přívětivost. Abyste stránku našli, musíte vhodně položit svůj vyhledávací dotaz a pak zvolit, že chcete zobrazit její archivní verzi, nikoliv verzi aktuální. Naštěstí jsou k dispozici nástroje třetích stran, které vám s prohlížením Google Cache pomohou.
Radim Bílý
-
14. 5. 2018Řešíte komunikaci na Facebooku, Instagramu, YouTube a další kanálech? Protože...
-
22. 6. 2017
4 bezpečnostní hrozby pro váš web a jak jim vzdorovat
Náš život se přesouvá do internetového světa a s ním i... -
11. 4. 2017
Jak přirozeně shánět fanoušky na váš Facebook?
Před nedávnem nám dorazil do firmy tento e-mail: „Pěkný den,...