Co dělat, když hledáte obsah, který již na webu není?

6. 1. 2020 Pro laiky Webové stránky

Říká se, že co se jednou dostane na internet, to už tam zůstane. Z vlastní zkušenosti však vím, že v některých případech je opravdu náročné dohledat obsah, který již někdo předtím smazal. Stává se to především při editaci podstránek, kde občas něco nechtěně smažete, a migraci webu, kde se občas zapomene přemigrovat některá podstránka, či dokument. Ani v tomto případě však není nic ztraceno a i tento obsah lze nalézt. Jen to chce vědět, jaké nástroje použít. Pojďme si nyní ukázat 3, se kterými mám nejlepší zkušenost.
 

Starší verze stránek a zálohování hostingu

Pokud nemigrujete obsah z jednoho webu na druhý, ale pouze děláte úpravy na svém webu, dost často nechtěnou úpravu vrátíte během několika málo kliků. Moderní redakční systémy totiž obvykle zálohují celou historii obnovy stránek. Stačí tedy jen načíst předchozí verzi stránky. Takhle to vypadá třeba v celosvětově nejrozšířenějším redakčním systému WordPress.

Zde klikněte, aby se vám zobrazily veškeré dostupné verze stránky.

Zde klikněte, aby se vám zobrazily veškeré dostupné verze stránky.


 
Zde si můžete vybrat verzi, do které  chcete stránku obnovit.

Zde si můžete vybrat verzi, do které chcete stránku obnovit.


 
U složitějších programátorských úprav obvykle můžete využít zálohy prováděné hostingem. Standardem v dnešní době bývá, že poskytovatel hostingu provádí denní zálohu úložiště a databáze webu, kterou uchovává 2 týdny. Stačí tedy jen obnovit web z patřičné zálohy.
 

web.archive.org – všechny weby od roku 1996

Účinnou pomůckou pro hledání starého obsahu je webový archiv https://web.archive.org. Provozuje ho nezisková organizace Internet Archive, která usilujeo uchování nejrůznějších knih, hudebních nahrávek, filmů a také webů. Webové stránky  tento archiv uchovává již od roku 1996, takže na něm můžeme najít opravdové klenoty.
Například takhle si mohu dohledat, jak vypadal web naší agentury před zhruba deseti lety.

Zde si vyberete časové období, ve kterém chcete web zobrazit.

Zde si vyberete časové období, ve kterém chcete web zobrazit.


 
Ukázka archivovaného webu od Archive.org.

Ukázka archivovaného webu od Archive.org.


Archive.org samozřejmě neindexuje weby celé, ale jen jejich nejdůležitější části. Z vlastní zkušenosti vím, že obvykle není problém dohledat obsah textových stránek, či vložené obrázky. Horší to ale bývá s mediálními soubory, kde jejich archivace téměř neprobíhá.
 

Google Cache

I Google si v rámci indexace webů vytváří jejich záložní kopie. Ty jsou z mé vlastní zkušenosti výrazně obsáhlejší než tomu bývá u Archive.org. Obvykle nebývá problém dohledat ani mediální soubory jako jsou PDF dokumenty (ty však obvykle bývají konvertovány do ryze textové HTML podoby). Háčkem však bývá, že Google u každého dokumentu indexuje jen jeho nejnovější verzi, a to obvykle po dobu několika málo týdnů.

Takhle vypadá stránka načtená přes Google Cache.

Takhle vypadá stránka načtená přes Google Cache.


Problémem Google Cache také bývá jeho nepříliš uživatelská přívětivost. Abyste stránku našli, musíte vhodně položit svůj vyhledávací dotaz a pak zvolit, že chcete zobrazit její archivní verzi, nikoliv verzi aktuální. Naštěstí jsou k dispozici nástroje třetích stran, které vám s prohlížením Google Cache pomohou.

Radim Bílý
Ve Freshi je od roku 2015 a má na starosti obchodní oddělení Freshe. Také jeho zásluhou je navázání spolupráce s klienty jako TM Toys, Hospodářská komora, Corinthia Hotels a mnoha desítkami rodinných společností a start-upů. Na blogu nejčastěji píše o marketingové strategii a e-commerce, které jsou jeho největší hobby.