Vahemälus olevad lehed. Kuidas otsida teavet Google'i veebivahemälust (juhised). Püüab lehefaili otse serverist alla laadida

18.08.2015 09:03

Sõna vahemälu võib IT erinevates valdkondades üsna sageli kuulda, kuid täna tegeleme sellega saidi lehe vahemälu.

Termin ise tähendab, et otsingumootorid salvestavad teatud arvu lehtede koopiaid, tavaliselt alates roboti viimasest saidikülastusest. Lehe koopia (vahemälu) saate oma vajaduste jaoks igal ajal leida ja kasutada.

On üsna hea, et otsingumootorid salvestavad lehti mõneks ajaks oma serveritesse ja annavad meile võimaluse seda ära kasutada. Vahemällu salvestatud lehtede salvestamiseks eraldatakse palju ressursse ja raha, kuid nad maksavad oma abi eest, kuna peame siiski minema nende otsingumootoritesse.

Miks on vaja lehtede vahemälu (koopiaid)?

Veebisaitidega töötamisel tuleb ette erinevaid olukordi.

Nagu alati, on teil palju tööd, kuid vähe aega ja kõige jaoks pole piisavalt tähelepanu. Mõnikord tehakse saidil tööd, oletame, et malli või teksti tehakse kujunduse muudatusi või väiksemaid muudatusi. Ja ühel hetkel saad aru, et tegid kuskil vea ja tekst kadus või kadus osa saidi kujundusest. Noh, seda juhtub ja ilmselt on kõik sellega tegelenud.

Praegu pole teil varukoopiaid ega ka hostimist ja te ei mäleta, kuidas kõik algselt välja nägi. Sel juhul võib abiks olla lehe koopia, mille leiab nii Yandexi kui Google’i vahemälust, vaadata, kuidas see algselt oli ja parandada.

Või teine ​​juhtum, Olete lehe asjakohasuse suurendamiseks veidi muutnud teksti ja soovite näha, kas lehekülge, millel muudatusi tegite, on uuendatud või mitte. Saate seda kontrollida vahemälus oleva lehe abil, otsida seda lehte ja vaadata tulemust.

Samuti on olukord, kus sait pole ühel või teisel põhjusel saadaval ja peate sellele minema. Sel juhul võib abiks olla lehe koopia, mille leiab järgmiselt.

Üldiselt on minu arvates selgeks saanud, et lehe vahemälu kasutamine on vajalik ja kasulik.

Lehe leidmine Google'i ja Yandexi vahemälust.

Kõigepealt vaatame, kuidas Google'i otsingumootoris otsida.

Meetod nr 1. Te lähete otsingumootori lehele ja sisestate selle lehe aadressi, mida soovite leida ja vaadata selle koopiat. Toon näitena meie saidi:

loleknbolek.com

Sisestame otsinguribale lehe või saidi nime, vajutame “Enter” ja näeme otsingutulemusi, kus kuvatakse otsitav leht. Vaatame fragmenti ja sellest paremal on URL (aadress) väikese allanoolega, klõpsake sellel ja näeme üksust "Salvestatud koopia". Klõpsake sellel ja meid suunatakse teatud kuupäevast lehe koopiale.

Meetod nr 2. Meetodit võib nimetada poolautomaatseks, kuna peate kopeerima alloleva aadressi ja asendama saidi domeeni site.ru asemel. Selle tulemusena saate lehe sama koopia.

http://webcache.googleusercontent.com/search?q=cache:site.ru

Meetod number 3. Vahemälu saate vaadata brauseri pistikprogrammide või võrguteenuste abil. Ma kasutan nendel eesmärkidel RDS-riba.

Siin näete, millal robot viimati ressurssi külastas, ja vastavalt sellele on lehe koopia selle kuupäeva jaoks.

Nüüd vaatame, kuidas otsida vahemälu Yandexi otsingumootoris.

Meetod nr 1. Meetod on sama, mis Google'i süsteemi puhul. Me läheme otsingumootori lehele ja sisestame selle lehe aadressi, mida soovite leida ja vaadata koopiat. Toon jälle näitena meie veebisaidi ja panen selle kirja:

url:loleknbolek.com

Sisestame otsinguribale lehe või saidi nime, vajutame “Enter” ja näeme otsingutulemusi, kus kuvatakse otsitav leht. Vaatame fragmenti ja sellest paremal on URL (aadress) väikese allanoolega, klõpsake sellel ja näeme üksust "Salvestatud koopia". Klõpsake sellel ja meid suunatakse teatud kuupäevast lehe koopiale.

Meetod nr 2. Kasutame täiendavaid brauseri pluginaid. Lugege natuke kõrgemalt, kõik on sama, mis Google'is.

Kui leht ei ole otsingumootori registris, siis on suur tõenäosus, et seda pole vahemälus. Kui leht oli varem registris, võib seda selles säilitada.

Kuidas tühjendada vahemälu Yandexis ja Google'is.

Võib osutuda vajalikuks eemaldada leht Yandexi või Google'i vahemälust või isegi peita leht, mis oli varem indekseeritud ja vahemällu salvestatud uudishimulike pilkude eest. Selleks peate ootama, kuni otsingumootor ise selle lehe loomulikult ära viskab.

Saate takistada lehe indekseerimist failis Robots.txt või kasutada märgendit:

Lihtsalt olge märgendiga ettevaatlik, ärge pange seda üldisesse saidimalli, sest see keelab kogu saidi vahemällu salvestamise. Nendel eesmärkidel on kõige parem kasutada täiendavaid pistikprogramme.

Teenused ja nipid, mille abil leiate KÕIK.

Miks seda vaja on: Kas lugesite artiklit hommikul põgusalt ja otsustasite õhtul lähemalt uurida, kuid seda pole veebisaidil? Mitu aastat tagasi külastasite kasulikku saiti, täna jäi see teile meelde, kuid samas domeenis pole midagi alles? Seda on juhtunud igaühega meist. Kuid on väljapääs.

Kõik, mis Internetti läheb, salvestatakse sinna igaveseks. Kui mõni info on vähemalt paariks päevaks internetti üles riputatud, on see suure tõenäosusega saanud kollektiivse mõistuse omandiks. Ja sa saad tema juurde jõuda.

Räägime lihtsatest ja avalikult kättesaadavatest viisidest, kuidas mingil põhjusel kustutatud saite ja lehti leida.

1. Google'i vahemälu, mis jätab kõik meelde

Google salvestab spetsiaalselt kõigi veebilehtede teksti, et inimesed saaksid neid vaadata, kui sait pole saadaval. Lehe versiooni vaatamiseks Google'i vahemälust tippige aadressiribale:

http://webcache.googleusercontent.com/search?q=cache:http://www.site/

Kus http://www.site/ tuleb asendada otsitava saidi aadressiga.

2. Veebiarhiiv, mis sisaldab kogu Interneti ajalugu

6. Archive.is teie enda vahemälu jaoks

Kui teil on vaja mõnda veebilehte salvestada, saate seda teha saidil archive.is ilma registreerimise ja SMS-ideta. Samuti on olemas globaalne otsing kõigi teenuse kasutajate salvestatud lehtede versioonide jaoks.

7. Teiste otsingumootorite vahemälud, kunagi ei tea

Kui Google, Baidu ja Yandex ei suutnud midagi mõistlikku salvestada, aga lehe koopiat on tõesti vaja, siis läheme saidile seacrhenginelist.com, käime läbi otsingumootorid ja loodame parimat (et mõni bot saiti külastaks õigel ajal).

8. Brauseri vahemälu, kui kõik muu ebaõnnestub

Sel viisil ei saa te tervet lehte vaadata, kuid mõne saidi pilte ja skripte salvestatakse teie arvutisse teatud aja jooksul. Neid saab kasutada teabe otsimiseks. Näiteks saate juhistest pärit pildi abil leida sarnase pildi teiselt saidilt. Lühidalt vahemälufailide vaatamise lähenemisviisist erinevates brauserites:

Safari

Failide otsimine kaustast ~/Library/Caches/Safari.

Google Chrome

Tippime aadressiribale chrome://cache

Ooper

Tippime aadressiribale Opera: // vahemälu

Mozilla Firefox

Tippige aadressiribale about:cache ja leidke sellelt vahemälufailidega kataloogi tee.

9. Proovige lehefaili otse serverist alla laadida

Läheme saidile whoishostingthis.com ja uurime selle serveri aadressi, kus sait asub või asus:

Pärast seda avage terminal ja kasutage käsku lokk proovib alla laadida vajalikku lehte:

Mida teha, kui miski ei aita

Kui ükski meetoditest ei andnud tulemusi ja teil on hädasti vaja kustutatud leht üles leida, jääb üle ainult saidi omanikuga ühendust võtta ja temalt väärtuslik teave välja raputada. Esiteks saate saidiga emailhunter.com saidiga seotud kontaktid läbi:

Ja inimeste kohta teabe kogumise kohta lugege artikleid ja.

Isegi Internetist kadunud lehel võib olla koopia salvestatud otsinguteenuse vahemällu.

Kuidas vaadata Google'i vahemälu

Esiteks, kasutades menüüd "Vahemällu":

Lisaks saate kasutada spetsiaalset aadressi:

Http://webcache.googleusercontent.com/search?q= cache:url_pages_without_"http://"

Järgmine päring tagastab StackOverflow.com kodulehe vahemällu salvestatud versiooni:

Http://webcache.googleusercontent.com/search?q= cache:stackoverflow.com

Selle tulemusena saame Google'i konkreetsel kuupäeval tehtud lehelt "hetketõmmise". Järgmine hoiatustekst paigutatakse lehe sisu kohale:

See on Google'i vahemälu aadressil http://stackoverflow.com/. See on 28. aprillil 2016 kell 11:33:38 GMT ilmunud lehe hetktõmmis. Praegune leht oleks võinud vahepeal muutuda.

Kui soovid vaadata lehe tekstiversiooni ehk lehekülge ilma piltideta, flash-animatsioonita jne, siis lisa päringu lõppu &strip=1. Meie näites saame järgmise:

Webcache.googleusercontent.com/search?q= cache:stackoverflow.com& strip = 1

Võite kasutada ka teenuseid cachedview.com või www.cachedpages.com. Üldjuhul pakuvad need lisaks Google’i vahemälu otsingutele ligipääsu ka teistele veebiarhiveerimisteenustele, kuid reeglina töötab usaldusväärselt ainult Google.

Yandexi vahemälu

Yandexis saab lehe vahemällu salvestatud versiooni hankida, kasutades otsingutulemustes menüüd „Salvestatud koopia”.

Veebiarhiiv

Otsinguteenuste vahemäludel on üks ühine piirang: saate vaadata ainult lehe viimast salvestatud versiooni, mitte lehe muudatuste ajalugu. Veebiarhiiv Internet Archive Wayback Machine täidab selle tühimiku. See on vanim veebiarhiiv, mis säilitab saitide koopiaid aastast 1996. See teeb seda teatud ajavahemike järel automaatselt, mis võimaldab teil vaadata lehe muudatuste ajalugu.

Internet Archive Wayback Machine toetab mitut API-d, eriti JSON API-d, mis võimaldab arendajatel luua rakendusi, mis toovad andmeid sellest arhiivist.

Teenused ja nipid, mille abil leiate KÕIK.

Miks seda vaja on: Kas lugesite artiklit hommikul põgusalt ja otsustasite õhtul lähemalt uurida, kuid seda pole veebisaidil? Mitu aastat tagasi külastasite kasulikku saiti, täna jäi see teile meelde, kuid samas domeenis pole midagi alles? Seda on juhtunud igaühega meist. Kuid on väljapääs.

Kõik, mis Internetti läheb, salvestatakse sinna igaveseks. Kui mõni info on vähemalt paariks päevaks internetti üles riputatud, on see suure tõenäosusega saanud kollektiivse mõistuse omandiks. Ja sa saad tema juurde jõuda.

Räägime lihtsatest ja avalikult kättesaadavatest viisidest, kuidas mingil põhjusel kustutatud saite ja lehti leida.

1. Google'i vahemälu, mis jätab kõik meelde

Google salvestab spetsiaalselt kõigi veebilehtede teksti, et inimesed saaksid neid vaadata, kui sait pole saadaval. Lehe versiooni vaatamiseks Google'i vahemälust tippige aadressiribale:

http://webcache.googleusercontent.com/search?q=cache:http://www.iphones.ru/

Kus http://www.iphones.ru/ tuleb asendada otsitava saidi aadressiga.

2. Veebiarhiiv, mis sisaldab kogu Interneti ajalugu

6. Archive.is teie enda vahemälu jaoks

Kui teil on vaja mõnda veebilehte salvestada, saate seda teha saidil archive.is ilma registreerimise ja SMS-ideta. Samuti on olemas globaalne otsing kõigi teenuse kasutajate salvestatud lehtede versioonide jaoks. IPhones.ru-st on isegi mitu salvestatud koopiat.

7. Teiste otsingumootorite vahemälud, kunagi ei tea

Kui Google, Baidu ja Yandex ei suutnud midagi mõistlikku salvestada, aga lehe koopiat on tõesti vaja, siis läheme saidile seacrhenginelist.com, käime läbi otsingumootorid ja loodame parimat (et mõni bot saiti külastaks õigel ajal).

8. Brauseri vahemälu, kui kõik muu ebaõnnestub

Sel viisil ei saa te tervet lehte vaadata, kuid mõne saidi pilte ja skripte salvestatakse teie arvutisse teatud aja jooksul. Neid saab kasutada teabe otsimiseks. Näiteks saate juhistest pärit pildi abil leida sarnase pildi teiselt saidilt. Lühidalt vahemälufailide vaatamise lähenemisviisist erinevates brauserites:

Safari

Failide otsimine kaustast ~/Library/Caches/Safari.

Google Chrome

Tippime aadressiribale chrome://cache

Ooper

Tippime aadressiribale Opera: // vahemälu

Mozilla Firefox

Tippige aadressiribale about:cache ja leidke sellelt vahemälufailidega kataloogi tee.

Mida teha, kui miski ei aita

Kui ükski meetoditest ei andnud tulemusi ja teil on hädasti vaja kustutatud leht üles leida, jääb üle ainult saidi omanikuga ühendust võtta ja temalt väärtuslik teave välja raputada. Alustuseks saate saidiga seotud kontaktide kaudu tutvuda aadressil

Võib-olla blokeeriti sait seaduse rikkumise tõttu või võib-olla see sait lihtsalt ei vasta veel päringule. Olenemata põhjusest, peate mõnikord võtma teavet saidilt, mis just hiljuti lakkas töötamast või millesse häkiti ja mis kaotas kogu sisu. Enamasti võib õnn pöörata näo sinu poole. Kas saate Google'is vaadata selle saidi vahemällu salvestatud versiooni?

Vahemällu salvestatud saidid: mis see on?

Kõigi nende saitide kiireks leidmiseks salvestavad Google ja teised otsingumootorid nende saitide sisemisi koopiaid serveritesse. Neid salvestatud faile nimetatakse vahemäluks ja Google lubab teil neid vaadata, kui selline koopia on olemas. Varem oli see protsess väga selge – tuli lihtsalt klõpsata otsingutulemuse all olevale lingile. Nüüd on asjad veidi keerulisemad, kuid te ei pea muretsema, sest vahemällu salvestatud saidid on endiselt olemas.

Vaatame Google'is saidi vahemälu:

1. Proovige midagi leida. Sel juhul otsime klahvi "vahemällu salvestamine" ja eeldame, et mingil sajandil läks Wikipedia alla.

2. Hõljutage kursorit otsingutulemuse kohal, kuid ärge klõpsake.
3. Tulemuse paremal küljel kuvatakse paremnool. Klõpsake seda noolt.
4. Nüüd näete saidi pisipilti. Pisipildi ülaosas näete ka vahemällu salvestatud linki. Võite klõpsata sellel lingil.

Nii suunatakse teid saidi vahemällu salvestatud versioonile. Ja see versioon ei pruugi sisaldada uusimaid andmeid. See on lihtsalt saidi koopia selles olekus, milles Google'i robot sellel viimati roomas, ja see leht on tegelikult salvestatud Google'i serverisse ja seetõttu saab link alguse saidilt webcache.googleusercontent.com, mitte Wikipedia.org. Google ütleb teile ka, kui värske koopia on.

Mõnikord juhtub, et lehtedel puuduvad pildid või taust. Võite klõpsata lehe ülaosas oleval lingil ja vaadata praegu loetava saidi tekstiversiooni. Mõnikord aitab see teil vajaliku teabe leida. Kui teil on vaja kahte versiooni võrrelda, võite klõpsata ka lingil, mis viib teid praegusele lehele.

Kui teil on vaja leida konkreetne termin, võite kasutada kiirklahvi Ctrl+F ja otsida seda lihtsalt brauseriga.

Vahemällu salvestamata saidid

Enamikul saitidel on vahemällu salvestatud koopiad, kuid on ka erandeid. Saidiomanikud saavad faili robots.txt abil paluda otsingumootoril saiti mitte indekseerida või vahemälu kustutada. Mõnikord juhtub see siis, kui omanik soovib saidi täielikult kustutada ega soovi, et selle sisu kuskil ilmuks. Lõppude lõpuks on üsna palju saite, millel on "musta" sisu või sisu, mida ei pea tingimata indekseerima (privaatfoorumid, krediitkaarditeave või saidid, millel on tasuline juurdepääs sisule).

Saate vaadata, kuidas teie sait on muutunud, kasutades Google'i tööriista nimega WebArchive, kuid faili robots.txt võib selle tööriista funktsioonid ka blokeerida.