web archiveBuongiorno a tutti, oggi non parliamo strettamente di SEO e Motori di Ricerca ma di qualcosa che è direttamente connesso ai processi e in generale a questo mondo. Parliamo di uno strumento caro a molti: Wayback Machine dai più conosciuto anche come Web Archive: la macchina del tempo dei siti Web.

Lo scorso 21 Ottobre, dal blog ufficiale il team ha annunciato che Wayback sarà presto aggiornato e questo, grazie ad un fondo concesso in beneficenza. Il servizio che analizza lo storico dei siti Web e che rappresenta la Delorean di ogni Webmaster, viene spesso utilizzato per analizzare lo storico di un sito Web. Ad esempio a livello SEO, è notevolmente utile ad analizzare la “bontà” di un sito in fase di link building strategy. Gli investitori del Web, lo utilizzano invece ad esempio per scovare lo storico di un dominio scaduto prima di acquistarlo. Insomma le modalità per sfruttare la sua unica ed ampia memoria storica sono le più disparate, sappiate solo che nel suo database ad oggi sono presenti oltre 439 miliardi di pagine Web catturate e pronte alla consultazione.

Ricerca per parole chiave

La novità più interessante segnalata all’interno del comunicato ufficiale è che il prossimo Web Archive sarà potenziato lato motore di ricerca. Come sappiamo ad oggi è possibile effettuare ricerche esclusivamente partendo da un URL.  Prossimamente verranno implementate nuove funzioni in questo senso e, gli utenti, potranno iniziare il viaggio nello storico di un sito partendo da una parola chiave di riferimento.

internet archive

Verrà inoltre pianificato un aggiornamento degli spider che attualmente circumnavigano il Web giorno dopo giorno per incastonare le pagine passate nella “pietra”; questi, saranno presto molto più efficienti ed in grado di scendere sempre più in profondità nei meandri di ogni sito monitorato, indicizzando oltre ad HTML, immagini e CSS anche i contenuti multimediali di ultima generazione (cosa che attualmente non è disponibile).

Cosa migliorerà in Wayback Machine prossimamente

Di seguito una lista dei principali interventi sui quali il team è già a lavoro:

  • Riscrittura del codice: il nuovo Web Archive sarà più performante del precedente ed in grado di analizzare con profondità ogni sito – sempre che l’architettura dei link interni dei siti stessi lo permetta 😉
  • Ottimizzazione della qualità delle pagine: wayback 2.0 sarà più veloce anche nel renderizzare le pagine salvate in archivio e sarà in grado di presentarle con un rendering più completo di quello attuale.
  • Aggiornamento dell’interfaccia utente: sarà più facile per gli utenti riuscire a navigare “nel tempo”.
  • Siti Web e contenuti multimediali: come detto sopra, il nuovo servizio sarà in grado di mostrare anche i contenuti multimendiali presentati nelle pagine storiche archiviate.
  • Utilizzo delle parole chiave: sarà possibile andare a ritroso nel tempo partendo da una parola chiave di riferimento. Questo presuppone la riscrittura dell’intero software che ad oggi archivia ogni singolo file HTML.

A sostenere questo progetto con un fondo dedicato è stata la LJAF – Laura e John Arnold Foundation.

Ecco il comunicato ufficiale.

Buone cose.