Marco Russo

.NET, Business Intelligence e dintorni

Corsi

Miei blog in inglese

Google Desktop: prime impressioni

Questa notte Google Desktop ha indicizzato il mio hard disk. In realtà non ha finito, manca un po' di diagnostica su quello che fa durante le operazioni di scansione: per capirci, non so bene dove sia arrivato e quanti file e messaggi debba ancora indicizzare. Partiamo quindi dalle note negative:

  • Va installato come utente admin (anche se poi si può riportare l'utente a non-admin, quindi si eleva il privilegio del proprio utente per fare il setup e poi si torna indietro... perché il vostro utente non è admin, vero?)
  • Non fornisce informazioni su ciò che sta facendo e che deve ancora fare: la pagina Status dice solo quanti documenti ha indicizzato
  • Non indicizza i PDF (in assoluto questa è forse la carenza più grande)
  • Cercando sul proprio Hard Disk i doppioni sono tantissimi: spesso ci sono mail e documenti che contengono molte informazioni pressoché identiche. Un raggruppamento "logico" di queste informazioni sarebbe auspicabile.
  • Non si può specificare di effettuare una ricerca solo all'interno di alcune cartelle del proprio Hard Disk: il parametro site consente di specificare un sito ma non funziona per le directory locali.
  • Non indicizza file XML. In pratica, non indicizza i feed dei blog gestiti da SharpReader.

Adesso però veniamo alle note positive.

  • La velocità è sbalorditiva. Sbalorditiva.
  • I risultati di una ricerca sono organizzati molto bene.
  • Le mail indicizzate sono visualizzate prima in formato testo/HTML all'interno del browser e solo in un secondo tempo si può aprire Outlook. Velocissimo e comodissimo.
  • Non occupa tanta RAM. Di tutte, forse questa è la cosa più importante per tenerlo "ospite" senza preoccuparsi troppo.

Altre considerazioni:

  • Al momento gli indici creati sul mio disco occupano 650Mb e ho un disco da 40Gb (è un notebook). Credo che aumenterà ancora perché l'indicizzazione non è ancora finita.... comunque 1Gb è un volume accettabile per avere certe prestazioni, secondo me.
  • Spiando con File Monitor il comportamento del motore di ricerca si può osservare come non sia stato usato il file mapping per adottare una strategia basata sull'accesso ai file tradizionale. Ci sono innumerevoli letture di piccoli blocchi da 4 byte, poi da 200/500 e poi da 4096 byte. Traduzione per i non addetti ai lavori: potrebbe essere molto più veloce se usasse tecniche di file mapping, ma evidentemente non ne ha nemmeno bisogno!
  • Questo coso potrebbe cambiare il modo in cui usiamo il computer. Chi se ne importa di ricordarsi dove abbiamo salvato un file: tanto poi c'è Google.
  • Privacy: se avete qualcosa da nascondere sul vostro PC... toglietelo! In realtà si può configurare l'esclusione di alcune directory e di alcuni file dall'indicizzazione, però non si può fare altrettanto per le mail: tramite Outlook indicizza tutti i PST aperti.
  • Security: mi sembra di aver capito che non consenta a un'applicazione qualsiasi di connettersi e fare le ricerche (anche se la cosa andrà approfondita meglio). Se però un'applicazione riuscisse a connettersi con il motore locale (che apre la porta 4664 in HTTP) e a fare le query... sicuramente avrete un file dove memorizzate le password, vero? Il mio (con i codici dell'home banking) l'ho trovato praticamente subito. L'encryption NTFS non serve perché Google Desktop gira con lo stesso utente. Bisogna usare un sistema per fare encryption del file con altri sistemi, oppure ricordarsi di escludere la directory da ciò ch Google Desktop indicizza. Avere Google Desktop sul proprio PC significa che lasciare il PC non presidiato per 30 secondi è pericolosissimo, ancora di più di quanto non lo fosse senza questo magnifico gioiello di tecnologia.

Come tutte le cose, ci sono dei pro e dei contro. Considerando che è la prima versione e che è una beta, c'è comunque da essere ottimisti. Questa è vera innovazione nel modo in cui si usa il PC. ora che Google ha fatto la prima mossa, bisogna vedere la risposta di Microsoft. Che non potrà arrivare nel 2006, due anni di vantaggio sarebbero veramente troppi.

Comments

TrackBack said:

# ottobre 15, 2004 2.27

TrackBack said:

# ottobre 18, 2004 9.33