martedì 15 novembre 2005 19.10 DevLeap

Track 2 - Normalizzazione indirizzi con Fuzzy Lookup

Una delle trasformazioni di SSIS (SQL Server Integration Services) che analizzeremo in uno scenario reale è la Fuzzy Lookup. Grazie ad algoritmi statistici, questo tipo di trasformazione effettua un'operazione di ricerca di chiavi identiche o semplicemente "somiglianti" ad altri valori noti. L'esempio di utilizzo è quello della normalizzazione dei nomi delle località presenti in un database (classiche anagrafiche clienti/fornitori): come si potrà vedere, il Fuzzy Lookup è uno strumento che aiuta moltissimo, anche se va utilizzato in maniera corretta e guidata, senza pretendere che possa assolvere al 100% del lavoro senza commettere errori. I numeri che vedremo dovrebbero confortarci nel pensare di poter utilizzare questa tecnica in produzione, con opportuni accorgimenti che consentano di intervenire tempestivamente nei casi in cui l'algoritmo da solo non riesca a farcela.

Comments

No Comments