Normalizzare i dati

Sto scrivendo una procedura di gestione la cui base dati verrà convertita da una esistente scritta… in un qualche modo.

Molto probabilmente la procedura esistente non è stata scritta da un programmatore (è un banale master/detail in Access creato con i wizard), lo si capisce dal fatto che i dati non sono normalizzati.

Un esempio per tutti. Un campo deve contenere un dato che può assumere quattro valori: generale, locale, locale/generale, blank. Questi sono i valori che mi sono trovato nei campi attuali:

Generale Locale Locale/Generale
GEN LOC G/L
GEN? LO LOC/GE
G LOCPC L/G
GE LOCO GEN/LOC
LO0C
LOCALE
LOC.

Finché il campo ha solamente un valore descrittivo, ogni variante, anche fantasiosa, di una codifica standard potrebbe essere ammessa, in quanto il campo stesso non deve subire nessuna elaborazione.

Il problema si complica quando, a posteriori, vengono richieste elaborazioni, come contare i record che hanno come valore uno di quei tre gruppi. Se l’input non viene controllato e i dati non sono normalizzati, nell’archivio non avrò delle informazioni, ma solamente un’accozzaglia di valori mal gestiti.

Autore: Luigi Rosa

Consulente IT, sviluppatore, SysAdmin, cazzaro, e, ovviamente, geek.

9 pensieri riguardo “Normalizzare i dati”

  1. Burp?
    hai scritto “Un esempio per rutti.” … ROTFL!
    (pero’, a mio avviso, ci hai pienamente azzeccato! Chi ha scritto la procedura di Data Entry mi sa avesse digerito male lui, visto che fa digerire qualsiasi dato alla table!)

    Ciauz!
    Zappa

    1. Si’, almeno qui c’e’ l’attenuante che l’utente non-informatico all’inizio si e’ arrabattato e poi ha chiesto aiuto quando si e’ reso conto che la cosa gli stava esplodendo in mano.

      1. Si’, davvero… almeno qui chi ha iniziato la cosa non lo fa di mestiere… anzi, ha avuto il buon senso di chiedere aiuto prima che fosse troppo tardi.
        Importare i dati preesistenti nella nuova struttura può essere pesante, ma se le cose fossero andate troppo avanti sarebbe stato un incubo.
        Conosco bene questa situazione – ahimè.
        A.

  2. Comunque di recente il ministero del lavoro ha fatto delle modifiche su alcuni dei loro “elenchi categorizzati” e hanno inviato una nuova versione, aggiungendo un livello… peccato che la “traduzione” dal vecchio formato al nuovo non può essere fatta in automatico ma a manina.
    Fortuna che qui da noi qualcuno ha scritto un’applicazioncina intelligente che aiuta.

    K.

  3. Qualcosa del genere la vedo tutto giorni quando visito il sito del mio fornitore (CDC Point, quindi nemmeno uno “piccolino”)…

    Se voglio cercare della RAM “DDR3” devo cercare
    – DDR3
    – DDR 3
    – DDR III
    – DDRIII

    Stessa cosa per per la capacità di RAM o Dischi Rigidi, es:
    – 500GB
    – 500 GB
    – 500 Gb
    – 500gb

    Spesso faccio prima a cercare nell’intera categoria piuttosto che usare dei filtri :-\

Spazio per un commento