Over 10 years we help companies reach their financial and branding goals. Engitech is a values-driven technology agency dedicated.

Gallery

Contacts

411 University St, Seattle, USA

engitech@oceanthemes.net

+1 -800-456-478-23

Artificial Intelligence Development Technology

Data mining

Il data mining e l'estrazione dei file

Per data mining si intende l’individuazione di informazioni ottenute grazie all’estrapolazione mirata da grandi banche dati.
Ciò avviene mediante meccanismi automatizzati, specifici software e algoritmi adatti al singolo scopo. Ad oggi, si utilizzano reti neurali, alberi decisionali, clustering e analisi delle associazioni.
Le finalità del data mining sono applicabili a tutti i campi di analisi, dall’economico allo scientifico, dall’operativo al finanziario.

Knowledge Discovery in Database (KDD)

Tramite il data mining si possono scovare associazioni, anomalie e schemi ricorrenti (pattern) ed informazioni all’interno degli stessi. Quindi, partendo da informazioni posizionate nel database si arriva ad una conoscenza dei dati che può avere varie funzioni.

L’intero processo di ricerca del dato è chiamato Knowledge Discovery in Database (KDD). Il KDD è un processo che unifica operazioni automatiche, decisioni e deduzioni umane per estrarre informazioni. I modelli infatti sono individuati in automatico, ma in particolare le fasi iniziali e finali del processo richiedono figure esperte del dominio applicativo, di analisi dati e di informatica.

I processi fondamentali del KDD sono:

  • Individuazione e selezione dei dati (data selection), definisce l’ambito di raccolta dei dati, obiettivi della ricerca, il tipo di conoscenza da acquisire, i problemi da affrontare, il tipo di dati utili e le fonti;
  • Pre-elaborazione dei dati (data processing), selezione dei dati utili, organizzazione preparatoria dei dati da analizzare, relativa individuazione delle strategie per gestire i dati mancanti e quelli che variano nel tempo;
  • Trasformazione dei dati (data transformation): i dati sono selezionati, unificati e convertiti in formati adatti all’analisi relativa;
  • Data mining, il passaggio più importante perché sceglie il software migliore in grado di scindere il data warehouse per fornire la risposta attesa. Si compone di più sottopassaggi, anche ripetuti, per perfezionare la procedura e verificare progressivamente i risultati raggiunti;
  • Interpretazione dei risultati (evaluation), valuta se l’obiettivo è stato raggiunto.

Le fasi del Data mining

Lo stesso Data mining, essendo una delle fasi del KDD, si scinde in diversi processi che mirano ad individuare le associazioni nascoste tra i dati estratti:

  • classificazione, individuazione delle classi e dell’insieme degli elementi;
  • clusterizzazione (o segmentazione), identificazione di gruppi di elementi omogenei;
  • associazione, scoperta di nessi casuali ma ricorrenti estrapolati dai dati inseriti in una banca dati;
  • regressione, fase simile alla classificazione, ma qui le variabili possono assumere un numero elevato o infinito di valori;
  • time series (o serie storiche),regressioni che inglobano variabili temporali;
  • sequence discovery (scoperta di sequenze): riprende l’associazione ma applicando il fattore di correlazione sequenziale.
Grafico delle fasi del data mining

I settori in cui opera il data mining

Il data mining permette quindi di scoprire schemi e relazioni nascosti nei dati che possono essere utilizzati per fare previsioni in merito ai processi aziendali.

I suoi vantaggi variano in base all’obiettivo e al settore. Infatti il data mining è applicabile a tutti i settori dal tecnologico allo scientifico, da quello educativo a quello finanziario.

Il campo tecnologico e delle telecomunicazioni

Com’è facilmente intuibile in questo settore il data mining è fondamentale. Una delle principali funzioni è quella che permette di garantire la sicurezza, in modo veloce e consono. Inoltre rende possibile l’individuazione di possibili malware, oppure bisognosi di aggiornamento.

Il settore scientifico

Soprattutto nei settori medici il data mining è uno degli strumenti fondamentali per il decision making. Infatti è spesso dall’analisi e l’estrazione dei dati da esso effettuata che vengono influenzate le decisioni finali. Fra i vari esempi possiamo menzionare la scelta delle terapie, la selezione delle protesi chirurgiche idonee, etc;

Il reparto educativo

Nel percorso di digitalizzazione scolastico il data mining è stato – ed è tutt’oggi – fondamentale ai fine della creazione e della consultazione del registro elettronico. Permette inoltre di analizzare i dati in esso contenuti, al fine di segnalare anticipatamente situazioni problematiche. Può quindi essere utilizzato per aiutare gli insegnanti ad accedere ai dati degli studenti, a prevederne i livelli di rendimento e ad individuarne l’andamento accademico.

L’ambito finanziario

In ambito finanziario il data mining è fortemente utilizzato per combattere la frode, ma anche per procedere con l’analisi dei rischi di mercato e la valutazione delle basi clienti bancari.

I rischi per la privacy

Sulla base di quanto appena detto si può evincere come il data mining possa avere anche effetti negativi. Questa procedura, infatti, utilizza i dati personali dell’individuo senza il suo consenso, anzi addirittura ignaro. Nonostante ciò è praticamente impossibile sottrarsi a questa procedura perché anche i nostri atteggiamenti passivi sul web sono rivelatori di informazioni sul nostro conto e soggetti ad archiviazione nelle banche dati.

Author

Lara Mastrofini