Il rapporto tra data mining e piccole-medie imprese è un tema che diventerà sempre più importante in un prossimo futuro. Internet e i database aziendali contengono un’enorme massa di dati (“big data”) di notevole valore ma che è impossibile gestire a livello umano. Occorrono perciò delle tecniche per automatizzare il più possibile il trattamento dei dati, basate su tecnologie di intelligenza artificiale come il “machine learning”, che dà al software la capacità di prendere decisioni. Queste tecnologie sono in grado di estrarre informazioni utili dai “big data”, e la scienza informatica che si occupa di questo è il “data mining”.
Il “data mining” estrae “conoscenza” dai dati ricavando da questi dei modelli” (“pattern”), ossia degli andamenti regolari che sono espressione di comportamenti e situazioni reali spesso difficili da individuare. Alla fine del processo, ci si trova con un complesso di informazioni utili comprensibili e trattabili a livello umano.
Oggi infatti ci si trova ad operare in ambienti economici e sociali sempre più complessi, ed è impossibile tener conto di tutte le variabili senza ricorrere al data mining, basando il “decision making” su scelte “guidate dai dati” e non “guidate dall’intuito”.
Ambiti di applicazione del data mining sono:
Senza entrare troppo in dettagli specialistici, alcune delle tecniche principali di data mining sono:
Si nota facilmente come siano tutte cose fondamentali per i processi aziendali, non solo per le grandi realtà. Per questo si sta pensando a come mettere in contatto data mining e piccole-medie imprese.
Si può pensare, ed in parte è ancora vero, che il data mining sia una tecnologia adatta soprattutto ad aziende medio-grandi capaci di grandi investimenti. Ma è anche vero che in prospettiva questa tecnologia sarà sempre più diffusa e sempre meno costosa man mano che le basi di dati diventeranno sempre più consistenti e si diffonderà l’intelligenza artificiale, indispensabile per trattare le grandi masse di dati contenute nei particolari database necessari al data mining, i cosiddetti “data warehouse”. Già esistono librerie di “machine learning” (apprendimento automatico) dedicate al data mining (anche open-source, come “Weka”) disponibili per progetti non eccessivamente costosi. Il rapporto tra data mining e piccole-medie imprese è destinato così ad approfondirsi.
Infatti, in un ambiente economico sempre più complesso e competitivo, nessuna azienda potrà più permettersi di non avere una chiara “situation awareness” (consapevolezza della situazione) del suo mercato. Anche le piccole-medie imprese avranno necessità di una “business intelligence” e quindi di soluzioni informatiche per il “data mining”.
Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, An Introduction to Information Retrieval, draft 2009, https://nlp.stanford.edu/IR-book/pdf/irbookonlinereading.pdf
http://cabibbo.inf.uniroma3.it/dw/pdf/020_intro_dm.pdf
http://www.dis.uniroma1.it/~bruni/files/bruni04dm.pdf
http://bias.csr.unibo.it/golfarelli//DataMining/MaterialeDidattico/DMISI-Introduzione.pdf
https://www.cs.waikato.ac.nz/ml/weka/
https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining
http://www.di.uniba.it/~malerba/publications/datalight.pdf