Indice

Tecniche di Data Mining a.a. 2006-2007

Docenti:

News

Obiettivi del corso

La grande disponibilità di dati provenienti da database relazionali, dal web o da altre sorgenti motiva lo studio di tecniche di analisi dei dati che permettano una migliore comprensione ed un più facile utilizzo dei risultati nei processi decisionali. L'obiettivo del corso è quello di fornire un'introduzione ai concetti di base del processo di estrazione di conoscenza, alle principali tecniche di data mining ed ai relativi algoritmi, concentrandosi su quelli più diffusi e consolidati, ma discutendo anche gli aspetti avanzati ed ancora al limite fra tecnologia metura e ricerca. Si discutono esempi di uso delle tecniche di data mining in contesti applicativi realistici, quali la market basket analysis ed il rilevamento di frodi. Il corso si conclude con cenni sugli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza. Il corso consiste delle seguenti parti:

  1. i concetti di base del processo di estrazione della conoscenza;
  2. le principali tecniche di datamining (regole associative, classificazione e clustering). Di queste tecniche si studieranno gli aspetti formali e implementativi, sia nelle versioni standard che avanzate;
  3. alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici.
  4. cenni sugli aspetti di privacy ed etici e delle tecnologie di analisi privacy-preserving.

Orario

Libro di Testo

• Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Pearson - Addison Wesley, ISBN 0-321-32136-7, 2006

Riferimenti bibliografici

Calendario delle lezioni

Giorno/ora Aula Argomento Materiale didattico Docente
1. Lunedì, Febbraio 19, 14-16 A1 Presentazione del corso lucidi Pedreschi
2. Giovedì, Febbraio 22, 16-18 A Cosa è il Data Mining, Motivazioni, Classi di applicazioni, I principali metodi di datamining Pedreschi
3. Lunedì, Febbraio 26, 16-18 A1 Il processo di estrazione della conoscenza, esempi: previsione di frodi fiscali, analisi competitiva, etc. lucidi Bonchi
4. Giovedì, Marzo 1, 16-18 A I dati: i tipi di dato, la qualità dei dati, la preparazione dei dati lucidi Pedreschi
5. Lunedì, Marzo 5, 14-16 A1 Misure di similarità e dissimilarità lucidi Pedreschi
6. Giovedì, Marzo 8, 16-18 A Esplorazione dei dati: dalla statistica descrittiva alla visualizzazione lucidiPedreschi
7. Lunedì, Marzo 12, 14-16 A1 Clustering - Algoritmo k-means lucidi Pedreschi
8. Giovedì, Marzo 15, 16-18 A Clustering: Esercitazione Pedreschi
9. Lunedì, Marzo 19, 14-16 A1 Clustering - Algoritmi gerarchici e density-based Pedreschi
10. Giovedì, Marzo 22, 16-18 A Clustering - Algoritmi avanzati Pedreschi
11. Lunedì, Marzo 26, 14-16 A1 Classificazione con alberi di decisione, Algoritmo C4.5 Pedreschi
12. Giovedì, Aprile 12, 16-18 A Valutazione dei modelli, Classificatori bayesiani lucidi Bonchi
13. Lunedì, Aprile 16, 14-16 A1 Classificazione con alberi di decisione, Esercitazione con strumenti software data mining lucidi Bonchi
14. Giovedì, Aprile 19, 16-18 A LEZIONE ANNULLATA Pedreschi
15. Lunedì, Aprile 23, 14-16 A1 Classificazione - esercitzione con Insightful Miner Pedreschi
16. Giovedì, Aprile 26, 16-18 A Gestione del processo di KDD con strumenti commerciali e open-source Pedreschi - Nanni
17. Lunedì, Aprile 30, 14-16 A1 CANCELLATA PER vacanza accademica
18. Giovedì, Maggio 3, 16-18 A Altri algoritmi di classificazione. Assegnazione seminari e progetti. Pedreschi
19. Lunedì, Maggio 7, 14-16 A1 Regole Associative: concetti basici, algoritmi A-Priori e FP-Growth lucidi Bonchi
20. Giovedì, Maggio 10, 16-18 A Itemset frequenti con vincoli lucidi Bonchi
21. Lunedì, Maggio 14, 14-16 A1 Il sistema ConQueSt, Pattern Sequenziali lucidi Bonchi
22. Giovedì, Maggio 17, 16-18 A Privacy-preserving data mining ed aspetti etici 2._privacypreservingtechnologies_pedreschi_.pdf lucidi Giannotti - Pedreschi
23. Mercoledì, Maggio 30, 9-11 A1 VERIFICA PRE-APPELLO

Verifiche anni precedenti

Seminari e progetti di esame

Gruppo Progetto/Seminario Appello
Maffi Sistemi Immunitari Artificiali
Triolo, Parisi Privacy Preserving Data Mining
Pirosu Spatio-temporal Data Mining
Pulidori Classificatori Bayesiani
Accetta, Petriglieri Algoritmi Scalabili per il Clustering
Simon Web Mining - ranking webpages from HITS and pagerank
Tamberi Anomaly Detection
Scaiella, Rossino, Vitale Analisi Utenti CAD
Marcgheggiani, Cintia Analisi dei dati di Inquinamento di Pisa ?
Masci, Caponi Analidi di Dati relativi a Malattie del Fegato ?
Galdi, Rubino Analidi di Dati relativi a Malattie del Fegato ?
Kolundzija Graph pattern mining
Grasso Methods for comparing classifiers ?
Daoudagh, Ferro, Pardini Analisi di dati sul Workflow
Casanovi, Fioravanti Analisi della defezione in Coop
Conti, Righetti Support Vector Machine

Appelli di esame

Appello di settembre: Mercoledì 12.09.2007, ore 9:00, Aula B1

Per la sessione estiva sono previsti i seguenti tre appelli:

Appello Giorno Orario esame scritto Orario esami orali, seminari, progetti Aula
Martedì 5 giugno 2007 9.00 - 11.00 13.00 - 18.00 C1
Martedì 26 giugno 2007 9.00 - 11.00 13.00 - 18.00 C1
Martedì 24 luglio 2007 9.00 - 11.00 13.00 - 18.00 A1

Edizioni anni precedenti