dm:dm.2010-11
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
| dm:dm.2010-11 [20/09/2011 alle 06:51 (14 anni fa)] – creata Fosca Giannotti | dm:dm.2010-11 [20/09/2011 alle 06:52 (14 anni fa)] (versione attuale) – Fosca Giannotti | ||
|---|---|---|---|
| Linea 1: | Linea 1: | ||
| - | llllllllllllllllllllllllll | + | ====== Data Mining A.A. 2010/11 ====== |
| + | Docenti: | ||
| + | * **Dino Pedreschi, Fosca Giannotti, Mirco Nanni** | ||
| + | * KDD Laboratory, Università di Pisa ed ISTI - CNR, Pisa | ||
| + | * [[http:// | ||
| + | * [[dino.pedreschi@di.unipi.it]] | ||
| + | * [[fosca.giannotti@isti.cnr.it]] | ||
| + | * [[mirco.nanni@isti.cnr.it]] | ||
| + | |||
| + | Assistenti: | ||
| + | * **Anna Monreale, Salvo Rinzivillo, Diego Pennacchioli** | ||
| + | * KDD Laboratory, Università di Pisa ed ISTI - CNR, Pisa | ||
| + | * [[http:// | ||
| + | * [[annam@di.unipi.it]] | ||
| + | * [[rinzi@di.unipi.it]] | ||
| + | * [[pennacchioli@isti.cnr.it]] | ||
| + | ====== News ====== | ||
| + | * [28/ | ||
| + | * [11/ | ||
| + | * [21/ | ||
| + | * [26/ | ||
| + | * [26/ | ||
| + | * [24/ | ||
| + | * [21/ | ||
| + | * [17/ | ||
| + | * [01/ | ||
| + | * [23/ | ||
| + | * [23/ | ||
| + | * [15/ | ||
| + | * [15/ | ||
| + | |||
| + | ====== Obiettivi del corso ====== | ||
| + | |||
| + | La grande disponibilità di dati provenienti da database relazionali, | ||
| + | - i concetti di base del processo di estrazione della conoscenza: studio e preparazione dei dati, forme dei dati, misure e similarità dei dati; | ||
| + | - le principali tecniche di datamining (regole associative, | ||
| + | - alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici. | ||
| + | - l’ultima parte del corso ha l’obiettivo di introdurre gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza | ||
| + | |||
| + | ====== Orario e Aule ====== | ||
| + | **Lezioni: | ||
| + | |||
| + | ^ Giorno | ||
| + | | Lunedì | 14:00 - 16:00 | N | valido a partire dal 28.03.2011 | | ||
| + | | Mercoledì | 14:00 - 16:00 | C1 | | | ||
| + | | Venerdì | 09:00 - 11:00 | B1 | valido fino al 25.03.2011 | | ||
| + | |||
| + | **Ricevimento: | ||
| + | * su appuntamento con i docenti c/o ISTI-CNR | ||
| + | |||
| + | ====== Materiale didattico ====== | ||
| + | |||
| + | ===== Libro di Testo ===== | ||
| + | |||
| + | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar. **Introduction to Data Mining**. Addison Wesley, ISBN 0-321-32136-7, | ||
| + | * [[http:// | ||
| + | |||
| + | ===== Slides del corso ===== | ||
| + | |||
| + | * Le slide utilizzate durante il corso verranno inserite nel calendario al termine di ogni lezione. In buona parte esse sono tratte da quelle fornite dagli autori del libro di testo: [[http:// | ||
| + | |||
| + | ===== Testi di esame ===== | ||
| + | |||
| + | * Oltre ai testi e (dove disponibili) soluzioni degli appelli d' | ||
| + | * {{tdm: | ||
| + | * {{dm: | ||
| + | * {{: | ||
| + | |||
| + | ====== Calendario delle lezioni ====== | ||
| + | |||
| + | **Prima parte del corso** | ||
| + | |||
| + | ^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
| + | |1.| 19.10.2010 11:00-13:00 | L1 | Introduzione: | ||
| + | |2.| 22.10.2010 08:30-10:00 | B1 | Overview delle tecniche di data mining | | Giannotti | | ||
| + | |3.| 26.10.2010 11:00-13:00 | L1 | Dati: tipi e misure di base | Cap. 2 del libro di testo {{: | ||
| + | |4.| 29.10.2010 08:30-10:00 | B1 | Dati: tipi e misure di base | | Pedreschi | ||
| + | |5.| 02.11.2010 11:00-13:00 | L1 | Analisi esplorativa e data understanding | Cap. 3 del libro di testo {{: | ||
| + | |6.| 05.11.2010 08:30-10:00 | B1 | Analisi esplorativa e data understanding | | Pedreschi | ||
| + | |7.| 10.11.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | [[http:// | ||
| + | |8.| 17.11.2010 14:00-16:00 | G1 | cancellata per sciopero del docente | | Pedreschi | ||
| + | |9.| 19.11.2010 08:30-10:00 | B1 | Analisi di clustering. K-means | Cap. 8 del libro di testo {{: | ||
| + | |10.| 24.11.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | | Pedreschi | ||
| + | |11.| 26.11.2010 09:00-11:00 | B1 | cancellata per occupazione studentesca | | Pedreschi | ||
| + | |12.| 01.12.2010 14:00-16:00 | G1 | cancellata per occupazione studentesca | | Pedreschi | ||
| + | |13.| 03.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi gerarchici | | Pedreschi | ||
| + | |14.| 08.12.2010 14:00-16:00 | G1 | festività | | | | ||
| + | |15.| 11.12.2010 09:00-11:00 | B1 | Analisi di clustering. Metodi basati su densità | | Pedreschi | ||
| + | |16.| 15.12.2010 14:00-16:00 | G1 | Esercitazione con il sistema Weka | | Pedreschi | ||
| + | |17.| 17.12.2010 09:00-11:00 | B1 | Classificazione. Alberi di decisione | Cap. 4 del libro di testo {{: | ||
| + | |18.| 12.01.2011 14:00-16:00 | G1 | Classificazione. Alberi di decisione | | Pedreschi | ||
| + | |19.| 14.01.2011 09:00-11:00 | B1 | Classificazione. Alberi di decisione | | Pedreschi | ||
| + | |20.| 19.01.2011 14:00-16:00 | G1 | Esercitazione con il sistema Weka | | Pedreschi | ||
| + | |21.| 21.01.2011 09:00-11:00 | B1 | Esercitazione con il sistema Weka | | Pedreschi | ||
| + | |||
| + | **Seconda parte del corso** | ||
| + | |||
| + | ^ ^ Giorno ^ Ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
| + | |1.|09.03.2011|14: | ||
| + | |2.|16.03.2011|14: | ||
| + | |3.|18.03.2011|09: | ||
| + | |4.|23.03.2011|14: | ||
| + | |5.|25.03.2011|09: | ||
| + | |6.|28.03.2011|14: | ||
| + | |7.|30.03.2011|14: | ||
| + | |8.|04.04.2011|14: | ||
| + | |9.|06.04.2011|14: | ||
| + | |10.|11.04.2011|14: | ||
| + | |11.|13.04.2011|14: | ||
| + | |12.|02.05.2011|14: | ||
| + | |13.|04.05.2011|14: | ||
| + | |14.|09.05.2011|14: | ||
| + | |15.|11.05.2011|14: | ||
| + | |16.|16.05.2011|14: | ||
| + | |17.|18.05.2011|14: | ||
| + | | |23.05.2011|14: | ||
| + | |18.|25.05.2011|14: | ||
| + | |19.|30.05.2011|14: | ||
| + | |20.|01.06.2011|14: | ||
| + | |||
| + | |||
| + | |||
| + | |||
| + | ====== Modalità di esame ====== | ||
| + | |||
| + | L' | ||
| + | * La **prova scritta** è composta essenzialmente di esercizi sui metodi e algoritmi visti a lezione. I testi degli appelli d' | ||
| + | * La **prova orale** verte sugli aspetti più teorici del corso (definizioni, | ||
| + | |||
| + | ====== Esercizi 2010-2011 ====== | ||
| + | |||
| + | |||
| + | ===== Esercizi DM parte I ===== | ||
| + | - ** Comprensione dei dati: Adult dataset. Assegnato il 19.11.2010. Da completarsi entro il 30.11.2010. Consegnare per email al docente, cc a [[annamonreale@gmail.com]] specificando [DM] nel subject della mail. ** Considerare il dataset Adult, scaricabile dall' | ||
| + | - ** Analisi di clustering: WarLogs dataset. Assegnato il 17.12.2010. Da completarsi entro il 10.01.2011. Consegnare per email al docente, cc a [[rinzivillo@isti.cnr.it]] specificando [DM] nel subject della mail. ** Testo e dataset sono scaricabili [[ warlogs | a questa pagina]] | ||
| + | - ** Classificazione: | ||
| + | |||
| + | ===== Esercizi DM parte II ===== | ||
| + | Dati e dettagli delle esercitazioni possono essere richiesti scrivendo a [[mirco.nanni@isti.cnr.it]]. | ||
| + | Nota: i gruppi di progetto possono essere composti fino a 3 persone. | ||
| + | - **Progetto “Rilevazione rischio frode fiscale”**. Consegna finale scaduta. | ||
| + | - **Progetto “Market Basket Analysis”**. Consegna finale: fine maggio 2011. | ||
| + | - **Progetto “Mobility Data Analysis”**. Consegna finale: fine giugno 2011. | ||
| + | ====== Appelli di esame ====== | ||
| + | |||
| + | ===== Verifiche intermedie/ | ||
| + | |||
| + | ^ ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
| + | |I Esercizio e II Esercizio | 30.11.2010 | | | | [[dm: | ||
| + | |||
| + | ===== Appelli regolari ===== | ||
| + | |||
| + | ^ Appello ^ Data ^ Orario | ||
| + | | |07 Febbraio 2011 | 9.00 -- 13.00 |Aula L1 | | | | ||
| + | | |03 Marzo 2011 | 9.00 -- 13.00 |Aula C | ||
| + | | |15 Giugno 2011 | 9.00-12.00 | ||
| + | | | ||
| + | | |27 Giugno 2011 | 9.00 |Aula C1 | ||
| + | | |18 Luglio 2011 | 9.00 |Aula B | ||
| + | | | ||
| + | |||
| + | ====== Edizioni anni precedenti ===== | ||
| + | |||
| + | * [[dm.2009-10]] | ||
| + | * [[dm.2008-09]] | ||
| + | * [[dm.2007-08]] | ||
| + | * [[dm.2006-07]] | ||
| + | * [[PhDWorkshop2011]] | ||
| + | * [[SNA.Ingegneria2011]] | ||
dm/dm.2010-11.1316501469.txt.gz · Ultima modifica: 20/09/2011 alle 06:51 (14 anni fa) da Fosca Giannotti
