dm:dm.2008-09
Differenze
Queste sono le differenze tra la revisione selezionata e la versione attuale della pagina.
| Entrambe le parti precedenti la revisioneRevisione precedente | |||
| dm:dm.2008-09 [23/12/2009 alle 14:38 (16 anni fa)] – cancellata Mirco Nanni | dm:dm.2008-09 [23/12/2009 alle 14:38 (16 anni fa)] (versione attuale) – creata Mirco Nanni | ||
|---|---|---|---|
| Linea 1: | Linea 1: | ||
| + | ====== Data Mining A.A. 2008/09 ====== | ||
| + | Docenti: | ||
| + | * Fosca Giannotti, [[fosca.giannotti@isti.cnr.it]] | ||
| + | * Mirco Nanni, [[mirco.nanni@isti.cnr.it]] | ||
| + | * KDD LAB - Knowledge Discovery Laboratory, ISTI-CNR e Dipartimento di Informatica dell' | ||
| + | |||
| + | |||
| + | ====== News ====== | ||
| + | |||
| + | * **[30/ | ||
| + | * **[06/ | ||
| + | * **[29/ | ||
| + | * **[08/ | ||
| + | * **[22/ | ||
| + | * Le date della seconda verifica e degli appelli sono state fissate, anche se in modo non definitivo. | ||
| + | * Giovedì 21 maggio 2009 ci sarà una lezione extra di esercitazione. | ||
| + | * La verifica intermedia del 7 aprile è stata anticipata alla mattina dello stesso giorno. | ||
| + | * Gli studenti che devono ancora sostenere l' | ||
| + | |||
| + | ====== Obiettivi del corso ====== | ||
| + | |||
| + | La grande disponibilità di dati provenienti da database relazionali, | ||
| + | - i concetti di base del processo di estrazione della conoscenza: studio e preparazione dei dati, forme dei dati, misure e similarità dei dati; | ||
| + | - le principali tecniche di datamining (regole associative, | ||
| + | - alcuni casi di studio nell’ambito del marketing e del supporto alla gestione clienti, del rilevamento di frodi e di studi epidemiologici. | ||
| + | - l’ultima parte del corso ha l’obiettivo di introdurre gli aspetti di privacy ed etici inerenti all’utilizzo di tecniche inferenza sui dati e dei quali l’analista deve essere a conoscenza | ||
| + | |||
| + | ====== Orario e Aule ====== | ||
| + | **Lezioni: | ||
| + | * Martedì, ore 14-16, aula C1 | ||
| + | * Giovedi, ore 11-13, aula D1 | ||
| + | **Ricevimento: | ||
| + | * Giannotti: mercoledì 15-17, ISTI, Area Ricerca CNR, località San Cataldo, Pisa (prenotazione per e-mail) | ||
| + | |||
| + | ====== Libro di Testo ====== | ||
| + | |||
| + | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Addison Wesley, ISBN 0-321-32136-7, | ||
| + | * [[http:// | ||
| + | |||
| + | |||
| + | |||
| + | ====== Riferimenti bibliografici ====== | ||
| + | |||
| + | * Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to DATA MINING, Addison Wesley, ISBN 0-321-32136-7, | ||
| + | * Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, 2000 http:// | ||
| + | * U. Fayyad, G. Piatetsky-Shapiro, | ||
| + | * Barry Linoff Data Mining Techniques for Marketing Sales and Customer Support, John Wiles & Sons, 2002 | ||
| + | ====== Calendario delle lezioni ====== | ||
| + | |||
| + | ^ ^ Giorno/ora ^ Aula ^ Argomento ^ Materiale didattico ^ Docente ^ | ||
| + | |1.| Martedì, Febbraio 24, 14-16 | Aula C1 | // | ||
| + | |2.| Giovedì, Febbraio 26, 11-13 | Aula D1 | // | ||
| + | |3.| Martedì, Marzo 3, 14-16 | Aula C1 | //I Dati: i tipi di dato, la qualità dei dati, la preparazione dei dati - Misure di similarità (Cap.2) // | {{: | ||
| + | |4.| Giovedì, Marzo 5, 11-13 | Aula D1 | //I Dati: Esplorazione dei dati (Cap.3)// | {{: | ||
| + | |5.| Martedì, Marzo 10, 14-16 | Aula C1 | //Regole Associative: | ||
| + | |6.| Giovedì, Marzo 12, 11-13 | Aula D1 | //Regole Associative: | ||
| + | |7.| Martedì, Marzo 17, 14-16 | Aula C1 | //Regole Associative: | ||
| + | |8.| Giovedì, Marzo 19, 11-13 | Aula D1 | // | ||
| + | |9.| Martedì, Marzo 24, 14-16 | Aula C1 | // | ||
| + | |10.| Giovedì, Marzo 26, 11-13 | Aula D1 | // | ||
| + | |11.| Martedì, Marzo 31, 14-16 | Aula C1 | // | ||
| + | |12.| Giovedì, Aprile 2, 11-13 | Aula D1 | // | ||
| + | | | Martedì, Aprile 7, 11-13 | Aula D1 | **VERIFICA** | | | | ||
| + | |13.| Martedì, Aprile 21, 14-16 | Aula C1 | // | ||
| + | |14.| Giovedì, Aprile 23, 11-13 | Aula D1 | // | ||
| + | |15.| Martedì, Aprile 28, 14-16 | Aula C1 | // | ||
| + | |16.| Giovedì, Aprile 30, 11-13 | Aula D1 | // | ||
| + | |17.| Martedì, Maggio 5, 14-16 | Aula C1 | // Casi di studio // | {{: | ||
| + | |18.| Giovedì, Maggio 7, 11-13 | Aula D1 | // Casi di studio / Strumenti di DM // | | Giannotti | | ||
| + | |19.| Martedì, Maggio 12, 14-16 | Aula C1 | // Esercitazione di preparazione alla verifica: Classificazione // | | Nanni | | ||
| + | |20.| Giovedì, Maggio 14, 11-13 | Aula D1 | // Casi di studio / Presentazione progetti // | {{: | ||
| + | |21.| Giovedì, Maggio 21, 11-13 | Aula D1 | // Esercitazione di preparazione alla verifica: Classificazione // | [[http:// | ||
| + | |||
| + | |||
| + | ====== Verifiche anni precedenti ====== | ||
| + | |||
| + | === Verifiche anni precedenti (sottoinsieme) === | ||
| + | * {{tdm: | ||
| + | * {{tdm: | ||
| + | * {{tdm: | ||
| + | |||
| + | === Verifiche 2007 (appelli giugno-luglio) === | ||
| + | |||
| + | * {{dm: | ||
| + | * {{dm: | ||
| + | * {{dm: | ||
| + | |||
| + | === Verifiche 2008 === | ||
| + | * {{: | ||
| + | * {{: | ||
| + | * {{: | ||
| + | |||
| + | ====== Progetti ====== | ||
| + | |||
| + | * Vengono proposti 5 progetti (+1 //jolly//), descritti nel seguente documento: {{: | ||
| + | * I progetti andranno svolti in gruppi preferibilmente di 2 persone, eccezionalmente anche di 1 o 3 persone. | ||
| + | * Ogni gruppo dovrà comunicare ai docenti la propria composizione e il progetto scelto. In particolare, | ||
| + | * I progetti e le corrispondenti relazioni dovranno in linea di massima seguire le linee guida del modello CRISP-DM, brevemente riassunto nelle seguenti slide: {{: | ||
| + | * La discussione del progetto avverrà in prossimità degli appelli d' | ||
| + | * La presentazione di ogni progetto durerà tra i 20 e i 30 minuti. Al termine delle presentazioni, | ||
| + | |||
| + | ===== Software ===== | ||
| + | |||
| + | * I progetti possono essere svolti con qualunque software, a discrezione degli studenti, purché, ovviamente, provvisti di adeguate funzionalità di data mining. | ||
| + | * Alcuni software di analisi potrebbero avere problemi a reggere la mole dei dati forniti. In tal caso, si consiglia di utilizzare un DBMS (Access, SQL Server, Oracle, MySQL, ...) per effettuare una adeguata selezione/ | ||
| + | * Tra i software di data mining disponibili, | ||
| + | * **Weka**, scaricabile gratuitamente da questo indirizzo: [[http:// | ||
| + | * **Rialto**, scaricabile da: [[http:// | ||
| + | |||
| + | ====== Appelli di esame ====== | ||
| + | ===== Verifiche intermedie ===== | ||
| + | |||
| + | ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
| + | | 7 aprile 2009, martedì | 11-13 | Aula D1 | | [[voti.7.4.2009]] | | ||
| + | | 28 maggio 2009, giovedì | 14-16 | Aula D1 | {{: | ||
| + | |||
| + | ===== Appelli regolari ===== | ||
| + | |||
| + | |||
| + | ^ Tipo di prova ^ Data ^ Orario ^ Luogo ^ Note ^ Voti ^ | ||
| + | | Appello 1 - scritto | 12 giugno 2009 | 10-12 | D1 | | [[appello.12.06.2009.risultati]] | | ||
| + | | orale | 16 giugno 2009 | 10-13 | B | - | - | | ||
| + | | Appello 2 - scritto | 30 giugno 2009 | 10-12 | D1 | {{: | ||
| + | | orale | 7 luglio 2009 | 10-13 | D1 | - | - | | ||
| + | | Appello 3 - scritto | 21 luglio 2009 | 10-12 | D1 | {{: | ||
| + | | orale | 24 luglio 2009 | 10-13 | D1 | - | | | ||
| + | | Appello 4 - scritto | 3 settembre 2009 | 10-12 | C | {{: | ||
| + | | orale | 10 settembre 2009 | 10-12 | C | **Confermata** | | | ||
| + | |||
| + | ====== Edizioni anni precedenti ===== | ||
| + | |||
| + | * [[dm.2007-08]] | ||
| + | * [[dm.2006-07]] | ||
dm/dm.2008-09.1261579080.txt.gz · Ultima modifica: 23/12/2009 alle 14:38 (16 anni fa) da Mirco Nanni
