Quando un ricercatore deve raggruppare dei dati, ha una sola strada davanti a sè: utilizzare uno dei tanti metodi cluster. Il clustering è una delle tecniche forse più diffuse per fare questa operazione. Si hanno degli eventi (data), si sceglie una tecnica che identifichi elementi comuni e caratteristiche comuni per creare i gruppi (data sets), e li si unisce per fra loro (clusters). Come si può capire quindi, non è assolutamente indifferente scegliere il metodo giusto per fare un cluster. Andiamo dal fuzzy clustering al clustering esclusivo, fino ad arrivare allo hier e al più celebre k-means. Per la biologia, fra i tanti, ne emerge uno chiamato il consensus clustering. Il consensus però ha un difetto: raggruppa i dati lentamente e quindi rallenta le operazioni di calcolo - Intervista al prof. Raffaele Giancarlo, ordinario di informatica all’università di Palermo, e col dott. Filippo Utro, post doc presso l’IBM di New York {pca-94d46257723f6981b05f1e34de6f425e}
Quando un ricercatore deve raggruppare dei dati, ha una sola strada davanti a sè: utilizzare uno dei tanti metodi cluster. Il clustering è una delle tecniche forse più diffuse per fare questa operazione. Si hanno degli eventi (data), si sceglie una tecnica che identifichi elementi comuni e caratteristiche comuni per creare i gruppi (data sets), e li si unisce per fra loro (clusters). Come si può capire quindi, non è assolutamente indifferente scegliere il metodo giusto per fare un cluster. Andiamo dal fuzzy clustering al clustering esclusivo, fino ad arrivare allo hier e al più celebre k-means. Per la biologia, fra i tanti, ne emerge uno chiamato il consensus clustering. Il consensus però ha un difetto: raggruppa i dati lentamente e quindi rallenta le operazioni di calcolo - Intervista al prof. Raffaele Giancarlo, ordinario di informatica all’università di Palermo, e col dott. Filippo Utro, post doc presso l’IBM di New York {pca-94d46257723f6981b05f1e34de6f425e}