Introduzione.

Il mio viaggio nel mondo delle competizioni su Kaggle continua. Da alcuni giorni ho iniziato a sviluppare modelli per la "Cassava Leaf Disease Classification".

Cassava è una pianta, probabilmente più nota come Manioca. E' una pianta utilizzata per l'alimentazione e, come possiamo immaginare, è un elemento importante per la nutrizione e l'economia, sopratutto in quei paesi poveri, come i paesi africani. E' la terza fonte di carboidrati, dopo il riso ed il mais, nei paesi tropicali.

Come tutte le piante, vi sono malattie che possono ridurre o rovinare i raccolti. Ma, il problema è più grave in Africa, sopratutto per la difficoltà di avere esperti sul campo che possano compiere la diagnosi in tempo ed evitare la diffuzione.

Per questa ragione, un'istituto di ricerca, il Makerere University AI Lab, ha pensato di stimolare lo sviluppo di modelli di AI che possano, a partire da fotografie delle foglie e delle piante, diagnosticare la presenza o meno di una malattia virale che può danneggiare il raccolto.

In collaborazione con Kaggle, il noto sito di competizioni di ML e DL, hanno lanciato alcuni giorni fa la competizione, fornendo un dataset di circa 21000 immagini per il training.

Un compito di classificazione di immagini.

Le immagini fornite per l'addestramento del modello sono corredate di "label", che classificano le immagini in 5 classi. 4 di queste classi corrispondono ad immagini di piante infette da un virus, la quinta rappresenta piante sane.

L'obiettivo della competizione è di sviluppare un modello che consenta, a partire da un'immagine, di classificarla in una di queste cinque classi, con l'accuratezza più elevata possibile. 

La metrica utilizzata per la classifica (la leaderboard) è l'accuratezza: la percentuale di immagini di un dataset di test che il nostro modello è in grado di classificare correttamente.