Introduzione.

Il mio viaggio nel mondo delle competizioni su Kaggle continua. Da alcuni giorni ho iniziato a sviluppare modelli per la "Cassava Leaf Disease Classification".

Cassava è una pianta, probabilmente più nota come Manioca. E' una pianta utilizzata per l'alimentazione e, come possiamo immaginare, è un elemento importante per la nutrizione e l'economia, sopratutto in quei paesi poveri, come i paesi africani. E' la terza fonte di carboidrati, dopo il riso ed il mais, nei paesi tropicali.

Come tutte le piante, vi sono malattie che possono ridurre o rovinare i raccolti. Ma, il problema è più grave in Africa, sopratutto per la difficoltà di avere esperti sul campo che possano compiere la diagnosi in tempo ed evitare la diffuzione.

Per questa ragione, un'istituto di ricerca, il Makerere University AI Lab, ha pensato di stimolare lo sviluppo di modelli di AI che possano, a partire da fotografie delle foglie e delle piante, diagnosticare la presenza o meno di una malattia virale che può danneggiare il raccolto.

In collaborazione con Kaggle, il noto sito di competizioni di ML e DL, hanno lanciato alcuni giorni fa la competizione, fornendo un dataset di circa 21000 immagini per il training.

Perchè EfficientNet?

Quando si tratta di mostrare come concretamente attuare il Transfer Learning gli esempi che si trovano sui libri, i tutorial online, utilizzano troppo spesso reti convolutive (CNN) ben note quali: VGG16, Inception, Resnet, DenseNet.

Un esempio lo potete trovare nel bel libro di F. Chollet, Deep Learning In Python, pag. 145, ove, appunto, è utilizzata la rete VGG16.

Si tratta di reti sviluppate alcuni anni fa, che hanno anche vinto competizioni quali la ImageNet Large Scale Visual Recognition Competition (ILSRVC). Reti che hanno fatto la storia, dimostrato, concretamente, le enormi potenzialità del DL e dato l'avvio all'enorme potenziale di investimenti, in soldi ed in termini di potenziale umano, in questo campo.

La lettura di tali esempi è senza dubbio istruttiva, ma se vogliamo usare una rete CNN pre-trained per risolvere un problema concreto conviene oggi usare una rete VGG16 o Inception?

Introduzione.

Il cancro della pelle (skin cancer) è una delle lesioni maligne più importanti e, in particolare in nazioni quali Australia e Nuova Zelanda, dove l’effetto del sole è maggiore, è un problema molto molto serio. La forma più pericolosa è il melanoma, che può essere curato con efficacia soltanto nel caso di diagnosi precoce.

Why Kaggle?

I have started using Kaggle seriously a couple of months ago when I joined the SIIM-ISIC Melanoma Classification Competition.

Un titolo dice tante cose ma non tutto.

Il nome Survival Functions ci ricorda che si tratta di strumenti inizialmente sviluppati ed utilizzati nel campo della Medicina. Ma, come spero di chiarire con alcuni buoni esempi, in realtà possono essere applicati in tanti differenti campi, ed io ritengo che debbano rientrare tra gli strumenti padroneggiati dai Data Scientist di oggi.