I video.

In questa pagina raccolgo i link ad una serie di video, da me preparati, per spiegare come utilizzare alcune funzionalità avanzate di Oracle DataScience od anche per spiegare come affrontare task avanzati nell'ambito della DataScience e del Machine Learning.

Ho aggiunto anche un video, il primo della lista, in cui spiego le caratteristiche di un'architettura per una soluzione end-2-end, basata su servizi Cloud Oracle.

 

Video link Note
Architettura di un modern DataLake DataLake 2.0, serverless, elastico, per il ML e la Data Science
Come affrontare lo sviluppo di un modello per la Fraud Detection quando il dataset è molto grande. 
Come connettersi da una Notebook Session ad un Autonomous DB (ADWH) Configurazione ed uso del wallet
Model Catalog e Model Deployment: le nuove e semplificate modalità per trasformare il modello addestrato in un REST service  
Tuning degli iper-parametri di un modello ML ADSTuner, Optuna
Anomaly Detection for Predictive Maintenance AutoEncoder e PyOD per prevedere in anticipo fault su macchinari.
Utilizzare Apache Spark e OCI Data Flow in OCI Data Science  soon available  
Oracle Graph DB (PGX) in OCI Data Science  soon available   
Implementare K-FOLD CV con Sklearn K-FOLD CV, ensamble
eXplainable AI: strumenti Open Source per la Model eXplaination and interpretability Permutation Feature Importance, PDP, Shapley, LIme
BIAS in Machine Learning model: il toolkit AEQuitas BIAS, AEQuitas
OCI Data Catalog e suo utilizzo in un Notebook, mediante Python SDK Data Catalog, Python SDK, DataScience

 

Link ai repository GitHub con gli esempi di codice illustrati nei video:

Video interessanti prodotti dal Product Management team di Oracle Data Science:

Link a repository di esempi creati dal PM di Oracle DataScience:

 

 

Introduction.

I have decided to list all the most important projects in AI/Machine Learning field that I have published on GitHub.

Image Classification in Healthcare

CXR-Anomaly-Detector

Development of a model based on a Deep Convolutional Network, using a subset of NIH-CXR-14 dataset, to detect if a Chest X-Ray (CXR) contains signs of any diseases.

The model has been trained on TPU, using resources from the Kaggle site.

I have tried to reproduce the results shown in this article from Nature, with very good results.

link to GitHub repository of the project

 

 

CXR-Pneumonia

Development of a model for Pneumonia detection, again based on NIH-CXR-14 dataset.

link to the GitHub repository of the project.

 

Diabetic Retinopathy.

Diabetic Retinopathy is one of the most common and dangerous complications of Diabetes. It is one of the most common causes of blindness in aged people.

Images of the retina can be used to diagnose and monitor the damages made and diagnose this disease. Kaggle in 2015 has launched a competition on this subject.

In this work, I have applied Google EfficientNet in order to see which kind of improvements can be obtained using a state-of-the-art DNN. The results have been really interesting: I could have reached 14th place in the competition.

link to GitHub

see also: https://luigisaetta.it/index.php/deep-learning-ai/43-learning-from-kaggle-competitions

 

Neural Networks for tabular data.

Deployment of a TF 2.3 model using ONNX

In this project I'm using TF 2.3, TF Feature Column API, Keras to develop a Fully Connected Neural Network for binary classification.

Data are coming from Wisconsin Breast Cancer Dataset.

I'm using ONNX as serialization format to explore how easy is to use ONNX for these kinds of models.

see also: https://github.com/luigisaetta/onnxdeployment

 

Introduzione.

Un elemento fondamentale di un sito moderno di commercio elettronico è il motore di raccomandazione, la componente del sistema che suggerisce ai clienti quali possono essere i prodotti o gli oggetti di maggiore interesse.

Ma come funziona e come può essere realizzato un motore di raccomandazione? Ed esiste una sola tecnica per realizzarlo, oppure, come possiamo immaginare, è possibile scegliere quale "anima" dare al nostro sito scegliendo su quale tecnica basare il suo motore di raccomandazione?

E, le aziende più famose, ad esempio Netflix, come hanno realizzato il loro motore di raccomandazione?

In questo articolo voglio esaminare alcune delle tecniche utilizzate ed arrivare ad indicare come, avendo i dati giusti a disposizione, oggi è possibile realizzare un tale motore con poche righe di codice. 

Se, poi, vi interessa il cinema, spero vi troverete ulteriori spunti di interesse. Ho utilizzato per i miei esperimenti i dati di MovieLens.

(Photo by Deon Black on Unsplash)

Introduction.

I was preparing a webinar and I was thinking about what subjects could be interesting for it, between the many different subjects that come out in my mind.

I thought that to be successful in realizing a Machine Learning project, one should be really aware of what are the pitfalls, what are the points, during the project, where you can do bad mistakes.

One area of concern for sure is regarding BIAS. For this reason, I decided to devote some of my time and prepared the following notes.

Introduzione.

Voglio ritornare sull'importante tema relativo alle metriche che si utilizzano per valutare le prestazioni di un modello di classificazione.

In un articolo precedente ho definito metriche quali: precision, recall ed F1 score. In questo articolo voglio definire alcune metriche che sono utilizzate sopratutto in campo medico: la Sensibilità, la Specificità, il PPV ed NPV, il C-index.

Sensibilità e specificità sono, ad esempio, termini molto usati nel campo dell'epidemiologia, ad esempio per caratterizzare un test diagnostico nei confronti dei positivi e negativi al test.