Strumenti e risorse per facilitare l'adozione della Data Science e Machine Learning.
Come parte del mio lavoro, io provo ad aiutare molti dei nostri clienti nel semplificare l'adozione delle tecniche e degli strumenti legati al mondo del Machine Learning e della Data Science.
E, molto spesso, mi rendo conto del fatto che, anche se cambia il dominio di applicazione e cambiano i dati, si tratta di fare delle cose che ho già fatto in altri progetti. In altre parole mi rendo conto del fatto che è possibile riusare del codice.
Per questa ragione, ho deciso di cominciare a raccogliere in un repository GitHub una serie di esempi che illustrano le tecniche più comunemente utilizzate.
Alcuni esempi:
- Come realizzare rapidamente l'istogramma di un set di features
- Analizzare la cardinalità delle feature, per determinare quali vanno trattate come categoriche
- Fare il plot della Matrice di Correlazione
- Implementare K-fold cross validation
- Accedere all'Object Storage
- Utilizzare MLflow insieme ad Optuna
Il repository.
Gli esempi di codice, i Notebook che illustrano le tecniche sono accessibili qui
Feedback.
L'idea è di far crescere il repository aggiungendo via via esempi che ho trovato utili lavorando con i clienti che seguo. Se volete segnalarmi quali tecniche vorreste veder illustrate, potete contattarmi alla mia email privata This email address is being protected from spambots. You need JavaScript enabled to view it.