Novembre: nuove funzionalità.

Nella release di Oracle Data Science che sarà disponibile in General Availability (GA) entro la fine del mese di novembre sono comprese una serie di nuove funzionalità molto interessanti:

  • La possibilità di gestire ambienti Conda multipli
  • La possibilità di utilizzare PySpark per trasformare ed analizzare i dati
  • Il supporto del formato ONNX per la serializzazione dei modelli addestrati.

In questa nota voglio spiegare ed esplorare la prima nuova funzionalità: la possibilità di creare e gestire ambienti Conda multipli.

Introduzione.

In DataScience il lavoro è svolto principalmente all'interno di una Notebook Session. La Notebook Session offre un'ambiente di runtime, la cui capacità (numero di CPU, GPU?) è definita al momento dello start e può essere modificata, senza perdere il lavoro svolto ed i dati caricati, semplicemente ripartendo con una nuova "shape".

In certe fasi del lavoro di sviluppo di un modello ML, sopratutto nella fase di training ma a volte anche in fase di "inferenza", la capacità computazionale richiesta può essere elevata e può essere importante poter verificare quanta capacità è effettivamente utilizzata e ,se è il caso, aumentarla per velocizzare il training.

Quello che voglio esplorare oggi è quali strumenti abbiamo a disposizione per controllare l'utilizzo delle risorse allocate.

Nel mondo Cloud l'innovazione viaggia sul ritmo dei mesi.

Al rientro dalle vacanze tante interessanti novità per il servizio OCI Data Science. Alcune di queste sono miglioramenti significativi su funzionalità già esistenti. Altre,  nuove ed importanti funzionalità.

Per dare un idea del "ritmo", in genere il team di sviluppo di Oracle Data Science (ODS) rilascia nuove funzionalità ogni mese.

Ovviamente, per dovere di chiarezza, devo ricordare che le funzionalità menzionate qui, sopratutto se previste nell'immediato futuro, devono essere confermate prima di intraprendere qualsiasi sviluppo concreto. In questo i Cloud Engineer di Oracle (ed il sottoscritto) vi possono aiutare, sia ad entrare, laddove possibile, in un programma di Limited Availability (il nostro Early Adopter) sia a confermare l'effettiva disponibilità delle funzionalità in General Availability.

Passiamo a vedere quali sono disponibili per settembre e quali saranno disponibili entro ottobre.

Subcategories