Il panorama del Data science negli ultimi 5 anni si è evoluto intorno allo sviluppo di nuovi algoritmi di apprendimento e al loro utilizzo per risolvere problemi complessi, dall’apprendimento automatico alla computer vision. Il futuro ci chiederà di costruire modelli ad alta intensità di calcolo con
un KPI importante. In questo numero esploreremo Julia, il linguaggio di programmazione che mostra un enorme potenziale di impatto su questa transizione e che è sulla buona strada per diventare il linguaggio preferito dai Data scientist.
Cosa c’è di così speciale in JULIA?
Sentiamo l’opinione di chi lo ha creato:
“Vogliamo qualcosa che sia utilizzabile per la programmazione generale come Python, facile per la statistica come R, naturale per l’elaborazione delle stringhe come Perl, potente per l’algebra lineare come Matlab, comodo per unire insieme programmi come una shell. Vogliamo che sia interattivo e che sia compilato. Vogliamo che sia veloce come il C!”
È davvero affascinante, vero? Non è mai stato creato un linguaggio di programmazione su misura per il mondo del Data science! Ibrido, veloce eppure così semplice da imparare!
I superpoteri di JULIA: Diamo un’occhiata più a fondo!
È davvero affascinante, vero? Non è mai stato creato un linguaggio di programmazione su misura per il mondo del Data science! Ibrido, veloce eppure così semplice da imparare!
- Carica ed elabora i dati più velocemente (10 volte più velocemente di Python e R)
- Il miglior gestore di pacchetti della categoria, con 3500 pacchetti e funzionalità per richiamare pacchetti da altri linguaggi di programmazione
- Il dispatch multiplo consente di utilizzare l’algoritmo giusto per l’istanza giusta
- Framework di apprendimento automatico (“machine learning”) pronti per essere resi disponibili
Applicazioni per JULIA
Julia vanta un’ampia varietà di applicazioni in tutti i settori, sia per l’alimentazione di veicoli autonomi che per applicazioni in ambiti quali la realtà aumentata, l’apprendimento automatico e la medicina di precisione.
Per la comunità degli analisti, i motori per le raccomandazioni stanno per essere rinnovati! Ecco un estratto dello studio di Factorization da cui trarre qualche ispirazione.
PARAMETERI / DATASET | DIMENSIONE (NUMERO DI INTERAZIONI) |
TEMPO DI FATTORIZZAZIONE. ( IN SEC ) |
Movielens | 20 milioni | 119 |
Last.fm | 0,5 miliardi | 2913 |
Le prestazioni dei Classificatori di immagini miglioreranno – allontanandosi dalle raccomandazioni convenzionali secondo cui i progetti Tensor Flow e Pytorch dovrebbero essere compilati in C++.
Chi utilizza JULIA?
L’elenco è enorme e in continua crescita!
In poche parole, se avete bisogno che i vostri codici vengano eseguiti più velocemente, sfruttando allo stesso tempo le capacità di un linguaggio di alto livello, Julia è una scelta ovvia.
“Perché i macroeconomisti come me sono così interessati ed entusiasti di Julia? Perché i nostri modelli sono complicati. È facile scrivere il problema, ma è difficile risolverlo, soprattutto se il nostro modello è ha un numero di elevato di dimensioni. Per questo abbiamo bisogno di Julia”.
– Premio Nobel Thomas J. Sargent
Riferimenti: