Streamlit vuole rivoluzionare la creazione di applicazioni di machine learning e scienza dei dati, ottenendo un finanziamento di serie A di 21 milioni di dollari

All’inizio eravamo confusi quando abbiamo ricevuto la notizia. Abbiamo interpretato “quadro applicativo per l’apprendimento automatico e la scienza dei dati” nel senso di un nuovo framework per lavorare con i dati, come PyTorch, DeepLearning4j e Neuton, solo per citarne alcuni tra molti altri là fuori.
Quindi, la nostra prima reazione è stata: un altro, com’è diverso? La verità è che Streamlit non è un framework per lavorare con i dati in sé. Piuttosto, è un framework per la creazione di applicazioni basate sui dati. Ciò rende diverso l’avvio e c’è di più.
guida esecutiva
Che cos’è l’apprendimento automatico? Tutto quello che devi sapere
Ecco come è correlato all’intelligenza artificiale, come funziona e perché è importante.
Per saperne di più
Streamlit è rivolto a persone che non necessariamente conoscono o si preoccupano molto dello sviluppo di applicazioni: i data scientist. È stato creato da un team rock star di data scientist che si è incontrato nel 2013 mentre lavorava su Google X, è open source e si è diffuso a macchia d’olio, contando circa 200.000 applicazioni costruite dalla fine del 2019.
Oggi Streamlit ha annunciato di aver ottenuto 21 milioni di dollari in finanziamenti di serie A. ZDNet connesso con il CEO Adrien Treuille per discutere cosa rende speciale Streamlit e dove sta andando, e in generale le applicazioni basate sui dati.
Per ascoltare la conversazione con Treuille nella sua interezza, puoi andare al podcast Orchestrate All the Things.
Da zero a eroe: da set di dati e modelli alle applicazioni
L’investimento è stato co-guidato da Gradient Ventures e GGV Capital, con la partecipazione aggiuntiva di Bloomberg Beta, Elad Gil, Daniel Gross e altri. Glenn Solomon, managing partner di GGV Capital, ha affermato che:
“Adattarsi rapidamente a nuove informazioni e approfondimenti è una delle maggiori sfide che le aziende devono affrontare oggi. Streamlit è all’avanguardia nell’aiutare i team di data science ad accelerare il time-to-market e ad amplificare il lavoro di machine learning in aziende di tutte le dimensioni in un’ampia varietà di settori In GGV siamo molto entusiasti di sostenere questo eccezionale team fondatore e supportare i loro ambiziosi piani di crescita globale”.
Prendiamolo dall’inizio, allora. Nelle parole di Treuille, lui e i suoi co-fondatori sono diventati imprenditori attraverso il mondo accademico, facendo apprendimento automatico, big data e intelligenza artificiale prima che fossero chiamati con questi nomi, e certamente prima che fossero fantastici. Durante i suoi periodi nei team di Google X e Zoox AI, Treuille ha osservato uno schema.
La promessa dell’apprendimento automatico e dell’intelligenza artificiale è stata spesso sequestrata in quei gruppi e non ha influenzato l’organizzazione nel modo migliore o semplice possibile. Ciò ha portato Treuille a iniziare a lavorare su un progetto domestico per risolvere questo problema. Alla fine, ha iniziato a essere utilizzato da un certo numero di ingegneri e a crescere molto rapidamente. Poi sono arrivati gli investimenti e un grande lancio open source.
Streamlit sta lavorando per consentire ai data scientist di sviluppare applicazioni basate sui dati in una frazione del tempo normalmente necessario
metamorworks, Getty Images/iStockphotoStreamlit è cresciuto da un progetto individuale a essere utilizzato in un certo numero di aziende Fortune 500 e oltre, sotto il radar, fino ad oggi. E ha funzionato in questo modo per una serie di motivi.
In primo luogo, Treuille ei suoi co-fondatori hanno sfruttato la loro rete. In secondo luogo, hanno reso open source Streamlit, che ha reso facile per tutti l’adozione e la sperimentazione. Terzo, e forse più importante, hanno catturato quello che Treuille ha chiamato lo Zeitgeist: hanno offerto una soluzione a un problema che i data scientist e le organizzazioni che li impiegano stanno affrontando:
Come passare dalla manipolazione di set di dati e modelli alla distribuzione di un’applicazione che li utilizza in produzione. In sostanza, per fare questo, un certo numero di persone deve lavorare insieme. Per lo meno, data scientist e sviluppatori di applicazioni. Come al solito in situazioni come queste, competenze e cultura differiscono e collaborare costa tempo e denaro.
Streamlit cita Delta Dental come esempio. Gli è stato detto che l’utilizzo dell’IA per analizzare il traffico del call center sarebbe costato una cifra considerevole e avrebbe richiesto un anno. Un data scientist di Delta Dental ha invece utilizzato Streamlit e ha costruito un MVP in una settimana, un prototipo in tre settimane e l’ha messo in produzione in tre mesi, il tutto a costo zero per l’azienda, afferma Streamlit.
Portare gli sviluppatori di applicazioni fuori dallo sviluppo di applicazioni
Per capire come ciò sia possibile, dobbiamo approfondire il funzionamento di Streamlit. Streamlit cerca di portare il team di sviluppo delle applicazioni fuori dal quadro, consentendo ai data scientist di sviluppare le proprie applicazioni.
Treuille elabora l’enigma di convincere i data scientist a creare applicazioni o convincere i costruttori di applicazioni a lavorare con i data scientist. I data scientist non hanno necessariamente le competenze di base per la creazione di applicazioni e le loro applicazioni finiscono per non essere mantenibili. I costruttori di applicazioni passano ad altre applicazioni, con conseguente blocco delle funzionalità.
Quello che fa Streamlit è che consente ai data scientist di creare applicazioni come sottoprodotto del loro flusso di lavoro. Prende i loro script Python e li trasforma in applicazioni, consentendo loro di inserire alcune righe di codice che astraggono i costrutti dell’applicazione come i widget.
Non è ortodosso. Gli ingegneri del software sosterrebbero che c’è un motivo per cui esistono framework di sviluppo web, per esempio. E ci sono molti anni di esperienza e migliori pratiche distillate in loro. Buttarli via tutti a favore di script Python annotati sembrerebbe una cattiva pratica, per non parlare di una minaccia esistenziale.
Treuille si scusa per dissentire. A sostegno del suo punto di vista, oltre all’adozione diffusa, sostiene che questo è un modo diverso di sviluppare applicazioni. Le applicazioni sono diverse, l’ambito è diverso e Streamlit non intende reinventare la ruota di sviluppo delle applicazioni, ma piuttosto integrarla:
“Ci vediamo come un livello di traduzione tra il mondo Python e il mondo del framework web. Ad esempio, tutto in Streamlit è scritto in React. Quando hai scoperto la gioia di React, è come programmare il nirvana. Possiamo accettare quasi tutto in l’ecosistema React e traducilo in Streamlit quasi senza sforzo. Quindi la nostra tecnologia di base è davvero quel livello di traduzione”.
Da uno script Python a un’applicazione web, con poche righe di codice in più. Immagine: Streamlit
Treuille ha aggiunto che presto Streamlit consentirà a qualsiasi sviluppatore di tradurre qualsiasi bit di tecnologia web in un’unica funzione Python, consentendo così ai due ecosistemi di prosperare indipendentemente l’uno dall’altro. Lo stesso approccio viene adottato anche per quanto riguarda l’utilizzo di altri framework Python come Dask o Ray, ad esempio:
“Streamlit è molto modesto, in un certo senso, molto piccolo. E quindi ci sediamo accanto a qualsiasi cosa: l’intero ecosistema di dati Python. E questo è davvero eccitante per via della storia più grande qui, che è molto, molto più grande di Streamlit. È il data world che un tempo era un grande database, poi Excel, poi Tableau e, più recentemente, Looker.
Questo tsunami sta arrivando, che è open source e machine learning, e Python e Pandas, SciKit imparano. Si tratta fondamentalmente di 20 anni di ricerca accademica sull’apprendimento automatico, che si schianta nel mondo dei dati e lo trasforma completamente. E ci vediamo solo come una piccola tavola da surf in quell’onda, semplicemente cavalcandola o cercando di cavalcarla nel miglior modo possibile”.
C’è un’app per quello. Dovresti costruirlo con Streamlit?
Questo può spiegare l’approccio, ma non la portata. C’è di più nelle applicazioni oltre ai dati e alle funzionalità basate sui dati. Se sei Netflix, ad esempio, il core business ruota attorno allo streaming e le applicazioni dovrebbero rispecchiarlo. Dovrebbero consentire alle persone di gestire i pagamenti, guardare film in streaming e così via.
I consigli si aggiungono a questo, basati sui dati e sull’apprendimento automatico. Ma non sono il core business. Treuille ha riconosciuto che Streamlit non aspira a essere il front-end per l’intera azienda: “Se Netflix è venuto da noi e ha detto, ehi, vogliamo scrivere il sito Web dell’app Netflix in Streamlit, diremmo che non pensiamo che sia un buona idea.”
Streamlit non è un framework di sviluppo di applicazioni per scopi generici. Quello che fa, in un certo senso, è la stessa cosa che hanno fatto i framework delle applicazioni di business intelligence per i database. Fornisce un framework che consente un rapido accesso alla fonte di valore sottostante. Per i framework BI, si trattava di dati archiviati nei database. Per Streamlit, sono modelli di apprendimento automatico.
Ci chiederemmo ancora quanti data scientist, o i loro manager, sarebbero felici di aggiungere il compito di mantenere le loro applicazioni Streamlit oltre a tutto ciò che già fanno. Ci si chiederebbe anche se gli sviluppatori di applicazioni possano, o debbano, essere completamente esclusi dal quadro, anche per applicazioni basate sui dati create appositamente, man mano che crescono nel tempo. Ma Streamlit è all’inizio del suo ciclo di vita per essere in grado di rispondere a queste domande.
I data scientist non sono necessariamente le persone più adatte per sviluppare applicazioni. Immagine: Streamlit
Ciò, tuttavia, non sembra aver fermato utenti o investitori. A proposito, c’è un’altra domanda interessante qui. Qual è il modello di business di Streamlit e come è arrivato a convincere le persone a investire denaro in esso? In poche parole: Software come servizio nel cloud, con un tweak.
Puoi utilizzare Streamlit per sviluppare qualsiasi applicazione senza alcuna restrizione. Quello per cui paghi, facoltativamente, è l’implementazione. Gli utenti possono distribuire Streamlit ovunque vogliano, da soli. Ma Streamlit offre la propria soluzione cloud, chiamata Streamlit for Teams, che include funzionalità aggiuntive per la collaborazione e la distribuzione.
Treuille era fermamente convinto della strategia di vendita dal basso verso l’alto di Streamlit: solo portare il software là fuori, consentire alle persone di iniziare a creare applicazioni e quindi convertire una parte di esse in utenti paganti.
Il quadro più ampio: Software 2.0
Streamlit è interessante se non altro a causa del diverso paradigma che porta allo sviluppo delle applicazioni. Che, a sua volta, fa parte di quello che Treuille vede come un modo diverso di costruire applicazioni:
“Il quadro più ampio è il modo in cui l’ecosistema Python e la comunità di sviluppatori open source, sviluppatori accademici e aziende – TensorFlow è creato da Google, PyTorch da Facebook – come tutte queste diverse forze si sono unite per creare questo incredibilmente potente ecosistema di dati. Questo può davvero rivoluzionare lo spettacolo. Ha davvero proprietà diverse da un semplice foglio di calcolo e un elenco delle tue vendite nell’ultimo anno. “
Alcune persone lo chiamano Software 2.0. Quello che ci chiedevamo, tuttavia, era se il mondo fosse davvero pronto per questo. In molti modi, la maggior parte delle organizzazioni probabilmente non ha ancora ottenuto il software 1.0 in modo corretto. Controllo della versione, gestione delle versioni, strumenti di sviluppo software e processi: non sono cose esattamente banali.
Ora aggiungi a ciò: gestione dei set di dati, provenienza, apprendimento automatico e ingegneria delle funzionalità, controllo delle versioni, per citare solo alcune delle preoccupazioni dello sviluppo basato sui dati e quello che ottieni è un’esplosione combinatoria. Treuille ha ammesso che è davvero parte dello Zeitgeist negli ultimi due anni.
Treuille vede Streamlit come parte di un’ondata di nuove startup come Tecton o Weights and Biases, che stanno essenzialmente producendo ogni livello di quella pila. Crede che persone di talento stiano lavorando su questo e sta venendo alla luce. La sua opinione su come ottenere con il programma:
“Se sei un’azienda e ti chiedi come entrare in questo mondo, qual è anche il primo passo, direi: vai a Insight Data Science. Assumi uno dei loro ingegneri di machine learning o data scientist che stanno finendo la scuola per data scientist, e poi dai loro Streamlit.”
Primer
- Cos’è l’IA? Tutto quello che devi sapere
- Che cos’è l’apprendimento automatico? Tutto quello che devi sapere
- Che cos’è l’apprendimento profondo? Tutto quello che devi sapere
- Che cos’è l’intelligenza artificiale generale? Tutto quello che devi sapere