SAP HANA檚 Il decimo anniversario riguarda la convergenza del cloud

hana.jpg

Credito: Qlik

Essendo questo il decimo anno di SAP HANA e, non a caso, la settimana della conferenza SAPPHIRE 2020 riconvocata digitalmente, SAP sta tracciando la tabella di marcia per la sua piattaforma dati, che, in poche parole, converge con il cloud. SAP ha annunciato il rilascio pianificato del 26 giugno e il nuovo rilascio di supporto a lungo termine per la versione 2.0 della piattaforma dati HANA, numerata SPS05. Per la maggior parte degli annunci, la disponibilità generale arriverà gradualmente nei prossimi due trimestri.

Per on-premise, SAP HANA 2.0 SPS05 è la versione definitiva

Con il supporto promesso fino al 2025, HANA 2.0 SPS05 è stato designato l’obiettivo di migrazione on-premise definitivo per gli attuali clienti di HANA 1.0, sebbene SAP continuerà la pratica corrente di rilasciare anche ulteriori aggiornamenti a breve termine. È una pratica standard per le piattaforme di database on-premise, poiché non ci si può aspettare che i clienti effettuino l’aggiornamento al ritmo di distribuzione continuo consueto nel cloud. Oracle ha adottato una strategia simile.

Un punto culminante della versione HANA 2.0 SPS05 è il supporto del cloud ibrido con SAP HANA Cloud, il database come servizio (DBaaS) completamente gestito, multi-cloud e basato sul consumo di SAP. Un nuovo gateway cloud per la connessione sicura dai database SAP HANA locali a SAP HANA Cloud fornisce il collegamento per la federazione dei dati e delle query. SAP HANA Cloud si connette a origini dati locali e remote, fornendo un’unica fonte per i dati che riduce la duplicazione dei dati. SAP HANA Cloud può scalare con più livelli di dati e, con storage e calcolo indipendenti, fornisce elasticità.

SAP HANA 2.0 SPS05 può eseguire query su HANA Cloud e restituire set di risultati sfruttando funzionalità come machine learning, spazio e grafico e query federate a un data lake nello storage cloud. Le sue capacità di virtualizzazione dei dati possono estendersi a HANA Cloud, che viene trattato come una fonte di dati remota. Inoltre, i clienti possono scegliere di accedere ai dati tramite query federate o tramite replica e la scelta può essere attivata in tempo reale. Non c’è dubbio che quando si tratta del dibattito sul database multi-modello vs adatto allo scopo, è chiaro dove si trova SAP. Ciò mette SAP in sincronia con Oracle, che sta anche promuovendo il supporto multi-modello, ma diverso dal cloud pure-play.

SAP Data Warehouse Cloud aumenta la sua impronta

Il Data Warehouse Cloud di SAP, presentato lo scorso anno, ottiene un’importante espansione della sua presenza con questa versione, estendendosi alla modellazione e all’integrazione di dati e semantica aziendale.

Per ricapitolare, SAP Data Warehouse Cloud è inteso come un servizio cloud di analisi end-to-end che va oltre il database. Ha reingegnerizzato la piattaforma dati HANA in un’architettura cloud-native distribuita con container e microservizi, con elaborazione separata dallo storage e, con l’annuncio iniziale, ha integrato HANA con funzionalità di SAP Analytics Cloud, fornendo un data warehouse con analisi self-service integrate e visualizzazione.

È più che casuale che SAP non sia stato l’unico fornitore a introdurre un servizio di data warehousing end-to-end lo scorso autunno. Microsoft ha riprogettato Azure SQL Data Warehouse in Synapse Analytics.

È un riflesso della novità dei servizi di analisi cloud end-to-end che SAP e Microsoft gli hanno fornito con diversi mix di funzionalità. Mentre SAP inizialmente si concentrava sull’integrazione di funzionalità self-service per gli analisti aziendali, l’attenzione di Microsoft si è concentrata maggiormente sul back-end, mettendo insieme il suo servizio di data warehousing con Azure Data Factory, che era finalizzato al back-end di mettere insieme le pipeline di trasformazione dei dati (Azure Synapse esteso anche al data lake attraverso il supporto del cloud storage ADLS e dell’elaborazione Spark). Azure Synapse si è integrato con un singolo clic ai servizi di analisi, tra cui Power BI e Azure Machine Learning, ma sono rimasti pacchettizzati come servizi cloud separati.

Con la nuova versione di SAP Data Warehouse Cloud, l’impronta si sta spostando anche sul lato dell’integrazione dei dati. Sebbene ciò non implichi il riconfezionamento di SAP Data Intelligence, che è l’ombrello per l’integrazione dei dati in SAP Cloud, ci sono una serie di funzionalità di flusso di dati (trasformazione) e virtualizzazione dei dati che vengono incorporate nel Data Warehouse Cloud ampliato. Ciò si rivolge a ingegneri di dati e DBA, ma per gli analisti aziendali esiste anche un altro percorso di integrazione dei dati tramite la modellazione aziendale.

Il lato del flusso di dati riguarda la creazione di pipeline di trasformazione dei dati. Fornisce una scelta di trasformazioni visive, utilizzando il trascinamento della selezione con operatori predefiniti come proiezione, aggregazione, join, filtro e unione, o per coloro che preferiscono un approccio più programmatico, c’è anche un editor di script per la creazione di trasformazioni utilizzando Python 3. Una volta sviluppate le trasformazioni, sono disponibili funzionalità per armonizzare le colonne e filtrare i dati.

Per gli analisti aziendali, esiste un altro percorso, in cui i dati vengono mappati in entità aziendali come cliente, prodotto, gerarchia di prodotti, pipeline di vendita, tempo e così via. Operando indipendentemente dal livello dati sottostante, gli utenti aziendali designano gli oggetti e quindi tali oggetti vengono mappati ai modelli di dati. Un glossario imposta i parametri per i modelli di business, inclusa l’entità organizzativa (per la quale sono definite le relazioni con altre entità), il modello dei fatti, i casi d’uso di consumo e gli scenari di autorizzazione che dettano l’accesso ai dati per utente o ruolo. A loro volta, i modelli popolano un catalogo aziendale, che è il punto di partenza per definire, scoprire, riutilizzare i modelli e governarne i cicli di vita.

Come abbiamo affermato in precedenza, il cloud offre l’opportunità ai fornitori di piattaforme dati di abbattere i silos nella toolchain. Nel cloud, il refactoring di sistemi monolitici in microservizi che vengono distribuiti in contenitori offre l’opportunità ai fornitori di dati e analisi di ripensare i silos di strumenti. Con Microsoft che ha già abboccato, e probabilmente anche Oracle, per ora sembra che offrire un’esperienza end-to-end sia il modo in cui si differenziano da AWS e GCP.

Grandi dati

  • Google lancia Spark serverless, workbench AI, nuove offerte di dati su Cloud Next
  • Lo stato dell’intelligenza artificiale: machine learning in produzione, MLOps e intelligenza artificiale incentrata sui dati
  • Dell distribuirà nuovi strumenti per velocizzare l’analisi dei dati all’edge
  • Le migliori carriere che puoi iniziare con una laurea in informatica

Leave a Reply