Novità per i clienti di Oracle: MySQL HeatWave Lakehouse passa in disponibilità generale. Si tratta di un un servizio cloud di calcolo in-memory che permette di lanciare query su dati archiviati in object storage ottenendo elevate prestazioni. A detta di Oracle, la velocità è la stessa delle query eseguite sui dati presenti nel database.
Oracle sottolinea che si tratta dell’unico servizio cloud sul mercato a racchiudere funzioni di’elaborazione delle transazioni, analytics in tempo reale, machine learning, esecuzione di query sui data-lake e automazione basata su apprendimento automatico. Come funziona? In sostanza, con la tecnologia HeatWave i dati (sia quelli numerici, sia quelli stringa) vengono codificati e compressi prima di essere caricati in memoria e questo comporta una maggiore velocità di elaborazione e una riduzione dell’impiego di memoria (e dunque dei costi).
In LakeHouse le query sui file object store sono eseguite direttamente da HeatWave senza copiare i dati nel database, con vantaggi di velocità di caricamento dei dati, velocità del provisioning del cluster e automazione. Il servizio può gestire una varietà di formati di file di archiviazione a oggetti (tra cui CSV e Parquet), permette di esportare file da altri database e può combinare file dati da object storage e dati dai database transazionali MySQL nella medesima query. La funzionalità integrata MySQL Autopilot può, grazie al machine learning, imparare sulla base delle query già eseguite e migliorare quelle successive, oltre a creare in automatico metadati per i file degli oggetti. Il servizio ha un’architettura scale-out che permette un elevato parallelismo per eseguire il provisioning del cluster e consente di caricare i dati e elaborare le query con un massimo di 512 nodi.
L’azienda, come d’abitudine, non manca di evidenziare il confronto con la concorrenza: come evidenziato da un benchmark TPC-H* da 500 TB, le performance delle query di MySQL HeatWave Lakehouse sono nove volte più veloci di Amazon Redshift, 17 volte più veloci di Snowflake, 17 volte più veloci di Databricks e 36 volte più veloci di Google BigQuery. E il servizio è superiore a tutti gli altri citati anche per quanto riguarda il caricamento dei dati memorizzati in object storage.
“Più dell'80% dei dati è memorizzato in file system e questa percentuale sta crescendo”, ha dichiarato Edward Screven, chief corporate architect di Oracle. “I clienti desiderano integrare e analizzare questi diversi dati esterni con i propri dati transazionali interni, ma spesso è un processo troppo complesso o costoso. MySQL HeatWave Lakehouse consente ai clienti di ottenere facilmente preziose informazioni in tempo reale combinando i propri dati nell’object storage con i dati del database; allo stesso tempo le prestazioni delle query sono notevolmente più elevate, i dati sono caricati molto più velocemente e il costo è inferiore”.
Oracle propone il servizio MySQL HeatWave Lakehouse attraverso il proprio cloud (Oracle Cloud Infrastructure, Oci), su macchine che utilizzano processori Amd Epyc, ma anche su Amazon Web Services e su Microsoft Azure (in questo caso, all’interno di Oracle Database Service).