Benvenuti alla prima edizione dell'aggiornamento mensile Synapse in Microsoft Fabric! Visita il sito del blog la prima settimana del mese per vedere cosa hanno fatto i nostri team. Questo blog tratterà le 4 esperienze Synapse in Fabric: Data Warehouse, Data Engineering, Data Science e Real-Time Analytics.
Guarda il nostro video complementare qui sotto e continua a leggere per tutti gli annunci che abbiamo per te per questo mese! Siamo entusiasti che tu sia qui!
Contenuti
- Magazzino dati
- Ingegneria dei dati
- Scienza dei dati
- Analisi in tempo reale
Synapse Data Warehouse è la nuova generazione di data warehousing in Microsoft Fabric, il primo data warehouse transazionale a supportare in modo nativo un formato dati aperto che consente ai team IT, agli ingegneri dei dati e agli utenti aziendali di collaborare senza problemi ed estrarre informazioni utili dai propri dati, il tutto senza compromettere sicurezza o governance aziendale. Proprio come la precedente generazione di data warehouse, SQL fornisce garanzie transazionali ACID multitabella. Si basa sul consolidato motore SQL Query Optimizer e Distributed Query Processing, ma è arricchito dai miglioramenti chiave riportati di seguito che aggiungono un nuovo valore significativo alle aziende.
Alcune delle esperienze chiave di Synapse Data Warehouse lanciate come parte di Microsoft Fabric at Build sono:
- Completamente gestito: questo nuovo data warehouse è una soluzione SaaS completamente gestita ed estende senza sforzo le moderne architetture di dati sia agli sviluppatori professionisti che amano scrivere codice, sia ai cittadini appassionati senza competenze di codifica. Ciò che prima le aziende richiedevano mesi per essere realizzato, ora può essere fatto in pochi minuti in modo efficiente.
- Nessun provisioning e gestione delle risorse:invece di eseguire il provisioning di cluster dedicati, si basa su un'infrastruttura di elaborazione completamente serverless in cui le risorse vengono fornite in millisecondi man mano che arrivano richieste di lavoro. Le aziende beneficiano dell'efficienza delle risorse e pagano solo per ciò che utilizzano.
- Separazione di archiviazione ed elaborazione:i nodi di elaborazione utilizzati sono indipendenti dallo storage e consentono alle aziende di scalare e pagare per ciascuno di essi separatamente.
- Standard di dati aperti:i dati non sono bloccati nel formato proprietario SQL Server ma sono archiviati nello standard dati aperto di Delta-Parquet in Microsoft OneLake fornendo interoperabilità non solo con tutti i carichi di lavoro in Fabric ma anche con l'ecosistema Spark senza richiedere alcuno spostamento di dati.
- Interrogazioni incrociate:come risultato del supporto standard dei dati aperti, i dati nel Lake, elaborati da un carico di lavoro Fabric o da qualsiasi altro motore di calcolo, possono essere interrogati e sottoposti a cross-join senza effettuare alcuna copia dei dati.
- Ridimensionamento automatico:scala automaticamente le risorse all'istante man mano che i requisiti di query e utilizzo aumentano e le riduce quando non c'è più bisogno di tali risorse, il tutto senza alcun intervento da parte dell'utente.
- Auto-ottimizzazione: rileva e isola automaticamente i carichi di lavoro per fornire prestazioni prevedibili. Le prestazioni migliori si basano sulla memorizzazione nella cache, che è automatica e multilivello in base all'attività. I piani di query generati sono ottimali. Non è necessario assumere ingegneri altamente qualificati per gestire i gruppi di carichi di lavoro o ottimizzare il data warehouse.
- Completamente integrato: è completamente integrato con tutti i carichi di lavoro Fabric e pronto all'uso per qualsiasi sviluppatore. Gli utenti possono continuare a beneficiare delle ricche funzionalità del motore SQL utilizzando il linguaggio T-SQL o una semplice interfaccia utente. Tutto questo con i continui vantaggi dell'ecosistema SQL.
Scopri di più sul data warehouse in Microsoft Fabric leggendoPresentazione del data warehouse Synapse in Microsoft Fabrice guardareCostruisci il 2023: modernizza il tuo data warehouse aziendale, genera valore dai dati con Fabric.
Synapse Data Engineering è una delle esperienze principali di Microsoft Fabric. Microsoft Fabric consente a team di professionisti dei dati di collaborare senza problemi, end-to-end sui propri progetti di analisi, che vanno dall'integrazione dei dati al data warehousing, alla scienza dei dati e alla business intelligence. Con l'ingegneria dei dati come esperienza fondamentale in Fabric, gli ingegneri dei dati si sentiranno come a casa, potendo sfruttare la potenza di Apache Spark per trasformare i propri dati su larga scala e costruire una solida architettura Lakehouse.
Alcune delle esperienze chiave di Synapse Data Engineering lanciate come parte di Microsoft Fabric at Build sono:
- Costruisci una casa sul lago per tutti i tuoi dati organizzativi:Lakehouse combina il meglio del Data Lake e del Warehouse, eliminando le difficoltà derivanti dall'acquisizione, trasformazione e condivisione dei dati organizzativi, il tutto in un formato aperto.
- Runtime con ottime prestazioni predefinite e robusti controlli di amministrazione:l'anteprima pubblica viene fornita con "Runtime 1.1" che include Spark 3.3.1, Delta 2.2 e Python 3.10. Per eliminare le difficoltà durante l'avvio, Spark Runtime è precablato in ogni area di lavoro Microsoft Fabric.
- Esperienza dello sviluppatore:Il nostro obiettivo è che ogni ingegnere dei dati possa avere un'esperienza di creazione piacevole, indipendentemente dallo strumento scelto.
Scopri di più sull'ingegneria dei dati in Fabric leggendoPresentazione di Synapse Data Engineering in Microsoft Fabrice guardareCostruisci il 2023: usa Spark per accelerare l'architettura della tua casa sul lago con Microsoft Fabric.
Synapse Data Science in Microsoft Fabric consente ai professionisti della scienza dei dati di lavorare senza problemi sugli stessi dati protetti e governati preparati dai team di ingegneria dei dati. Ciò elimina la necessità di copiare i dati e di trovare modi per fornire ai team di data science un accesso sicuro ai dati. In Microsoft Fabric, il supporto aperto di Delta Lake consente agli utenti di data science di modificare le versioni dei set di dati per creare codice di machine learning riproducibile. Inoltre, gli utenti di data science hanno accesso a un'ampia gamma di esperienze introduttive di facile utilizzo, strumenti low-code ed esperienze di creazione di codice con Notebook e Visual Studio Code. Synapse Data Science in Microsoft Fabric fornisce anche un ricco set di strumenti ML integrati. Ad esempio, il modello MLFlow e il monitoraggio degli esperimenti, basati sul machine learning di Azure, sono integrati. La libreria SynapseML Spark fornisce strumenti ML scalabili e gli utenti possono fornire rapidamente previsioni a Power BI con la nuova funzionalità PBI Direct Lake. Infine, la collaborazione semplificata tra i diversi ruoli di analisi rende i passaggi fluidi e i team più produttivi.
Alcune delle principali esperienze di Synapse Data Science lanciate nell'ambito di Microsoft Fabric at Build sono:
- Preparazione dei dati e generazione del codice con Data Wrangler
- Modelli ed esperimenti di ML come cittadini di prima classe con MLFlow
- SynapseML, una libreria completa di machine learning per Spark
- Arricchisci i dati nella tua Lakehouse con PREDICT scalabile
- Supporto per la lingua R
Scopri di più sulla scienza dei dati nel Fabric leggendoPresentazione di Synapse Data Science in Microsoft Fabric e guardareBuild 2023: modelli per risultati con flussi di lavoro di data science end-to-end in Microsoft Fabric.
Con Real-Time Analytics, le organizzazioni possono semplificare l'integrazione dei dati e concentrarsi sull'ampliamento della propria soluzione di analisi, democratizzando al tempo stesso i dati per tutti, dai data scientist ai data engineer avanzati. Real-Time Analytics consente un rapido accesso agli insight sui dati attraverso lo streaming, l'indicizzazione e il partizionamento automatico dei dati e utilizza query e visualizzazioni generate automaticamente, il tutto preservando potenti capacità analitiche. La piattaforma è ottimizzata per lo streaming di dati di serie temporali e utilizza un linguaggio di query e un motore con prestazioni eccezionali per la ricerca di dati strutturati, semi-strutturati e non strutturati.
Alcune delle esperienze chiave di Synapse Real-Time Analytics lanciate come parte di Microsoft Fabric at Build sono:
- Acquisisci dati da qualsiasi origine e in qualsiasi formato, senza la necessità di creare modelli di dati complessi o creare script per trasformare i dati.
- Scala fino a una quantità illimitata di dati, da gigabyte a petabyte, con scalabilità illimitata su query e utenti simultanei.
- Offre la flessibilità necessaria per lavorare con formati di dati strutturati, semistrutturati o non strutturati, compreso il testo libero
- Esperienza Get Data semplificata per importare dati da qualsiasi formato e origine.
- Generazione di report Power BI con un clic.
- Una copia logica: i dati possono essere disponibili per Microsoft OneLake ed esposti ad altre esperienze Fabric.
- Veramente serverless: nessuna selezione di SKU.
- Disponibilità dei dati in streaming in tempo reale in pochi secondi dall'acquisizione all'interrogazione.
- Interrogazione dei dati OneLake tramite scorciatoie OneLake.
- Connettività perfetta con Azure Data Explorer per i database tramite connessione cloud.
- Trasformazione di strutture dati complesse in tempo reale.
Scopri di più sull'analisi in tempo reale in Fabric leggendoRileva, analizza e genera insight con Synapse Real-Time Analytics in Microsoft Fabrice guardareCostruisci il 2023: rileva, analizza e genera insight con l'analisi in tempo reale in Microsoft Fabric.