Questo corso insegna come sviluppare analisi dei dati tramite Microsoft Fabric che offre una suite completa di servizi, tra cui datalake, ingegneria dei dati e integrazione dei dati.
Fabric è un prodotto altamente integrato, end-to-end, facile da usare e progettato per venire incontro alle esigenze di semplificazione degli analisti.
Il corso sviluppa le competenze di base dei principi di ingegneria dei dati presenti in Microsoft Fabric, e si concentra in particolare sul concetto di "lakehouse".
Presenta le potenti funzionalità offerte da Apache Spark per l'elaborazione dei dati distribuiti e le tecniche essenziali per conseguire una gestione efficiente dei dati, il controllo delle versioni e l'affidabilità usando tabelle di Delta Lake.
Illustra inoltre i processi di orchestrazione e inserimento dati usando i flussi di dati (Gen2) e le pipeline di Data Factory.
Questo corso è costituito da una combinazione di lezioni ed esercizi pratici che prepareranno gli studenti a usare correttamente i lakehouse in Microsoft Fabric.
Al termine del corso, i partecipanti saranno in grado di:
- Applicare i principi di ingegneria dei dati con Microsoft Fabric
- Comprendere e utilizzare il concetto di "lakehouse" nell'elaborazione dei dati
- Sfruttare le funzionalità di Apache Spark per l'elaborazione distribuita dei dati
- Gestire dati in modo efficiente con tecniche di controllo delle versioni e affidabilità attraverso le tabelle di Delta Lake
- Implementare processi di orchestrazione e inserimento dati utilizzando i flussi di dati (Gen2) e le pipeline di Data Factory
I destinatari principali di questo corso sono i professionisti dei dati che hanno già familiarità con la modellazione, l'estrazione e l'analisi dei dati, che siano interessati ad approfondire l'architettura dei lakehouse, la piattaforma Microsoft Fabric e come abilitare l'analisi end-to-end usando queste tecnologie.
Introduzione all'analisi end-to-end con Microsoft Fabric
- Esplorare l'analisi end-to-end con Microsoft Fabric
- Team di dati e Microsoft Fabric
- Abilitare e usare Microsoft Fabric
Introduzione ai lakehouse in Microsoft Fabric
- Esplorare Microsoft Fabric Lakehouse
- Utilizzare Microsoft Fabric Lakehouses
- Esplorare e trasformare i dati in una lakehouse
Usare Apache Spark in Microsoft Fabric
- Preparare l'uso di Apache Spark
- Eseguire codice Spark
- Usare i dati in un dataframe Spark
- Usare i dati con Spark SQL
- Visualizzare i dati in un notebook Spark
Usare le tabelle Delta Lake in Microsoft Fabric
- Informazioni su Delta Lake
- Creare tabelle delta
- Usare tabelle delta in Spark
- Usare tabelle delta con dati di streaming
Inserire dati con flussi di dati Gen2 in Microsoft Fabric
- Informazioni sui flussi di dati (Gen2) in Microsoft Fabric
- Esplorare i flussi di dati (Gen2) in Microsoft Fabric
- Integrare flussi di dati (Gen2) e pipeline in Microsoft Fabric
- Il corso si svolgerà in modalità online live streaming, con il docente che terrà le lezioni in diretta. I partecipanti dovranno avere a disposizione un Personal Computer e, preferibilmente, un secondo schermo.
- Le lezioni saranno registrate e le registrazioni saranno accessibili ai partecipanti per un periodo di due mesi dalla fine del corso.
- Saranno forniti materiali didattici di supporto, come MOC, libri o altre risorse, a seconda della disponibilità.
- Al termine del corso, coloro che avranno partecipato ad almeno l'80% delle lezioni riceveranno un attestato di frequenza.
È necessario avere familiarità con la terminologia e i concetti di base relativi ai dati.