- Articolo
Per impostazione predefinita, Synapse Studio crea direttamente sul servizio Synapse. Se hai bisogno di collaborazione utilizzando Git per il controllo del codice sorgente, Synapse Studio ti consente di associare il tuo spazio di lavoro a un repository Git, Azure DevOps o GitHub.
Questo articolo descrive come configurare e lavorare in un'area di lavoro Synapse con il repository git abilitato. Evidenziamo anche alcune best practice e una guida alla risoluzione dei problemi.
Nota
Per utilizzare GitHub in Azure Gov e Microsoft Azure gestito da 21Vianet, puoi portare la tua applicazione GitHub OAuth in Synapse Studio per l'integrazione git. L'esperienza di configurazione è la stessa con ADF. Puoi fare riferimento ablog degli annunci.
Prerequisiti
Gli utenti devono avere il ruolo di collaboratore di Azure (RBAC di Azure) o un ruolo superiore nell'area di lavoro Synapse per configurare, modificare le impostazioni e disconnettere un repository Git con Synapse.
Configura il repository Git in Synapse Studio
Dopo aver avviato Synapse Studio, puoi configurare un repository git nel tuo spazio di lavoro. Uno spazio di lavoro Synapse Studio può essere associato a un solo repository git alla volta.
Metodo di configurazione 1: barra globale
Nella barra globale di Synapse Studio, seleziona il fileSinapsi dal vivomenu a discesa, quindi selezionareConfigura il repository del codice.
Metodo di configurazione 2: Gestisci hub
Vai all'hub Gestisci di Synapse Studio. SelezionareConfigurazione di GitnelControllo della fontesezione. Se non hai alcun repository connesso, fai clic suConfigura.
È possibile connettere il repository git di Azure DevOps o GitHub nell'area di lavoro.
Connettiti con Azure DevOps Git
È possibile associare un'area di lavoro Synapse a un repository Azure DevOps per il controllo del codice sorgente, la collaborazione, il controllo delle versioni e così via. Se non disponi di un repository Azure DevOps, seguiqueste istruzioniper creare le risorse del tuo repository.
Impostazioni del repository Git di Azure DevOps
Quando ti connetti al repository git, seleziona innanzitutto il tipo di repository come Azure DevOps git, quindi seleziona un tenant di Azure AD dall'elenco a discesa e fai clic suContinua.
Il riquadro di configurazione mostra le seguenti impostazioni git di Azure DevOps:
Collocamento | Descrizione | Valore |
---|---|---|
Tipo di archivio | Tipo di repository di codice di Azure Repos. | Azure DevOps Git o GitHub |
Accesso tra tenant | Casella di controllo per accedere con un account multi-tenant. | deselezionato (predefinito) |
Azure Active Directory | Il nome del tenant di Azure AD. |
|
Account Azure DevOps | Il nome dell'organizzazione Azure Repos. È possibile individuare il nome dell'organizzazione Azure Repos all'indirizzohttps://{nome organizzazione}.visualstudio.com . Puoiaccedere all'organizzazione Azure Reposper accedere al tuo profilo Visual Studio e vedere i tuoi repository e progetti. |
|
Nome del progetto | Il nome del progetto Azure Repos. È possibile individuare il nome del progetto Azure Repos inhttps://{nome organizzazione}.visualstudio.com/{nome progetto} . |
|
Nome del repository | Il nome del repository del codice di Azure Repos. I progetti Azure Repos contengono repository Git per gestire il codice sorgente man mano che il progetto cresce. Puoi creare un nuovo repository o utilizzare un repository esistente già presente nel tuo progetto. |
|
Ramo di collaborazione | Il ramo di collaborazione di Azure Repos usato per la pubblicazione. Per impostazione predefinita, èmaestro . Modifica questa impostazione nel caso in cui desideri pubblicare risorse da un altro ramo. Puoi selezionare rami esistenti o crearne di nuovi |
|
Cartella root | La cartella radice nel ramo di collaborazione di Azure Repos. |
|
Importa le risorse esistenti nel repository | Specifica se importare le risorse esistenti da Synapse Studio in un repository Git di Azure Repos. Seleziona la casella per importare le risorse dello spazio di lavoro (eccetto i pool) nel repository Git associato in formato JSON. Questa azione esporta ciascuna risorsa individualmente. Quando questa casella non è selezionata, le risorse esistenti non vengono importate. | Selezionato (predefinito) |
Importa la risorsa in questo ramo | Selezionare in quale ramo vengono importate le risorse (script SQL, notebook, definizione di lavoro Spark, set di dati, flusso di dati, ecc.). |
Puoi anche utilizzare il collegamento al repository per puntare rapidamente al repository git a cui desideri connetterti.
Nota
La sinapsi di Azure non supporta la connessione al repository Prem Azure DevOps.
Utilizzare un tenant di Azure Active Directory diverso
Il repository Git di Azure Repos può trovarsi in un tenant di Azure Active Directory diverso. Per specificare un tenant di Azure AD diverso, devi disporre delle autorizzazioni di amministratore per la sottoscrizione di Azure che stai usando. Per ulteriori informazioni, vederecambiare amministratore dell'abbonamento
Importante
Per connettersi a un'altra Azure Active Directory, l'utente che ha effettuato l'accesso deve far parte di tale Active Directory.
Utilizza il tuo account Microsoft personale
Per usare un account Microsoft personale per l'integrazione Git, puoi collegare il tuo repository di Azure personale ad Active Directory della tua organizzazione.
Aggiungi il tuo account Microsoft personale ad Active Directory della tua organizzazione come ospite. Per ulteriori informazioni, vedereAggiungere utenti di collaborazione B2B di Azure Active Directory nel portale di Azure.
Accedi al portale di Azure con il tuo account Microsoft personale. Quindi passa ad Active Directory della tua organizzazione.
Vai alla sezione Azure DevOps, dove ora vedi il tuo repository personale. Seleziona il repository e connettiti con Active Directory.
Dopo questi passaggi di configurazione, il tuo repository personale sarà disponibile quando configuri l'integrazione Git in Synapse Studio.
Per altre informazioni sulla connessione di Azure Repos ad Active Directory dell'organizzazione, vedereConnetti la tua organizzazione ad Azure Active Directory.
Usare un account Azure DevOps multi-tenant
Quando Azure DevOps non si trova nello stesso tenant dell'area di lavoro Synapse, è possibile configurare l'area di lavoro con un account Azure DevOps multi-tenant.
Seleziona ilAccesso tra tenantopzione e fare clicContinua
SelezionareOKnella finestra di dialogo.
clicUtilizza un altro accounte accedi con il tuo account Azure DevOps.
Dopo aver effettuato l'accesso, scegli la directory e il repository e configuralo di conseguenza.
Nota
Per accedere all'area di lavoro, è necessario utilizzare il primo accesso per accedere al proprio account utente dell'area di lavoro Synapse. L'account Azure DevOps multi-tenant viene utilizzato solo per accedere e ottenere l'accesso al repository Azure DevOps associato a questa area di lavoro Synapse.
Connettiti con GitHub
È possibile associare uno spazio di lavoro a un repository GitHub per il controllo del codice sorgente, la collaborazione e il controllo delle versioni. Se non disponi di un account o di un repository GitHub, seguiqueste istruzioniper creare le tue risorse.
L'integrazione GitHub con Synapse Studio supporta sia GitHub pubblico (ovverohttps://github.com) e GitHub Enterprise. Puoi utilizzare repository GitHub sia pubblici che privati purché disponi dell'autorizzazione di lettura e scrittura per il repository in GitHub.
Impostazioni di GitHub
Quando ti connetti al tuo repository git, seleziona prima il tipo di repository come GitHub, quindi fornisci il tuo account GitHub, l'URL di GitHub Enterprise Server se utilizzi GitHub Enterprise Server o il nome della tua organizzazione GitHub Enterprise se utilizzi GitHub Enterprise Cloud. SelezionareContinua.
Nota
Se utilizzi GitHub Enterprise Cloud, lascia il fileUtilizza GitHub Enterprise Servercasella di controllo deselezionata.
Il riquadro di configurazione mostra le seguenti impostazioni del repository GitHub:
Collocamento | Descrizione | Valore |
---|---|---|
Tipo di archivio | Tipo di repository di codice di Azure Repos. | GitHub |
Utilizza GitHub Enterprise | Casella di controllo per selezionare GitHub Enterprise | deselezionato (predefinito) |
URL di GitHub Enterprise | L'URL root di GitHub Enterprise (deve essere HTTPS per il server GitHub Enterprise locale). Per esempio:https://github.miodominio.com . Richiesto solo seUtilizza GitHub Enterpriseè selezionato |
|
Conto GitHub | Il nome del tuo account GitHub. Questo nome può essere trovato da https://github.com/{nome account}/{nome repository}. Se accedi a questa pagina ti viene richiesto di inserire le credenziali OAuth GitHub per il tuo account GitHub. |
|
Nome dell'archivio | Il nome del tuo repository di codice GitHub. Gli account GitHub contengono repository Git per gestire il codice sorgente. Puoi creare un nuovo repository o utilizzare un repository esistente già presente nel tuo account. |
|
Ramo di collaborazione | Il ramo di collaborazione GitHub utilizzato per la pubblicazione. Per impostazione predefinita, itsmaster. Modifica questa impostazione nel caso in cui desideri pubblicare risorse da un altro ramo. |
|
Cartella root | La tua cartella principale nel ramo di collaborazione GitHub. |
|
Importa le risorse esistenti nel repository | Specifica se importare le risorse esistenti da Synapse Studio in un repository Git. Seleziona la casella per importare le risorse dello spazio di lavoro (eccetto i pool) nel repository Git associato in formato JSON. Questa azione esporta ciascuna risorsa individualmente. Quando questa casella non è selezionata, le risorse esistenti non vengono importate. | Selezionato (predefinito) |
Importa la risorsa in questo ramo | Selezionare il ramo in cui vengono importate le risorse (script SQL, notebook, definizione di lavoro Spark, set di dati, flusso di dati, ecc.). |
Organizzazioni GitHub
La connessione a un'organizzazione GitHub richiede che l'organizzazione conceda l'autorizzazione a Synapse Studio. Un utente con autorizzazioni di amministratore per l'organizzazione deve eseguire i passaggi seguenti.
Connessione a GitHub per la prima volta
Se ti connetti a GitHub da Synapse Studio per la prima volta, segui questi passaggi per connetterti a un'organizzazione GitHub.
Nel riquadro di configurazione Git, inserisci il nome dell'organizzazione nel fileConto GitHubcampo. Viene visualizzata una richiesta per accedere a GitHub.
Accedi utilizzando le tue credenziali utente.
Ti viene chiesto di autorizzare Synapse come applicazione chiamataSinapsi azzurra. In questa schermata viene visualizzata un'opzione per concedere l'autorizzazione a Synapse per accedere all'organizzazione. Se non vedi l'opzione per concedere l'autorizzazione, chiedi a un amministratore di concedere manualmente l'autorizzazione tramite GitHub.
Dopo aver seguito questi passaggi, il tuo spazio di lavoro è in grado di connettersi sia ai repository pubblici che a quelli privati all'interno della tua organizzazione. Se non riesci a connetterti, prova a svuotare la cache del browser e riprovare.
Già connesso a GitHub utilizzando un account personale
Se ti sei già connesso a GitHub e hai concesso solo l'autorizzazione per accedere a un account personale, segui i passaggi seguenti per concedere le autorizzazioni a un'organizzazione.
Vai su GitHub e apriImpostazioni.
SelezionareApplicazioni. NelApp OAuth autorizzatescheda, dovresti vedereSinapsi azzurra.
Seleziona ilSinapsi azzurrae concedi l'accesso alla tua organizzazione.
Una volta completati questi passaggi, il tuo spazio di lavoro è in grado di connettersi sia ai repository pubblici che a quelli privati all'interno della tua organizzazione.
Controllo della versione
I sistemi di controllo della versione (noti anche comecontrollo della fonte) consentono agli sviluppatori di collaborare al codice e tenere traccia delle modifiche. Il controllo del codice sorgente è uno strumento essenziale per i progetti multi-sviluppatore.
Creazione di rami di funzionalità
Ogni repository Git associato a Synapse Studio ha un ramo di collaborazione. (principale
Omaestro
è il ramo di collaborazione predefinito). Gli utenti possono anche creare rami di funzionalità facendo clic+ Nuova filialenel menu a discesa del ramo.
Una volta visualizzato il riquadro del nuovo ramo, inserisci il nome del ramo della funzionalità e seleziona un ramo su cui basare il lavoro.
Quando sei pronto per unire le modifiche dal ramo funzionalità al ramo collaborazione, fai clic sul menu a discesa del ramo e selezionaCrea richiesta pull. Questa azione ti porta al provider Git dove puoi generare richieste pull, eseguire revisioni del codice e unire le modifiche al ramo di collaborazione. Puoi pubblicare sul servizio Synapse solo dal tuo ramo di collaborazione.
Configura le impostazioni di pubblicazione
Per impostazione predefinita, Synapse Studio genera i modelli dell'area di lavoro e li salva in un ramo chiamatoarea di lavoro_pubblica
. Per configurare un ramo di pubblicazione personalizzato, aggiungi apubblicare_config.json
file nella cartella principale nel ramo di collaborazione. Quando pubblichi, Synapse Studio legge questo file, cerca il campopubblicareBranch
e salva i file del modello dell'area di lavoro nella posizione specificata. Se il ramo non esiste, Synapse Studio lo creerà automaticamente. Di seguito è riportato un esempio di come appare questo file:
{ "publishBranch": "workspace_publish"}
Synapse Studio può avere un solo ramo di pubblicazione alla volta. Quando specifichi un nuovo ramo di pubblicazione, il ramo di pubblicazione originale non verrà eliminato. Se desideri rimuovere il ramo di pubblicazione precedente, eliminalo manualmente.
Pubblica modifiche al codice
Dopo aver unito le modifiche al ramo di collaborazione, fare clic suPubblicareper pubblicare manualmente le modifiche al codice nel ramo di collaborazione nel servizio Synapse.
Si apre un riquadro laterale in cui confermi che il ramo di pubblicazione e le modifiche in sospeso sono corrette. Una volta verificate le modifiche, fare clic suOKper confermare la pubblicazione.
Importante
Il ramo di collaborazione non è rappresentativo di ciò che è distribuito nel servizio. Le novità nel ramo collaborazionedovereessere pubblicato manualmente.
Passa a un repository Git diverso
Per passare a un repository Git diverso, vai alla pagina di configurazione Git nell'hub di gestione sottoControllo della fonte. SelezionareDisconnetti.
Inserisci il nome dell'area di lavoro e fai clicDisconnettiper rimuovere il repository Git associato al tuo spazio di lavoro.
Dopo aver rimosso l'associazione con il repository corrente, puoi configurare le impostazioni Git per utilizzare un repository diverso e quindi importare le risorse esistenti nel nuovo repository.
Importante
La rimozione della configurazione Git da uno spazio di lavoro non elimina nulla dal repository. L'area di lavoro Synapse contiene tutte le risorse pubblicate. Puoi continuare a modificare l'area di lavoro direttamente rispetto al servizio.
Migliori pratiche per l'integrazione Git
- Autorizzazioni. Dopo aver collegato un repository git al tuo spazio di lavoro, chiunque possa accedere al tuo repository git con qualsiasi ruolo nel tuo spazio di lavoro è in grado di aggiornare artefatti, come script SQL, notebook, definizione di lavoro Spark, set di dati, flusso di dati e pipeline in modalità git. In genere non si desidera che tutti i membri del team dispongano delle autorizzazioni per aggiornare l'area di lavoro. Concedere l'autorizzazione del repository git solo agli autori degli artefatti dell'area di lavoro Synapse.
- Collaborazione. Si consiglia di non consentire check-in diretti al ramo di collaborazione. Questa restrizione può aiutare a prevenire i bug poiché ogni check-in passa attraverso un processo di revisione della richiesta pull descritto inCreazione di rami di funzionalità.
- Modalità live di Synapse. Dopo la pubblicazione in modalità git, tutte le modifiche si riflettono nella modalità live di Synapse. Nella modalità live di Synapse, la pubblicazione è disabilitata. E puoi visualizzare ed eseguire artefatti in modalità live se ti è stata concessa la giusta autorizzazione.
- Modifica gli artefatti in Studio. Synapse studio è l'unico posto in cui puoi abilitare il controllo del codice sorgente dell'area di lavoro e sincronizzare automaticamente le modifiche su Git. Qualsiasi modifica tramite SDK, PowerShell, non viene sincronizzata con Git. Ti consigliamo di modificare sempre l'artefatto in Studio quando git è abilitato.
Risoluzione dei problemi di integrazione git
Accesso alla modalità git
Se ti è stata concessa l'autorizzazione al repository git GitHub collegato al tuo spazio di lavoro, ma non puoi accedere alla modalità Git:
Svuota la cache e aggiorna la pagina.
Accedi al tuo account GitHub.
Ramo di pubblicazione obsoleto
Se il ramo di pubblicazione non è sincronizzato con il ramo di collaborazione e contiene risorse non aggiornate nonostante una pubblicazione recente, prova a seguire questi passaggi:
Rimuovi il tuo attuale repository Git
Riconfigura Git con le stesse impostazioni, ma assicuratiImporta le risorse esistenti nel repositoryè selezionato e scegli lo stesso ramo.
Crea una richiesta pull per unire le modifiche al ramo di collaborazione
Funzionalità non supportate
- Synapse Studio non consente la selezione selettiva dei commit o la pubblicazione selettiva delle risorse.
- Synapse Studio non supporta il messaggio di commit personalizzato.
- Per impostazione predefinita, l'azione di eliminazione in Studio viene eseguita direttamente su Git
Prossimi passi
- Per implementare l'integrazione e la distribuzione continua, vedereIntegrazione e distribuzione continue (CI/CD).