Paramètres pour Snowflake
Cette rubrique décrit comment configurer une nouvelle connexion Snowflake dans DataSync
Qu'est-ce que Snowflake
Snowflake est une base de données OLAP entièrement gérée et basée sur le cloud, optimisée pour le traitement par lots et les grands ensembles de données. Ses principales techniques d’optimisation sont :
-
Séparation du stockage et du calcul : le stockage et le calcul sont mis à l’échelle séparément pour optimiser les performances et les coûts.
-
Partitionnement automatique : le partitionnement des données est géré automatiquement et les données sont stockées au format colonne. Les partitions, dont la taille est généralement comprise entre 50 et 100 Mo, contiennent des statistiques telles que les valeurs minimales et maximales.
-
Traitement parallèle : grâce à l’architecture distribuée des nœuds de calcul, le traitement des requêtes est parallélisé sur plusieurs nœuds.
Snowflake ne prend pas en charge les déclencheurs (triggers) ni les index, et n’applique aucune contrainte autre que NULL/NOT NULL sur les tables standard.
Configurer une connexion Snowflake
Pour configurer une connexion de destination Snowflake :
-
Dans DataSync, créez une nouvelle connexion de destination Snowflake.
-
Remplissez les champs du panneau Propriétés de la connexion.
Paramètres de connexion
Propriété | Description |
---|---|
Compte |
Indiquez l'identificateur de compte. Dans Snowflake, ouvrez le sélecteur de compte. Sélectionnez le compte souhaité, puis View account details. L'identificateur de compte apparaît sous Account Identifier. Consultez Identificateurs de compte pour plus d'informations. |
Base de données | Indiquez le nom de la base de données à laquelle se connecter. |
Mode non sécurisé | Désactivez la vérification de la liste de révocation des certificats. À utiliser uniquement comme solution temporaire en cas d’interruption du service liée à OCSP. |
Désactiver les tentatives | Activez ou désactivez les tentatives de réessai pour les requêtes HTTP vers les endpoints de l’API Snowflake. |
Nombre maximum de tentatives | Définissez le nombre maximum de tentatives pour les requêtes HTTP ayant échoué. Valeurs autorisées de 1 à 999 (si les tentatives sont activées). La valeur par défaut est 7. |
Délai d'exécution total | Définissez le délai d’exécution total en secondes pour les endpoints pris en charge par la politique de réessai. La valeur par défaut est 300 secondes. Toute autre valeur doit être supérieure. |
Délai de connexion | Définissez le délai d’exécution standard pour les connecteurs. La valeur par défaut est 300 secondes. |
Authentification |
DataSync prend actuellement en charge uniquement l’authentification de base et l’authentification par paire de clés. Authentification de base : Actuellement, seule l'authentification de base a été mise en œuvre.
Authentification par paire de clés:
|
Limitations
Lorsque vous ajoutez une table source Snowflake à une extraction, les index de la source, s’il y en a, ne sont pas pris en compte. Vous ne pouvez pas non plus créer d’index manuellement.