Paramètres pour Snowflake

Cette rubrique décrit comment configurer une nouvelle connexion Snowflake dans DataSync

Qu'est-ce que Snowflake

Snowflake est une base de données OLAP entièrement gérée et basée sur le cloud, optimisée pour le traitement par lots et les grands ensembles de données. Ses principales techniques d’optimisation sont :

  • Séparation du stockage et du calcul : le stockage et le calcul sont mis à l’échelle séparément pour optimiser les performances et les coûts.

  • Partitionnement automatique : le partitionnement des données est géré automatiquement et les données sont stockées au format colonne. Les partitions, dont la taille est généralement comprise entre 50 et 100 Mo, contiennent des statistiques telles que les valeurs minimales et maximales.

  • Traitement parallèle : grâce à l’architecture distribuée des nœuds de calcul, le traitement des requêtes est parallélisé sur plusieurs nœuds.

Snowflake ne prend pas en charge les déclencheurs (triggers) ni les index, et n’applique aucune contrainte autre que NULL/NOT NULL sur les tables standard.

Configurer une connexion Snowflake

Pour configurer une connexion de destination Snowflake :

  1. Dans DataSync, créez une nouvelle connexion de destination Snowflake.

  2. Remplissez les champs du panneau Propriétés de la connexion.

Paramètres de connexion

Propriété Description
Compte

Indiquez l'identificateur de compte. Dans Snowflake, ouvrez le sélecteur de compte. Sélectionnez le compte souhaité, puis View account details. L'identificateur de compte apparaît sous Account Identifier. Consultez Identificateurs de compte pour plus d'informations.

Base de données Indiquez le nom de la base de données à laquelle se connecter.
Mode non sécurisé Désactivez la vérification de la liste de révocation des certificats. À utiliser uniquement comme solution temporaire en cas d’interruption du service liée à OCSP.
Désactiver les tentatives Activez ou désactivez les tentatives de réessai pour les requêtes HTTP vers les endpoints de l’API Snowflake.
Nombre maximum de tentatives Définissez le nombre maximum de tentatives pour les requêtes HTTP ayant échoué. Valeurs autorisées de 1 à 999 (si les tentatives sont activées). La valeur par défaut est 7.
Délai d'exécution total Définissez le délai d’exécution total en secondes pour les endpoints pris en charge par la politique de réessai. La valeur par défaut est 300 secondes. Toute autre valeur doit être supérieure.
Délai de connexion Définissez le délai d’exécution standard pour les connecteurs. La valeur par défaut est 300 secondes.
Authentification

DataSync prend actuellement en charge uniquement l’authentification de base et l’authentification par paire de clés.

Authentification de base : Actuellement, seule l'authentification de base a été mise en œuvre.

  • Nom d'utilisateur : Entrez le nom de l'utilisateur dans la base de données Snowflake.

  • Mot de passe : Entrez le mot de passe de l'utilisateur.

Note : le type d’utilisateur doit être LEGACY_SERVICE. Consultez Gestion des utilisateurs pour plus d'informations. Snowflake est en train de retirer l’authentification basique à facteur unique. Utilisez cette méthode uniquement si aucune autre méthode d’authentification n’est disponible.

Authentification par paire de clés:

  • Utilisateur de la clé: Entrez le nom de l’utilisateur dans la base de données Snowflake.

  • Clé privée: Sélectionnez le fichier de clé privée correspondant à la clé publique de l’utilisateur.

  • Phrase secrète: Entrez le mot de passe protégeant la clé privée. Laissez vide si la clé n’est pas protégée.

    Note : Snowflake exige une paire de clés RSA d’au moins 2048 bits. Consultez Authentification par paire de clé pour plus d’informations sur la génération et la rotation des clés.

Limitations

Lorsque vous ajoutez une table source Snowflake à une extraction, les index de la source, s’il y en a, ne sont pas pris en compte. Vous ne pouvez pas non plus créer d’index manuellement.