Aller au contenu principal

Connecteur de source MongoDB

Le connecteur de source MongoDB dans DataSync vous permet de récupérer des données à partir d'instances MongoDB pour les charger ou les synchroniser dans votre entrepôt de données. Après avoir créé toutes les connexions sources requises, configurez votre connexion de destination pour finaliser la configuration.

important

L'extraction de consolidation n'est actuellement pas disponible pour les connexions sources MongoDB.

Créer une connexion source dans DataSync

  1. Connectez-vous à DataSync.
  2. Depuis l'écran d'accueil, sélectionnez Connexions.
  3. À côté de Connexions sources, cliquez sur Nouveau.
  4. Sélectionnez MongoDB.
  5. Dans le panneau Propriétés de la connexion, entrez les propriétés de connexion.
  6. (Optionnel) Dans le panneau Autres propriétés de la connexion, sélectionnez Ajouter une propriété et entrez les paramètres pour chaque propriété.
  7. Dans le panneau Paramètres avancés, configurez les paramètres, y compris le Type de suivi et d'autres valeurs selon vos besoins.
  8. Cliquez sur Sauvegarder.

important

Pour les propriétés qui contiennent des tableaux, la précision inférée peut être sous-estimée. Cela peut entraîner des erreurs de troncation lors de l'extraction. Recommandation : Définissez la précision sur MAX pour ces colonnes dans votre table de destination afin d'éviter les échecs.

Paramètres

Propriétés de la connexion

ParamètreDescription
DescriptionNom unique pour la connexion. Exemple : MongoDB.
ServeurNom d'hôte ou adresse IP du serveur MongoDB.
Exemple : mongodb.example.com
PortNuméro de port du serveur. Par défaut : 27017.
Base de donnéesNom de la base de données MongoDB à laquelle se connecter. Exemple : SalesData.
Mode d'authentificationMéthode d'authentification pour la base de données :
  • Basic – Authentification par défi-réponse avec un nom d'utilisateur et un mot de passe stockés dans la base de données MongoDB.
  • NoAuth – Aucune authentification.
Nom d'utilisateurNom d'utilisateur du compte stocké dans la base de données MongoDB Exemple : mongoUser.
Mot de passeMot de passe associé au nom d'utilisateur.
Base de données d'authentificationNom de la base de données utilisée pour l'authentification, si différente de la base de données spécifiée dans Base de données.
Exemple : admin
Aplatir les objetsOption pour convertir les propriétés d'objets imbriqués en colonnes séparées. Si désactivé, les objets sont retournés sous forme de chaînes JSON.
Activer MongoDB sur TLS/SSLParamètre de chiffrement pour sécuriser la connexion avec SSL/TLS. Nécessite un certificat SSL.
Accepte les certificats de serveur non validesOption pour accepter tous les certificats du serveur lors de l'utilisation de SSL/TLS. Non recommandé en raison des risques de sécurité.
Profondeur de balayage des lignesNombre de lignes analysées dans la collection pour inférer le schéma. Une valeur plus élevée génère un schéma plus exact mais peut réduire les performances. Par défaut : 1000.
Verbosité
  • 1 – Journaliser les requêtes, le nombre de lignes, le début/fin de l'exécution, les erreurs.
  • 2 – Inclut le niveau 1 plus les requêtes de cache, les en-têtes HTTP.
  • 3 – Inclut le niveau 2 plus les corps de requête/réponse.
  • 4 – Inclut le niveau 3 plus les communications de niveau transport.
  • 5 – Inclut le niveau 4 plus toutes les commandes d'interface.
Activer la mise en PoolOption de pooling de connexion pour la performance.
Délai d'inactivité du PoolTemps d'inactivité maximal pour les connexions avant de les retourner au pool, en secondes.
Taille maximale du PoolNombre maximum de connexions autorisées dans le pool.
Temps d'attente du PoolTemps d'attente maximal pour l'attribution de connexion avant qu'une erreur ne soit générée, en secondes.

Exemple d'aplatissement des objets

Considérez le document de vente suivant :

{
"orderId": 10592,
"customer": { "id": 456, "name": "Acme Corp" },
"shipping": { "city": "New York", "state": "NY" }
}
  • Si Aplatir les objets est activé, le document apparaît comme :

    Nom de colonneType de donnéesValeur d'exemple
    orderIdEntier10592
    customer.idEntier456
    customer.nameChaîneAcme Corp
    shipping.cityChaîneNew York
    shipping.stateChaîneNY
  • Si Aplatir les objets est désactivé, les propriétés imbriquées restent à l'intérieur de JSON :

    {"city": "New York", "state": "NY"}

Autres propriétés de la connexion

Propriétés de chaîne de connexion supplémentaires non spécifiées dans le panneau Propriétés de connexion. Pour chaque propriété ajoutée, vous pouvez choisir Visible ou Crypé. La sélection de Crypé masque la valeur de l'interface et la stocke chiffrée au backend, comme lors de la définition des mots de passe.

ParamètreDescription
PropriétéPropriété de chaîne de connexion qui définit l'action ou le comportement. Exemple : ReadOnly
ValeurValeur de la propriété. Exemple : True
TypeVisibilité de la propriété : Visible ou Crypé.

Paramètres avancés

Les paramètres avancés contrôlent comment le connecteur MongoDB suit les changements, gère la configuration régionale et horaire, et traite les lots de données lors de l'extraction. Ces options permettent un ajustement fin pour les performances et l'exactitude, et doivent être configurées en fonction de votre environnement système et de vos exigences opérationnelles.

ParamètreDescription
Type de suiviMéthode de suivi des changements : Aucun ou Date.
RégionParamètre régional pour le connecteur, si nécessaire pour votre configuration.
Fuseau horaireFuseau horaire correspondant au serveur d'application MongoDB.
Décalage horaireDécalage de rafraîchissement en secondes pour compenser les problèmes de timing dans la sélection des enregistrements. La valeur minimale est 0 ; la maximum est 3600 secondes.
Taille de lotQuantité d'enregistrements traités dans chaque lot lors de l'extraction. Des tailles de lot plus grandes augmentent l'utilisation de la mémoire mais peuvent améliorer les performances jusqu'à un certain point. La valeur par défaut est 2000 et le maximum ne doit pas dépasser 10000 enregistrements. Ajustez en fonction de la vitesse de votre réseau et des performances du disque ; dans la plupart des cas, la valeur par défaut (2000) fonctionne le mieux.