Gestion des données
La gestion des données dans SEI regroupe les stratégies et les outils pour accéder données, les organiser et produire des rapports à partir de systèmes et d’environnements variés.Vous pouvez utiliser un seul ERP, consolider plusieurs systèmes, vous connecter à des données hébergées dans le cloud ou analyser de grands volumes de transactions : SEI propose des méthodes qui garantissent performance, évolutivité et simplicité d’utilisation dans tous les scénarios de reporting.
Cette section vous aide à choisir l’approche de gestion des données la plus appropriée en associant différents scénarios opérationnels aux outils et configurations qui leur correspondent.
Outils de gestion des données
| Outil | Description |
|---|---|
| DataSync | Entrepôt de données et moteur ETL de SEI utilisé pour répliquer, consolider, croiser et transformer les données. Idéal pour les données hébergées dans le cloud, le déchargement des ERP et la préparation des données pour l’analyse. |
| Concepteur de modèle de données | Concevez, organisez et gérez les structures qui définissent votre modèle de données. Vous pouvez ainsi associer des données provenant de différentes sources et les organiser en vue du reporting ou de l’analyse OLAP. |
| Gestionnaire OLAP | Créez et gérez des cubes OLAP pour un traitement analytique haute performance. Indispensable pour les volumes de données importants (plus de 5 millions de lignes) et les besoins de reporting multidimensionnel complexes. |
En combinant ces outils, vous pouvez mettre en place une architecture adaptée à votre environnement de reporting et d’analyse :
- DataSync pour copier et préparer les données en toute sécurité.
- Concepteur de modèle de données pour structurer et intégrer.
- Gestionnaire OLAP pour optimiser la vitesse et l’évolutivité à grande échelle.
Scénarios
Cette section présente les scénarios courants de gestion des données — de l'optimisation des performances ERP à l'intégration multi-sources — et indique la combinaison d’outils (DataSync et/ou Gestionnaire OLAP) qui offre les meilleurs résultats.
Lorsque vous choisissez un scénario, vérifiez si votre ensemble de données dépasse 5 millions de lignes. Ce seuil permet de déterminer si des cubes OLAP sont recommandés. Pour les scénarios multi-sources ou complexes, vérifiez aussi si des transformations de données sont nécessaires pour rapprocher des structures ou des identifiants qui ne correspondent pas.
Source de données unique
Utilisez ce scénario lorsque votre reporting repose sur un seul système source, comme un ERP unique. Il convient parfaitement aux besoins de reporting simples et peu exigeants en maintenance.
Évaluez la taille de l’ensemble de données ainsi que les exigences de performance pour choisir la configuration appropriée. Si l’ensemble de données contient moins de 5 millions de lignes, un accès ERP en temps réel suffit généralement et aucun outil supplémentaire n’est requis. Au‑delà de 5 millions de lignes, mettez en place des cubes OLAP afin d’améliorer les performances des requêtes et de réduire la charge sur l’ERP.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Faible volume | < 5 M de lignes | Temps réel | Non | Non |
| Volume important | > 5 M de lignes | Temps réel | Non | Oui |
Défis de performance ERP
Utilisez ce scénario lorsque le reporting ou l'accès aux données ralentit votre système ERP. Il est idéal pour maintenir une bonne réactivité de l’ERP lors de charges de reporting importantes.
Répliquez les données de l’ERP dans un environnement séparé à l’aide de DataSync afin d’exécuter les requêtes en dehors de l’ERP. Pour les ensembles de données contenant moins de 5 millions de lignes, la réplication DataSync suffit généralement à préserver la vitesse et la stabilité. Au‑delà de 5 millions de lignes, combinez DataSync avec des cubes OLAP pour améliorer davantage les performances des requêtes et réduire les temps de traitement.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Faible volume | < 5 M de lignes | Quasi temps réel | Oui | Non |
| Volume important | > 5 M de lignes | Quasi temps réel | Oui | Oui |
Données cloud
Utilisez ce scénario lorsque le reporting Utilisez ce scénario lorsque le reporting s’appuie sur des données hébergées dans le cloud comme des applications SaaS ou des ERP cloud. Il est particulièrement adapté aux environnements où des performances locales élevées et une bonne évolutivité sont nécessaires pour l’analyse.
Les données cloud doivent toujours être répliquées dans un environnement local via DataSync, car une analyse en temps réel directe n’est pas possible. En dessous de 5 millions de lignes, la réplication DataSync offre généralement une vitesse suffisante. Pour des volumes plus importants, associez DataSync à des cubes OLAP afin d’accélérer les requêtes et d’améliorer l’évolutivité.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Faible volume | < 5 M de lignes | Quasi temps réel | Oui | Non |
| Volume important | > 5 M de lignes | Quasi temps réel | Oui | Oui |
Sources de données multiples
Utilisez ce scénario lorsque le reporting nécessite des données provenant de deux systèmes ou plus. Il est idéal pour les organisations souhaitant obtenir une vue consolidée de l’ensemble des sources, quel que soit leur type.
Commencez par vérifier si toutes les sources sont compatibles avec le Gestionnaire OLAP, c’est‑à‑dire si OLAP peut se connecter directement à la technologie de chaque source.
- Si toutes les sources sont compatibles, le Gestionnaire OLAP suffit pour les connecter, les fusionner et les traiter.
- Si une ou plusieurs sources ne sont pas compatibles (par exemple un ERP cloud), utilisez DataSync pour stocker les données dans un environnement compatible avant que le Gestionnaire OLAP ne les fusionne et ne les traite.
- Si les sources utilisent des identifiants ou des structures différents, utilisez DataSync pour transformer et unifier les données avant de les envoyer au Gestionnaire OLAP.
| Scénario | Compatibilité des sources avec OLAP | DataSync | OLAP | Transformation |
|---|---|---|---|---|
| Connexion directe | Toutes compatibles | Non | Oui | Non |
| Passerelle d’intégration | Certaines non compatibles | Oui | Oui | Non |
| Transformation unifiée | Identifiants différents | Oui | Oui | Oui |
Besoins de transformation
Utilisez ce scénario lorsque des ensembles de données provenant de systèmes différents doivent être rapprochés en raison d'identifiants ou de formats non correspondants. Il est particulièrement adapté aux besoins de reporting complexes nécessitant des structures de données cohérentes avant l’analyse.
Utilisez DataSync comme plateforme de staging et de transformation de nettoyer et standardiser les données. La transformation est obligatoire dans ces cas. Si l’ensemble de données obtenu après transformation dépasse 5 millions de lignes, des cubes OLAP doivent être mis en place pour maintenir la vitesse et l’évolutivité.
| Scénario | DataSync | OLAP | Transformation |
|---|---|---|---|
| Jointures complexes / identifiants non correspondants | Non | Oui (si grand volume) | Oui |
Consolidation de plusieurs bases de données
Utilisez ce scénario lorsque vous devez combiner plusieurs bases de données pour obtenir une vue de reporting unifiée. Il est idéal pour les organisations ayant besoin d’une analyse centralisée de données réparties sur différentes bases tout en garantissant cohérence et performance.
Utilisez DataSync pour consolider toutes les sources de données dans un environnement de staging avant l’analyse. Évitez les liaisons directes via des vues SQL pour les grands volumes de données, car cela peut entraîner d’importants problèmes de performance. Si l’ensemble consolidé dépasse 5 millions de lignes, ajoutez des cubes OLAP afin d’améliorer la vitesse des requêtes et l’évolutivité.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Faible volume | < 5 M de lignes | Quasi temps réel | Oui | Non |
| Volume important | > 5 M de lignes | Quasi temps réel | Oui | Oui |