Catégorie : Traitement des données

Stambia tips : Les fichiers de données hiérarchiques

Les solutions d’intégration de données traditionnelles, conçues pour des formats de données simples, comme des tables et des fichiers plats, sont confrontées à des taux de productivité et de performance pauvres lorsqu’il s’agit de traiter des formats de données hiérarchiques telles que XML, JSON, les IDOCs SAP ou bien encore les Web Services.

L’objectif de cet article est de présenter comment gérer efficacement les fichiers hiérarchiques de type JSON et XML grâce à l’ELT Stambia, qui a été conçu dans l’optique de fournir le même niveau de simplicité et de performance quelle que soit la forme des données à traiter.

Voir l’article

Gérer les lignes orphelines dans Microsoft SQL Server à l’aide de IDENTITY_INSERT

Lors de la conception d’un Entrepôt de données (ou datawarehouse), la question de la performance est au cœur de celle-ci. En effet au moment du reporting, il est fondamental que les temps de réponse soient constants pour une volumétrie croissante. C’est pour cela qu’il est important de construire les tables de dimensions et de faits, de manière à ce que l’on fasse uniquement des jointures fermées (INNER JOINS).

Cependant il peut arriver que lors de l’alimentation d’une table de faits, certaines lignes n’aient pas de correspondance avec une ou plusieurs tables de dimensions. Comment gérer ces cas, pour quand même intégrer ces lignes de manière cohérente et conserver toutes les données dans notre datawarehouse ? C’est là qu’intervient l’utilisation du fameux IDENTITY_INSERT.

Voir l’article