BI experience

5 mai 2008
par maryam khiali
0 Commentaires

La base de données Ingres se positionne dans OSBI et plus encore !

Ingres c’est 10.000 clients dans le monde et une expérience de 25 ans dans les bases de données relationnelles.

ingres.JPG

Cette base de données était à l’origine payante. Depuis 2 ans, elle est devenue Open Source pour se positionner tout doucement dans le monde de l’OSBI. D’autres actions ont été menées pour arriver à entrer dans ce monde. En effet Ingres est partenaire de Jaspersoft, Pentaho, SpagobI.

Mais le plus étonnant, c’est son offre spéciale et originale : son appliance Ingres IceBreaker BI qui est en fait une VM ( marchine vituelle) avec:

  • un système d’exploitation : la distribution Linux de rPath
  • le SGBDR Ingres 2006
  • les outils décisionnels de Jaspersoft :ETL Talend et la solution Jaspersoft

L’avantage vraiment majeur de cette offre pour nous développeurs est qu’Ingres assurera la maintenance de l’ensemble comme s’il s’agissait d’un seul logiciel.

C’est pas beau ça?

Vous aurez accès à cette solution pour un coût modique de 35k€ pour 2 CPU.

30 avril 2008
par maryam khiali
0 Commentaires

OLAP

Pour la culture générale, voici un peu d’histoire :

OLAP est inventé en 1993 par Edgar Frank Codd, l’inventeur du modèle relationnel des SGBDR, et défini avec 12 règles de base :

  • Modèle multidimensionnel
  • Transparence du serveur
  • Accessibilité
  • Performances d’accès stables
  • Client serveur
  • Dimensionnalité générique
  • Gestion des données éparses
  • Multi-utilisateur
  • Opérations sur les dimensions
  • Manipulation intuitive des données
  • Souplesse d’affichage et d’édition
  • Dimensions et niveaux multiples

Un cube OLAP (Online Analytical Processing) : est un outil de collecte, d’analyse et de restitution des données multidimensionnelles, comme l’analyse d’un chiffre d’affaires en fonction d’un produit, d’une période ou d’une zone géographique, chacun de ces facteurs étant considéré comme une dimension.
OLAP repose sur une structure de données spécialement adaptée aux extractions et aux croisements: l’hypercube (ou cube…).

L’hypercube est une construction intellectuelle qui rassemble les données en plusieurs axes appelés “dimensions”, comme le temps, les pays, les produits… Après avoir été extrait depuis le datawarehouse, l’hypercube permet de croiser et d’extraire des données de manière interactive suivant différents critères.

Le modèle OLAP peut être stocké de différentes manières :

  • MOLAP (Multidimensional OLAP) : Les données sont stockées dans une base de données multidimensionnelles le plus souvent propriétaires avec un problème des limitations de volume de données. Molap est une base de données dimensionnelle avec un serveur de traitement OLAP
  • ROLAP (Relational OLAP) : les données sont stockées dans un SGBD relationnel. Il permet un stockage de gros volume de données OLAP. Rolap est une base de données relationnelle avec du SQL avancé
  • HOLAP (Hybrid OLAP) : est du Molap pour les données sommaires et du Rolap pour les données détaillées
  • DOLAP (Desktop OLAP) : La base DOLAP (Desktop) est une base OLAP limitée en taille présente sur le poste client. Elle est bien et très rapide. C’est un fichier sur le poste client avec un client de traitement OLAP
  • SOLAP (Spatial OLAP) : le SOLAP est un système  qui intégré les concepts et méthodologies issus à la fois de SIG(Les Systèmes d’Information Géographique) et de l’OLAP. Ce système a été créé afin de mettre en relation l’analyse multidimensionnelle et l’analyse spatiale.

Pour illustrer ces différentes manières de stocker je vous propose un petit schéma qui récapitule :

OLAP

24 avril 2008
par maryam khiali
2 Commentaires

Cube (SSAS) vs Univers (BO)

Pour clarifier les choses entre l’univers et le cube.

Dans l’absolu l’utilisateur a l’impression d’être devant des données qui sont préparées pour que la navigation soit facilitée.

A part le fait que derrière le cube se cache

  • MOLAP : interroger à partir de requêtes MDX
  • HOLAP : interroger à partir de requêtes MDX + SQL
  • ROLAP : interroger à partir de requêtes SQL

et qu’un univers est interrogé par des requêtes SQL, quelles sont leurs différences et leurs points communs…

Je vous propose un petit récapitulatif :

pts_communs_univers_cube.JPG

pts_differents_univers_cube3.JPG

C’est clair que dans ce poste je valorise la force des cubes OLAP…Qui on l’air à mes yeux beaucoup plus puissants. Qu’en pensez-vous?

23 avril 2008
par maryam khiali
0 Commentaires

SSAS 2008

Aujourd’hui je vais détailler : Analysis Services. Je voulais commencer par SSIS, mais pour être franche j’ai trouvé la présentation, techdays webcast, médiocre. C’est la seule sur les 3 briques. Elle restait trop centrée sur SQL Server 2005 avec des démos qui n’apportaient rien de nouveau. Et au moment de parler de SQL Server 2008, le vocabulaire est devenu trop technique du coup j’ai pas tout compris… Donc je préfère commencer par SSAS.

Voici dans un premier temps un tableau récapitulatif :

SSAS_2008

Les nouveautés sont en grandes majorité :

  • les Alert AMO (Analys, management, Object) :Ces alertes aident finalement à la création de la base OLAP avec plus de 40 alertes liées aux bonnes pratiques de conception intégrés dans BIDS (business Intelligence developpement studio.) sous forme de code couleur (niveau d’importance). Ces alertes peuvent être désactivées par type ou par objet.
  • Un Nouvelle onglet : « relation d’attribut » permet de mettre en œuvre les relations d’attributs plus facilement entre chaque niveau d’une hiérarchie. On peut changer plus facilement de properties. Pour une meilleure optimisation 2 types de properties sont à préciser :

rigides : structure hiérarchique qui ne va pas changer au cours du temps on indique au moteur comment optimiser le calcul des agrégat. Tout ça est stocké en dur.
flexibles : structure hiérarchique qui peut changer donc il y aura des update en recalculant. Ces calculs ne sont donc pas stockés en dur.

  • Des assistants plus performants :

Les Dimension wizard plus sophistiquées en pouvant indiquer des types préétablies dans SQL Server. Exemple : Agragation Wizard permet de choisir ceux qui comptent vraiment via l’onglet agrégation

  • Des astuces de performances ont été mises en places :

Performance d’exécution : le calcul par bloc ne fera pas le calcul sur des cellules vides
Jeux nommés dynamique : les Sets (ensemble d’éléments nommés) sur la version 2005 étaient évalués une seule fois au chargement de la page mais sur 2008 les sets sont dynamiques et donc recalculés à chaque chargement.

Je pense que j’ai fait le tour des principales améliorations….Vous pouvez déjà avoir accès à la version béta sur le site de Microsoft. Il ne vous reste plus qu’à tester!