BI experience

5 janvier 2011
par maryam khiali
0 Commentaires

Bonne Année 2011

Je vous souhaite à tous une excellente année 2011 sur le plan professionnel mais aussi personnel.

L’année 2010 aura été riche en évènements. J’espère que mes posts auront pu en aider certains dans leur travail…

Voici les chiffres clefs  de la vie de ce blog, (source des informations : Xiti et Feedburner) il y a eu en moyenne entre 100 et 150 visites par jour sur l’année 2010 . Une vingtaine d’articles ont été publiés et une cinquantaine de commentaires ont été postés.

Je voudrais vous remercier pour tous vos commentaires, ils m’encouragent vraiment à continuer de partager mes connaissances avec vous…

Cela fait maintenant 2 mois que je n’ai pas posté faute de temps mais je ne vous oublie pas!

Merci encore de faire vivre ce blog! Et à bientôt!

8 octobre 2010
par maryam khiali
0 Commentaires

Industrialiser son datawarehouse

Comment rechargez-vous, ou rafraichissez-vous votre datawarehouse? Quelle est votre méthode d’industrialisation afin que la plateforme de production puisse offrir des données à jour aux utilisateurs finaux?

Voici la méthodologie utilisée dans mon projet :

1 – Pointer les bases de données sources des datamarts => il faudra séparer les datamarts en fonction afin que s’il y ai un problème sur l’une des bases de données sources cela n’impacte pas d’autres datamarts non liés à cette source.

2 – Lister les dimensions et les datamarts qu’elles touchent => si une dimension est rechargée il faudra recharger les faits concernés en conséquence

3 – Identifier les fréquences de chargement pour rassembler les faits ou dimensions qui devront être rafraichis en même temps

4 – Etablir l’ordre dans lequel les dimensions et faits doivent être remplis

En fonction de ces 4 points il se dégage deux visions :

- une vision faits => en fonction de la base de données, de la fréquence, de l’ordre de chargement il faudra créer des blocs de faits qui seront ensuite schedulés en évaluant le temps de chargement de chaque blocs

- une vision dimensions/faits => dès qu’une dimension est rechargée il faudra recharger les faits qu’elle touche. Lors du scheduling il faudra aussi évaluer le temps de chargement de ces blocs dimensions/faits

La représentation sous forme de schémas peut vraiment aider…

Ce scheduling est donc fait pour les jobs de production sur le datawarehouse de production. La fenêtre de temps d’exécution de cet industrialisation doit quand même être bien évaluée car si juste avant vous avez l’alimentation de votre infocentre (copie des bases de données sources) lui-même lancé après les actions de backup, restore des bases de données sources…Vous imaginez que tout ça doit être prévu assez précisément.

Et vous comment faites-vous?

6 octobre 2010
par maryam khiali
2 Commentaires

Le leader mondial Business Object

Précédemment je vous ai décrit un certain nombre de logiciels plutôt orientés « open source ». Dans ce post, je voudrai m’attarder sur l’offre du leader mondial « Business Object ». J’ai assisté à une petite présentation du produit version webi XI 3.1, je voulais donc vous faire partager la vision de la solution que j’ai pu percevoir.

Tout d’abord, il faut savoir que Business Object est un portail qui à la base permet de faire du suivi d’activité en se plugant directement sur les bases de productions qu’à l’entreprise…Je pense qu’on a tous entendu parler de la force de BO : son univers. L’univers de BO est une couche sémantique qui ne contient pas de données : c’est une représentation métier de l’information. Le développeur aura accès au designer pour le construire. A partir des tables du datawarehouse, ou des bases de données sources, une interface graphique aidera  à créer la requête qui constituera l’univers.

Le développeur construira des univers en respectant les bonnes pratiques :

  • création des contextes : permet d’optimiser les requêtes SQL en indiquant le chemin le plus court selon la table de fait que l’on interroge.  Si par exemple on fait appel à plusieurs tables de faits ayant des dimensions communes pour éviter les boucles
  • création de raccourcis jointures : permet de lui indiquer le chemin le plus court en fonction des id des tables : exemple table1 a un id_pays table2  a un id_departement et table3 id_ville  si dans table1 il y a aussi un id_ville, on lui indiquera de passer directement de table1 à table3).

A partir de cet univers, l’utilisateur final pourra créer sa propre requête dans la plateforme Infoview de BO. Le résultat de cette requête sera assimilé à un petit cube de données où les données seront chargées à l’intérieur. A travers ce cube de données, il pourra construire son rapport en utilisant plusieurs techniques :

  • rupture : créer un tableau par valeurs de données choisies pour faire une rupture
  • section : met des titres par valeurs de données choisies pour faire une section
  • en permettant aux autres utilisateurs de l’interactivité sur le rapport (multiview de l’information)

Afin que la création du rapport ne soit pas trop lourde, l’interface pourra être en HTML au lieu d’être en JAVA. Donc en cas de réseau limité, l’interface sera quand même efficace.

La solution BO ne fait pas le cube OLAP, néanmoins elle permet de créer une navigation en mode exploration des données. C’est finalement le développeur qui devra créer un rapport qui permettra cette exploration. Le concept de l’interface du cube plier/déplier des informations n’existent donc pas dans BO.

Une brique étonnante de BO est Xcelsius : ce module transforme une feuille Excel en document Flash. Pour être plus précise le document Flash se base sur une feuille Excel et cette dernière rapatrie les données de la base de données avec un appel de webservice. Le document Flash utilisera la feuille Excel comme une base de données. Pour générer le webservice qui va permettre de rapatrier les données (ou cette URL http), cette requête pourra être créée par une autre brique de BO : « query as webservice« . Dans cette représentation Flash de l’information, on pourra même y mettre un peu de cartographie en descendant jusqu’au niveau du pays. Xcelsius peut être utilisé pour faire des tableaux de bords ou de la simulation. Le résultat peut vraiment être joli.

La solution BO permet aussi de faire aussi du publipostage en poussant l’information vers les utilisateurs dans leur boite mail ou sur un répertoire particulier.

Je ne suis bien sûr pas exhaustive sur cette présentation. C’est un aperçu de ce que peut offrir cette solution.

Mon ressenti est que Business Object est une solution aboutie mais les technologies utilisées paraissent un peu lourdes et pas très sexy en comparaison avec d’autres logiciels vus et décris dans précédents posts. Néanmoins c’est quand même le leader mondial, il a fait ses preuves.

Et vous, êtes-vous utilisateur ou développeur BO…Que pensez-vous de cet outil?

12 juillet 2010
par maryam khiali
1 Commentaire

Présentation de Qlikview

Société suédoise, Qlikview a créé la première version du logiciel éponyme en 1995. Ce n’est qu’en Septembre 2007 qu’ils ont ouvert des bureaux en France.

qlikview_logo

Leur slogan est « click and view » . L’originalité de leur offre réside dans la manière de se déplacer dans les données. D’après Qlikview l’utilisateur se promène dans les données par « association d’idées ».

Exemple : « J’ai oublié mon cahier chez quelqu’un. Généralement, Je ne me souviens pas directement de la date, de l’heure et du lieu de l’oubli. Mais je vais plutôt penser à un laps de temps cela fait 2 jours que je ne l’ai pas utilisé. Et la dernière fois que je l’ai utilisé c’était chez la personne X que j’ai vu à telle heure et à tel endroit ». Donc par association d’idées je suis remontée à la donnée qui m’intéressait. »

Afin de présenter ce cheminement d’association d’idées, les applications car sous Qlikview on ne parle pas de rapport mais d’application, proposent un code couleur (qui peut être personnalisé)

  • vert représente la question posé (exemple : je clique sur la première dimension pays et plus précisément sur Allemagne car je me pose une question sur ce pays et puis je clique sur la dimension type de magasin)
  • gris sera les résultats qui ne répondent pas à ma question. (liste des types de produits que ne propose pas ce type de magasin)Ce type de résultat peut vraiment être utile lors d’une analyse. Cette solution est vraiment atypique pour les rapports que l’on peut construire classiquement et peut être d’une grande aide pour l’analyse.
  • Blanc représente la réponse

Leurs applications sont basées sur les principes de Google avec la possibilité de faire des recherches facilement et instantanément dans les applications pour faire une analyse ciblée. De plus les objets utilisés dans les applications s’utilisent comme des widgets Google. Leurs applications sont vraiment orientées web.  En exemple concret, pour enregistrer une application  avec des paramètres qu’on aura choisis spécifiquement, l’utilisateur aura juste a enregistrer ce résultat en ajoutant un favori.

De l’interactivité, une possibilité d’autonomie pour les utilisateurs finaux, les applications proposent des multiviews c’est à dire que chaque objet est de type graphique et donc l’utilisateur pourra visualiser les données en tableau puis en camembert puis en histogramme… De plus les résultats des questions des utilisateurs sont instantanés car toutes les données sont montées en mémoire en s’appuyant sur une base de données vectorielle propre à Qlikview qui stocke les données  sous un format compressé.  Cette solution peut vraiment répondre à des entreprises qui ont une problématique de volumétrie. Les fichiers de BDD sont sous format .qvd.

Par contre il faut savoir que cette application ne propose pas de portail collaboratif. c’est plutôt une application qui a pour vocation à être intégrée dans un autre portail. En dernier détail technique, QlikView est une application qui s’installe sur du windows aussi bien pour les serveurs que pour les applications locales. Si vous avez un besoin d’avoir accès aux données en déconnecter, il faudra avoir l’application Qlikview en local sur votre poste pour ouvrir les applications.

Afin d’être toujours plus productif et pour être force de proposition, lors du téléchargement de QlickView sur leur site des exemples d’applications sont proposées pour données des idées aux développeurs.

Vous pouvez dès à présent tester ce logiciel en téléchargeant la version communautaire. La particularité de cette version est que vous allez installer cette application  en local sur votre poste. Vous pourrez télécharger des applications qui pourront être visualisées via un navigateur par les utilisateurs. Par contre vous ne pourrez pas échanger des applications avec d’autres développeurs ou utilisateurs car elles seront cryptées pour n’être utilisables uniquement sur votre poste. Ce n’est que lors de l’achat d’une licence que ces applications seront débloquées.

Concernant les prix des formations. Il est conseillé de prendre 4 jours :

  • 2 jours pour apprendre à utiliser qlikview designer pour construire les applications
  • 2 jours pour apprendre le script c’est à dire ce qui ramène les données à l’application

Le coût d’une formation dans les locaux de Qlikview est de 650€/jour/pesonne. La mise en oeuvre de cette solution ne sera jamais faite par l’éditeur lui-même mais par ses sociétés de services partenaires ou la journée sera facturée 1000€/jour/intervenant.

La solution est vendue par application par utilisateur : 250€/application/utilisateur. Et pour une utilisation illimitée d’applications par utilisateur est de 960€/utilisateur

Les prix annoncés sont bien sûr des prix publics. En espérant vous avoir donné assez d’informations pour vous donner l’envie d’aller creuser ce logiciel plus en avant.

24 juin 2010
par maryam khiali
5 Commentaires

Pentaho s’implante en France

Fondée en 2004, Pentaho, société américaine, avait comme stratégie de racheter plusieurs briques décisionnelles (exemple leur ETL : Kettle) pour créer « la solution Pentaho ».

pentaho

Aujourd’hui, avec une solution plus solide et 230 personnes que compte Pentaho, le mot d’ordre de cette société est « la business Intelligence agile ». La finalité étant de profiter directement dans une même plateforme de l’ETL et de la restitution des chiffres. ( l’ETL => Modeler => l’Analyser).

Il y a encore quelques semaines, Pentaho n’avait pas de bureaux en France mais aujourd’hui, ils sont prêts à attaquer le marché Français avec une solution qui a ses avantages.

Effectivement, la partie « Analyser » est impressionnante car elle gère bien la modélisation dimensionnelle. Dès qu’un datamart est chargé, « l’Analyser » arrive automatiquement à détecter certaines jointures et c’est ainsi que l’on peut directement naviguer dans les données à la manière d’un requêteur ad-hoc.

De plus, leur solution intègre très facilement la personnalisation d’objets, l’utilisation des google tools (exemple google maps… ), l’intégration html.  L’export Excel de ce requêteur ad-hoc ou en d’autres termes de « l’Analyser » est bien géré quand d’autres solutions n’y arrivent pas encore.

Cette solution a donc une vraie valeur ajoutée à offrir. Une version communautaire ou professionnelle est proposée.

L’acquisition de la solution professionnelle est sur 3 ans. Les tarifs annoncés sont:   pour une licence silver 45 000 € et pour une licence Prenium 75 000 €.

Je vous invite donc à regarder, cette solution plus en profondeur en cliquant ici.

Si vous avez des retours d’expérience à faire sur cette solution, n’hésitez pas, postez!