samedi 24 novembre 2012

DATACTIF. Knowledge Creation Platform

DATACTIF. SUITE DATA MINING




L'exploitation de données est un processus interactif exigeant que l'intuition et les connaissances humaines sont combinees à l'efficacité informatique.
L'objectif de DIRECTING est une approche holistique des informations utilisant la technologie de pointe tels que les systèmes intelligents mais également une approche socio-économique. La différence avec d'autres fournisseurs de logiciel d'exploitation de données est que DIRECTING, considére les données comme des empreintes des processus humains qui exigent  une approche non seulement statistique et mathématique mais également sociologique, commerciale et économique.
Le résultat est DATACTIF une suite d'exploitation de données couvrant des champs d' activités commerciales telles que finances, assurance, téléphonie, supermarches et industrie.
Pour la première fois dans ce secteur difficile de l'exploitation de données, l'utilisateur, qui peut être le PDG jusqu'au simple employé d'une société, peut employer la connaissance et la prévision sans perdre le temps (DATACTIF procède en temps réel avec des événements se produisant et sur la ligne avec tous les systèmes d'entreprise) et sans connaissance particulière des statistiques ou de l'informatique. Renforcement de ces manière, vision commune de la société aussi bien qu'effort commun à la même cible.




1.2. DATACTIF. SYSTEMES INTELLIGENTS

Puisque des actions humaines, actions qui créent les données, sont basées sur des critères culturels, sociaux, psychologiques, une approche NON-SUPERVISÉ par l' expert en analyse est nécessaire et c' est pourquoi nous avons opté pour les réseaux des neurones pour des fonctions tels que le CLUSTERING et la CLASSIFICATION-PREDICTION.
En général les systèmes intelligents sont meilleurs que des techniques traditionnelles parce que peuvent :
  • extraire la connaissance directement à partir des données en la presentant tant en expressions logiques, comme des règles et des corrélations, qu' en représentations visuelles
  • résoudre des tâches compliquées avec un haut niveau de confiance en travaillant avec de données de valeurs incorrectes ou manquantes
  • surmonter les problèmes que les outils statistiques communs ne peuvent pas  
  •  traiter des données qualitatives et quantitatives simultanément
  • analyser des variables discrètes et continues
  •  inclure la connaissance existante acquise de l'environnement commercial


1.3. DATACTIF. STRATEGIE EN DATA MINING

Le facteur le plus important dans le succès d'un processus d'exploitation de données est la stratégie.
Considerer le data mining comme un outil au service de la strategie commerciale ou marketing n' est pas assez. Il faut une strategie stratégie de creation de connaissance indépendante et autonome.


2.1. STRATEGIE


Chaque banque a un grand potentiel des clients possedant  une carte de crédit mais ce n'est pas pareil avec des produits d'investissement, d'épargne, prêts, etc l'objectif est de transformer les posseseurs de carte de crédit en clients de produits banquaires

         
 
Afin de résoudre ce problème nous avons besoin de la notion-axe « temps ». Ayant cet axe nous pouvons identifier l'historique, le comprendre et prévoir le futur comportement. Définissant l'économie Personnelle-Familliale nous observons que nous avons 3 axes. Revenu, épargne (positive ou négative [prêts]) et consommation. Mais la consommation (utilisant une carte de crédit) inclut le facteur temps. Ainsi nous devons comprendre l'utilisation de carte de crédit (consommation) par groupe des clients et coreller ces résultats avec la relation entre client avec la banque et ses produits.




Ainsi l'idée principale est de trouver des groupes (CLUSTERS) de personnes qui ont un comportement d'achats semblable. Le comportement d'une personne est fortement associé à son profil socio-économique. En raison de cette association, les groupes trouvés peuvent également être considérés comme groupes de personnes avec un profil socio-économique semblable. La prochaine étape est de découvrir la corrélation de ces groupes avec les produits banquaires. La découverte de cette corrélation nous permet de définir l'attitude des groupes vers les produits spécifiques de banque et la banque elle-même. La conclusion est que les comportements d'achats des utilisateurs de CARTE DE CRÉDIT nous permettent de prevoir l'attitude de chaque client individuelement.


2.2. FONCTIONS

2.2.1   DATACTIF. CLUSTERING

CLUSTERS sont des groupes de clients qui montrent un certain degré de similitude en ce qui concerne un certain nombre de caractéristiques (par exemple transactions d'un client). La découverte et l'analyse de tels groupes mène à une meilleure compréhension de la base clients offrant aux cadres commerciaux une vision prete a etre transformer en actions.

L'image précédente donne le résultat de la procédure du CLUSTERING (transactions avec une CARTE DE CRÉDIT). Cette « image-plan » est produit avec l'utilisation de l'algorithme Self Organized Map (Kohonen). Les points gris sur la carte sont les CLUSTERS.
 La taille des points gris est indicative de la population d'un CLUSTER. Les chiffres sur les points sont les index des CLUSTERS  (identification du groupe). La couleur rouge sur la surface indique la similitude entre les CLUSTERS voisins et le bleu l'opposé. En faisant un simple clique sur chaque point nous obtenons des informations sur ce groupe (comment et pourquoi il s'est composé) comme l'image suivante montre


Transactions du Cluster 14


Informations socio-demographiques

Profile Banquaire

2.2.2   DATACTIF. PREVISION

En plus de l'analyse et de la segmentation, DATACTIF inclut des méthodes de classification-prévision

Analyse NON DIRIGEE par l' utilisateur
Analyse DIRIGEE par les regles que fix l' utilisateur

2.2.2.1    ANALYSE NON SUPERVISE

Dans l'image ci dessous nous avons la prévision pour des clients potentiels d' un produit d' investissement donne.

2.2.2.2    ANALYSE SUPERVISE

Cette méthode-outil donne la possibilité de traduire la connaissance des cadres de la banque a des règles ou a des exemples (un echantillion de clients considérés comme « bons clients » etc…).

·         UTILISATION DE UN ECHANTILLON DE CLIENTS.
L'utilisation d'un echantillon de clients considérés comme bon afin de classifier le reste des clients suivant le schéma suivant


cette approche donne les resultas suivant :


·         UTILISATION DES RÈGLES DÉFINIES PAR L'UTILISATEUR

Du comportement d'achats des utilisateurs de CARTE DE CRÉDIT nous essayons de prévoir qui parmis eux peuvent devenir des clients pour prêts personnels (PIL).
Fuzzy logic est employée ici parce que c' est un cas où un « manque de netteté » apparaît. Exemple : Comment diviser des personnes en groupes selon leur âge ? Manière conventionnelle : 0-30 jeunes, 31-50 moyens, 51 - 100 vieux, c.-à-d. ensembles distincts. Mais un homme de 51 ans, est-il vraiment « vieux », alors qu'un homme de 50 n'est pas ? Fuzzy logic aborde cette question en appliquant le « manque de netteté » à l'aide des ensembles de recouvrement  Fuzzy logic systems ont été choisis pour cette tâche en raison de leur capacité d'incarner les règles de connaissance qui pourraient classifier une personne selon son besoin de prêt personnel. Dans ce cas il était difficile de distinguer des exemples des « bons » ou « mauvais » clients pour que le système soit formé.  
Le diagramme suivant montre une représentation schématique des règles appliquées et leur combinaison pour la prévision finale.


Avec cette methode on a obtenu les resultats suivants :






L'apprentissage du systeme par les nouvelles données est fait par l'administrateur avec une forme facile à utiliser.

Photo1 : Le logiciel TRAINING...

3.2.2   CLUSTERING


CLUSTERING permet de creer des CLUSTERS (groupes) des clients avec des caractéristiques communes et les associer aux variables économiques, CA total, bénéfice, etc..



permet la comparaison pour les mêmes clients entre deux périodes de temps. Dans le cas suivant nous observons que 1/4 des clients du cluster 5 (le groupe qui contient les clients de base et les nouveaux arrivants) se deplacent vers la direction de "tous les produits du même SM" et un autre 1/4 vers "produits biologiques".



3.2.4   RÈGLES D'ASSOCIATION

Cette fonction permet d' associer les Clusters a des informations dans une base de données comme questionnaires, etudes sociologiques, actions marketing, etc..



3.2.5.1    DATACTIF ®  LIFE TIME VALUE PREDICTOR


LIFE TIME VALUE PREDICTOR, est utilisé pour estimer des futures visites et de contenu du panier avec une connaissance basée sur des experiences passées. Il prévoit aussi les clients qui vont partir et en general le future comportement




3.2.5.2    DATACTIF ®  EVALUATION DES ACTIONS MARKETING



LTV relie également la courbe de valeur temps de vie des clients à d'autres facteurs économiques importants, tels que la part de marché ou les ventes. En outre, cet outil aide l'utilisateur dans des occasions de prise de décision en proposant des actions optimum a entreprendre. L'utilisateur peut suivre les courbes qui indiquent la progression d’ un client ou d’ un group de clients en relation a des facteurs comme promotions, part de marche, competition, etc…

  

3.2.6   SITE LOCATION


Évalue les magasins existants en fonction de leur emplacement géographique, la concurrence existante ou future, des facteurs socio démographiques, etc... et il anticipe tout changement des facteurs. Il propose le meilleur endroit pour l’ouverture d’un nouveau magasin en prévoyant sa profitabilité





Cette fonction offres à l'utilisateur un point de vue analytique d'information acceptant comme conditions (questions) toutes les combinaisons possibles de données, sous forme de liste, rapports, graphs etc...