Compte rendu de la 4ème
Rencontre Internationale sur
l’Analyse Statistique Implicative A.S.I. 4, de Castellon
de la Plana (du 18 au 21 Octobre 2007) Cette Quatrième Rencontre
fait suite aux Journées intitulées « La fouille dans les données par la
Méthode Statistique Implicative » organisées par Marc Bailleul à
l’Institut de Formation des Maîtres de Caen les 23-24 Juin 2000. Cet ASI 1 a
été suivi par le Colloque (ASI
2) à l’Université PUC de São Paulo du 9 au 11 Juillet 2003, organisé par Saddo
Ag Almouloud ; puis par ASI 3 organisé du 6 au 8 Octobre 2005 à Palerme
par Filippo Spagnolo. Ainsi, suite à l’intérêt porté à ces Journées, aux
développements théoriques continus de l’Analyse Statistique Implicative (ASI),
à la multiplication des recherches utilisant la méthode d’analyse pour explorer
des données, c’est la 4ème fois que se rassemblaient des chercheurs
représentant de nombreuses nationalités[1]
sur le seul thème de l’ASI. La Rencontre a été organisée et présidée : * par
Pilar Orus (Comité d’organisation), * et
Régis Gras (Comité scientifique et de programme). Elle
a réuni plus de 60 participants. Le Professeur Einoshin Suzuki, de l’Université
de Kyushu (Japon) était conférencier invité. Rappelons
que la "fouille dans des données » (encore appelée "Knowledge
Discovery in Databases" ou encore "Data Mining" dans la
littérature anglo-saxonne) part, en général, du croisement de sujets (ou
objets) et de variables binaires (propriétés ou attributs) ou non. Son objectif
majeur consiste à conjecturer des modèles basés sur des relations
quantitatives ou qualitatives et des structures induites à partir des données.
Différentes méthodes, comme l’Analyse Factorielle des Correspondances (A.F.C.),
la Classification Ascendante Hiérarchique (C.A.H.), sont communément utilisées
pour de telles fouilles de données. Parmi elles, l'Analyse Statistique
Implicative (A.S.I.), née de problématiques de didactique des mathématiques,
fondée et développée par Régis Gras et son équipe, vise l’extraction de
connaissances, d’invariants, par exemple des conceptions, etc., bref de règles inductives non symétriques consistantes.
Elle attribue une mesure à des propositions du type « quand a est choisi, on a tendance à choisir b ». Pour cela,
elle quantifie la qualité de ces règles sur la base statistique d'un
nombre significatif de contre-exemples où la règle n’est pas vérifiée et où
certains déséquilibres cardinaux sont observés parmi les exemples et les
contre-exemples à l’implication et à sa contraposée. Le logiciel, dénommé CHIC
(Classification Hiérarchique Implicative et Cohésitive), développé au début des
années 90 par Saddo Ag Almouloud et depuis, par Raphaël Couturier, permet : - de traiter différents
types de variables (binaires, modales, fréquentielles, intervalles, floues), - de
quantifier la consistance, la qualité des règles extraites, la significativité
de classes de règles, - de
quantifier la typicalité et la contribution de sujets ou de catégories de
sujets à certaines règles et classes de règles, - de
représenter par un graphe, pour un seuil de qualité choisi, des chemins ou des
réseaux de règles et, par une hiérarchie, des méta-règles appelées aussi règles
généralisées, - de
supprimer, d'ajouter, de conjoindre des variables. - de
représenter par une hiérarchie ascendante les classes de similarité des
variables. Pendant
ces quatre Journées, 28 communications, 2 conférences et 2 ateliers pratiques
ont permis de rendre compte de travaux théoriques ou applicatifs et de
résultats significatifs obtenus dans différents domaines par une
"fouille" dans leurs propres données[2].
Ces travaux ont fait apparaître la place de l’ASI en bio-informatique, en
psychologie sociale, en éducation, etc. de façon complémentaire et comparative
à des méthodes factorielles ou taxonomiques. La conférence invitée présentée
par Einoshin Suzuki a brossé un panorama général sur l’extraction de
connaissances et, en particulier, sur les règles d’exception structurées La
conférence de Régis Gras a permis un rappel des concepts mathématiques
fondamentaux de l’A.S.I., dont ses nouveaux développements (processus de
Poisson, stabilité de l’indice d’implication, règle d’exception, par
exemple), en insistant sur les
problématiques qui y ont mené. Quelques travaux pratiques sur CHIC ont conduit
à une meilleure prise en mains de ce logiciel et une compréhension approfondie
de la théorie sous-jacente. Un
ouvrage de 410 pages, « Nouveaux Apports Théoriques à l’ASI et
Applications »[3] regroupant
les conférences et les communications et un fascicule utilitaire contenant
leurs résumés et des informations pratiques ont pu être distribués à chacun des
participants dès son arrivée. Au cours de l’année 2007, les membres du comité
scientifique (30 chercheurs) avaient été mis à contribution pour lire,
critiquer et homogénéiser les textes proposés, certains de ceux-ci n’ayant pas
été retenus à la suite des échanges avec leurs auteurs. La mise en forme
définitive et le tirage ont été effectués par Bruno Pinaud (Polytech Nantes) et
par une équipe autour de Pilar Orus et Pablo Gregori à l’Université Jaume I de
Castellon. Un site ouvert par F.Spagnolo (http://math.unipa.it/~grim/asi/asi_index.htm)
et celui spécifique de ASI 4 créé par P.Gregori (http://www.asi4.uji.es/ ) permettent
d’accéder, non seulement à ces actes, mais également à ceux de ASI 1 (Caen
2000), ASI 2 (São Paulo 2003) et
ASI 3 (Palerme 2005), ainsi qu’à des photos prises pendant les Journées. Au cours de ces Rencontres,
le choix d’une alternance équilibrée de communications théoriques ou appliquées
et de travaux pratiques sur CHIC, est toujours souligné favorablement à la fois
par les chercheurs chevronnés et par les jeunes chercheurs. Les débats,
quelquefois très animés qui ont
accompagné chacune des interventions ont été l’occasion de préciser et de
spécifier certains points éclairant et guidant des recherches en cours ou à
venir. Unanimement, les participants ont souhaité la poursuite de telles
Rencontres. D’ores et déjà ASI 5 se profile. L’Université de Bratislava est la
première à manifester l’intention de l’organiser. Mais d’autres options
existent également. L’organisation
de ASI 4 par Pilar Orus, Pablo Gregori et leur équipe a été remarquable
d’efficacité et de rigueur. Les activités scientifiques et la restauration
quotidiennes se déroulaient à l’Université Jaume I. L’Hôtel Luz, au centre de
la ville offrait un confort excellent. La convivialité, la bonne humeur ont
régné pendant ces journées, toujours ensoleillées, ponctuées par un repas de
gala très méditerranéen et une promenade au site enchanteur de Peniscola. Rappelons,
en les remerciant, les divers organismes ayant apporté leur soutien à ASI
4 : -
Escuela Superior de Tecnología y
Ciencias Experimentales de la Universitat Jaume I -
Departamento de Matemáticas de la Universitat Jaume I -
Service de la Science
et de la Technologie (Ambassade de
France en Espagne) -
Fundació Caixa
Castelló–Bancaixa (Plan de
Promoción de la Investigación 2007 de la Universitat Jaume I) -
Diputació de Castelló - Generalitat Valenciana -
Association pour la
Recherche en Didactique des Mathématiques (ARDM) -
Association
Extraction et Gestion des Connaissances (EGC) -
Laboratoire
d’Informatique de Nantes (LINA) -
Société
PerformanSe SA,Carquefou- Nantes et le parrainage scientifique de : -
Sociedad de Estadística e Investigación Operativa (SEIO)
de España, - Sociedad de Estadistica
e Investigacion Operativa (SEIO) de Espana -
Socità Italiana di
Statistica (SIS) - Société
Française de Statistique (SFdS) - Société
Francophone de Classification (SFC) -
International Association for Statistical
Education (IASE) Régis
Gras, Président du Comité Scientifique [1] Belgique, Brésil, Chili, Chypre, Costa-Rica, Cuba, Espagne, France, Grèce, Italie, Japon, Slovaquie et Suisse, . [2] Les langues espagnole, portugaise, anglaise et française étaient tour à tour utilisées sans faire obstacle à la compréhension en raison de l’usage systématique de deux langues pour chaque intervention. [3] Editeurs : Régis Gras,
Pilar Orus, Bruno Pinaud, Pablo Gregori |