Compte rendu de la 3ème Rencontre Internationale sur l’Analyse Statistique Implicative A.S.I. 3, de Palerme (du 6 au 8 Octobre 2005)
Cette Troisième
Rencontre fait suite aux Journées intitulées « La fouille dans les données
par la Méthode Statistique Implicative » qui se sont déroulées à l’Institut
de Formation des Maîtres de Caen les 23-24 Juin 2000. Elles étaient organisées
par Marc Bailleul et Régis Gras. Ces Journées Caennaises ont été suivies par le
Colloque « O metodo estatístico implicativo utilizado em estudos
qualitativos de Régis Gras de associação. Contribuição à pesquisa em Educaçao »
à l’Université PUC de São Paulo 9-11 Juillet 2003, organisé par Saddo Ag
Almouloud. Ainsi, suite à l’intérêt porté à ces Journées, c’est la 3ème
fois que se rassemblent des chercheurs représentant de nombreuses nationalités [1] * par Filippo Spagnolo (Président du Comité d’organisation), déjà organisateur de la Rencontre de la CIAEM en juillet, * et Régis Gras (Président du Comité scientifique et de programme). Elle a réuni 43 participants. Rappelons que la "fouille dans des données » (encore appelée "Knowledge Discovery in Databases" ou encore "Data Mining" dans la littérature anglo-saxonne) part, en général, du croisement de sujets (ou objets) et de variables (propriétés ou attributs) binaires, ordinales ou numériques. Son objectif majeur consiste à conjecturer des modèles basés sur des relations quantitatives ou qualitatives et des structures induites à partir des données. Différentes méthodes, comme l’Analyse Factorielle des Correspondances (A.F.C.), la Classification Ascendante Hiérarchique (C.A.H.), sont communément utilisées pour de telles fouilles dans des données. Parmi elles, l'Analyse Statistique Implicative (A.S.I.), née de problématiques didactiques en mathématiques, fondée et dévelopoée par Régis Gras et son équipe, vise l’extraction de connaissances, d’invariants, de règles inductives non symétriques consistantes, et accorde une mesure à des propositions du type « quand a est choisi, on a tendance à choisir b ». Pour cela, elle quantifie la qualité de ces règles sur la base statistique d'un nombre significatif de contre-exemples où la règle n’est pas vérifiée et où certains déséquilibres cardinaux sont observés parmi les exemples et les contre-exemples à l’implication et à sa contraposée. Le logiciel, dénommé CHIC (Classification Hiérarchique Implicative et Cohésitive), développé au début des années 90 par Saddo Ag Almouloud et, depuis, par Raphaël Couturier, permet : - de traiter différents types de variables (binaires, modales, fréquentielles, intervalles, floues), - de quantifier la significativité des valeurs attribuées à la qualité, la consistance de la règle associée, de classes ordonnées de règles, - de quantifier la typicalité et la contribution de sujets ou de catégories de sujets à certaines règles, - de représenter par un graphe, pour un seuil de qualité choisi, des chemins de règles et, par une hiérarchie, des règles sur des règles que l’on appelle aussi règles généralisées, - de supprimer, d'ajouter, de conjoindre des variables. - de représenter par une hiérarchie ascendante les classes de similarité des variables. Pendant ces trois Journées, 24 communications et 3 conférences de chercheurs de plusieurs pays ont rendu compte de travaux théoriques ou applicatifs et de résultats significatifs obtenus dans différents domaines par une "fouille" dans leurs propres données. Ces résultats, précédés de la conférence de Régis Gras sur un rappel des concepts mathématiques fondamentaux de l’A.S.I., ont fait l’objet des communications de la 1ère Journée. L’A.S.I. a permis de faire apparaître, de façon complémentaire et comparative à des méthodes factorielles ou taxonomiques, des règles en bio-informatique, en psychologie sociale, en éducation, etc.. Des travaux pratiques sur CHIC ont permis une meilleure prise en mains de ce logiciel et uen compréhension approfondie de la théorie sous-jacente. La conférence de Filippo Spagnolo en ouverture de la 2ème Journée, a mis en parallèle les méthodologies respectives en A.F.C. et en A.S.I.. Les communications qui ont suivi cette conférence ont pu souvent illustrer cette comparaison à partir de situations observées en Didactique des Mathématiques. La 3ème Journée, ouverte par la conférence de Pascale Kuntz sur la construction d’un modèle original de hiérarchie ascendante, non symétrique en A.S.I., a présenté quelques concepts théoriques statistiques de règles d’association en relation plus ou moins étroite avec l’A.S.I.. Des Actes (352 pages) regroupant les conférences et les communications ont pu être distribués à chacun des participants dès son arrivée. Au cours de l’année 2005, plusieurs membres du comité scientifique avaient été mis à contribution pour lire, critiquer et homogénéiser les papiers proposés, certains n’ayant pas été retenus à la suite des échanges avec leurs auteurs. La mise en forme définitive et le tirage ont été effectués par une équipe autour de Filippo Spagnolo à l’Université de Palerme (groupe GRIM). Un site ouvert par F.Spagnolo (http://math.unipa.it/~grim/asi/asi_index.htm) permet d’accéder, non seulement à ces actes, mais également à ceux de A.S.I. 1 (Caen 2000) et A.S.I. 2 (São Paulo 2003), ainsi qu’à des photos prises pendant les Journées.. Au cours de ces Rencontres, le choix d’une alternance équilibrée de communications théoriques ou appliquées et de travaux pratiques sur CHIC, est toujours souligné favorablement à la fois par les chercheurs chevronnés et par les jeunes chercheurs. Car ce sont les démarches perçues et dévoilées de conceptualisation, d’analyse et d’interprétation qui sont les plus utiles aux uns et aux autres. Les débats qui ont accompagné chacune des interventions ont été l’occasion de préciser et de spécifier certains points permettant d’éclairer et de guider des recherches en cours ou à venir. Nous avions tenu à regrouper dans le même lieu, l’Hôtel Villagio Città del Mare à Terrasini, près de la mer, près de Palerme, et de son aéroport, à la fois les activités scientifiques, l’hébergement et la restauration. Les conditions de travail, le cadre et le confort de cet Hôtel ont conduit à une excellente convivialité et à la continuité des échanges.
Rappelons, en les remerciant, les divers soutiens accordés à ASI 3 : l’Association pour la Recherche en Didactique des Mathématiques (ARDM), l’Association Extraction et Gestion des Connaissances (EGC), l’Université de Palerme, la Faculté des Sciences de la Formation de l’Université de Palerme, l’Ecole Polytechnique de l’Université de Nantes, le Laboratoire d’Informatique de Nantes Atalantique (LINA), le Gruppo di Ricerca sul l’Insegnamento della Matematiche (GRIM) la Société PerformanSe SA,Carquefou- Nantes,
et le parrainage scientifique de : La Socità Italiana di Statistica (SIS) la Société française de Statistique (SFdS) la Société Francophone de Classification (SFC), l’International Association for Statistical Education (IASE)
Régis Gras |