construction d’un sma
DESCRIPTION
Construction d’un SMA. Approche réactive: Inspiration des sociétés d’insectes. Quelques exemples Tri collectif Fourragement (fourmis) Les robots fourrageurs Applications du monde réel Routage dans les réseaux Équilibrage dynamique multicritères Sécurité dans les réseaux. Tri Collectif. - PowerPoint PPT PresentationTRANSCRIPT
Construction d’un SMA
Approche réactive: Inspiration des sociétés d’insectes
Quelques exemples Tri collectif Fourragement (fourmis)
Les robots fourrageursApplications du monde réel
• Routage dans les réseaux• Équilibrage dynamique multicritères• Sécurité dans les réseaux
Tri Collectif
Tri Collectif (Deneubourg & al 91)(Drogoul 93) Problème: Trier des objets de types différents Critère d’arrêt: structure de l’environnement avec des tas homogènes de
chaque type d’objet Principes:
Déplacement aléatoire des agents (par défaut) Capacité de discriminer des objets à trier Mémoire à court et moyen terme des dernières cases visitées Possibilité de déposer/ramasser en fonction de la densité d’objets de même type
(dans leurs mémoires) Regroupement de plusieurs objets de même type sur une case réduit l’intensité
du stimulus émis
Tri Collectif
Environnement : ensemble de cases contiguës Objets:
Etat initial Etat final
Tri Collectif
Constat 1:
Structuration de l’environnement a pour effet la structuration des agents=> focalisation des agents sur les objets non triés
Renforcement d’actions Focalisation des agents sur certains types d’objets : spécialisation des agents
Structuration sociale
Constat 2:
Structuration sociale bénéfique à la structuration de l’environnement Convergence plus rapide vers un tas par type d’objets
Tri Collectif
Remarques:
Pas de comportement émergent La fonctionnalité peut-être obtenue avec un seul agent (robustesse) En revanche, fonctionnalité amplifiée par une
structure sociale émergente
=> répartition dynamique des tâches
Application (cas réel): Organisation dynamique de documents sur le web
Approche réactive: Inspiration des sociétés d’insectes
Fourragement (fourmis)
Nid
SourceSource
Source
Exploration aléatoire de l’environnementDétection de source de nourritureCollecte et retour en ligne droite vers le nidMarquage du chemin de retour (phéromone)
Source
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Phénomène autocatalytique
Source
Les fourmis découvrent les chemins les plus courts de la source de nourriture au nid.
Dépôt de phéromone sur le chemin menant à la sourcePlus la concentration en phéromone est élevée sur un chemin, plus il a des chances d’être empruntéLa phéromone s’évapore au cours du temps
3 mécanismes: diffusion, évaporation, enrollement
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Applications
En recherche opérationnelle : plusieurs applications Exemple: Problème du voyageur de commerce (TSP)
Un ensemble de villes reliées entre elles par des arcs définissant une certaine distance. Le problème est de trouver le chemin minimal, permettant de ne parcourir chaque ville qu’une fois.
Méta-heuristique ACO (inspirée des fourmis) Des fourmis sont positionnées aléatoirement sur les différents sommets Chaque arc se voit attribuer en plus de sa longueur un taux de phéromone A chaque itération une règle globale fait s’évaporer une quantité de phéromone et
augmente le taux de phéromone des arcs contribuant au plus court chemin
Métaphore de fourragement
Robots fourrageurs (Steels 88, Drogoul 93): Problème: équipe de petits robots autonomes qui récoltent des échantillons de
minerais dans un environnement inconnu,et les ramènent à une base centrale.
=> double problème posé aux robots Récolte d’échantillons Recherche efficace dans l’environnement (structuration de l’environnement en terme d’espaces explorés et non
explorés)
Principes: Populations de robots simples et autonomes Base émet un signal d’intensité décroissante avec la distance Source (tas) de minerais Capacité des robots à se déplacer, ramasser des minerais, les déposer
Métaphore de fourragement
Base
Expérience 1: Comportements du robot basique 1.Recherche aléatoire2. Ramassage du minerai3. Retour à la base4. Recherche aléatoire
Constat : Robots complètement inefficaces individuellement et collectivement Aucune exploitation de l’environnement (mémoire) pour repérer le lieu de leur dernière récolte=> Aucune interaction avec le groupe (échange d’info), aucune coopération
Drogoul 93
Métaphore de fourragement
Base
Expérience 2: Partage d’info par structuration de l’environnement
Les robots rentrent en ligne droite à la base en suivant le signal qu’elle émet , en marquant leur cheminMunir les robots de la capacité de déposer des marquesEt de la capacité de suivre un chemin marqué
Constat : Amélioration des performancesPartage effectif d’info: rétroaction positive sur le comportement global de fourragementPb: si minerai épuisé, les robots continuent à suivre une trace qui les mène vers une source inexploitable(information vide de sens toujours transmise)
Drogoul 93
Métaphore de fourragement
Base
Expérience 3: Supprimer l’info qui ne servira peut-être plus
Marquage de la piste en revenant de la source à la baseSupprimer la marque en suivant une piste
Constat : Performances dégradées du systèmeDynamique trop grande dan le partage de l’information
(création/suppression au même rythme)
L’information ne se propage pas assez pour créer un effet amplificateur
Drogoul 93
Métaphore de fourragement
Base
Expérience 4: Atténuer l’information qui ne servira peut-être plus sans complètement la détruire
Déposer 2 marques au lieu d’une en revenant de la source à la baseSupprimer 1 marque en suivant une piste
Constat : Meilleure solutionPartage d’info souple, coopération globale
Autre constat : Baisse des performances au delà d’un certain nombre de robotsNon prise en compte des contraintes environnementales: encombrementDispersion des traces à cause des déviations des robots pour s’éviterPas de coordination (blocage)
Drogoul 93
Métaphore de fourragement
Base
Expérience 5: Ajout d’un comportement de prise opportuniste
Un robot suivant une piste vers la source et qui croise un autre robot qui en revient, chargé d’un minerai, le détrousse.Capture du minerai là ou il se trouve
Constat : Meilleure solution que précédemment et surtout stabilité à partir d’une certaine densité
Autres constat : émergence d’une structure prenant la forme d’une chaîneTaux de fréquentation des pistes bien supérieur => épuisement d’un gisement vite repérééparpillement des pistes marginales=> concentration de l’info là où il le faut
Structuration sociale (formation de chaîne) et spatiale (chemins optimaux) et action permanente de l’une sur l’autre
Drogoul 93
Approche réactive: inspiration des sociétés d’insectes
Fourragement (fourmis): Applications (Real world) En télécommunication : routage de réseaux
En réseaux informatiques: Equilibrage dynamique de charge Equilibrage dynamique multicritères En sécurité: réponse distribuée et dynamique à la détection d’intrusion
Quelques références
Russell & Norvig, A modern approach for Artificial Intelligence, Prentice Hall 1995 J. Ferber, Les systèmes multiagents, edition Un cours sur les SMA à l’université laval (Québec) pointant vers d’autres cours:
http://www.damas.ift.ulaval.ca/~coursMAS/ Page personnelle de Marco Dorigo: http://iridia.ulb.ac.be/%7EDorigo Quelques pointeurs vers des environnements de simulation:
Page de starlogo : http://el.www.media.mit.edu/groups/el/Projects/starlogo/ Page de swarm: http://www.swarm.org
Merci :))