1                   Introduction

1.1              Problématique

Cette thèse repose d’éternelles questions et sur le constat qu’elles n’ont, à ce jour, pas reçues de réponses pleinement satisfaisantes.

Si les machines n’étaient jusqu’aujourd’hui uniquement dévolues aux travaux physiquement pénibles pour des humains, le besoin se fait pressant de mettre à disposition de l’Homme des machines capables de l’assister dans des tâches qui requièrent de l’intelligence (robots autonomes, assistants électroniques, objets technologiques personnalisés, agents d’interface, etc.). L’intelligence d’un individu est communément évaluée en fonction de certaines capacités particulières : l’Apprentissage, l’Adaptation et l’Anticipation. Un système artificiel censé remplir les fonctions définies précédemment devrait disposer des mêmes facultés. Cela semble, en effet, indispensable pour que la coopération homme-machine soit efficace.

Nécessairement, ces machines doivent être capables de s’adapter à l’Homme, notamment en anticipant ses comportements pour ne pas les contrarier à mauvais escient. Par ailleurs,  certaines machines seront utiles pour assister un utilisateur humain dans les négociations ou les affrontements avec d’autres humains dans des domaines divers (économiques, militaires, politiques, diplomatiques, etc.). 

Pour tout cela, nous avons choisi de développer une méthode générique pour l’anticipation de comportements humains (et plus généralement de comportements évolutifs1). Nous avons choisi de limiter, dans le cadre de cette thèse, l’étude de telles anticipations dans un domaine vaste et facilement transposable : celui des jeux de réflexion.

La Théorie des Jeux permet d’appréhender efficacement certains types de jeux et offrirait une solution acceptable au problème posé si elle n’avait pas de sérieuses limitations que nous décrirons. De fait, les théories apportent souvent des solutions parfaites dans un contexte singulier et stable, mais s’avèrent inadaptées aux problèmes dynamiques dont les données changent continuellement. Or, le facteur humain rend tout problème dynamique parce que l’Homme s’adapte, se montre parfois irrationnel et, par-là même, non déterministe.

 

1.2              Plan de l’exposé

Les jeux

Ce chapitre expose les raisons pour lesquelles cette thèse traite essentiellement de l’anticipation de comportements évolutifs dans un contexte de jeu.

Il indique les différents types de jeux et les résultats de la Théorie des Jeux pour chacune de ces catégories ainsi que les approches pratiques classiques. Il dévoile également dans quel cadre s’inscrit le travail présenté.

Anticipation

Après quelques définitions, ce chapitre présente une théorie générale de l’anticipation ainsi que certains domaines de recherche concernés par ce sujet. Un certain nombre d’applications publiées sont succinctement décrites ainsi que les raisons pour lesquelles ces approches ne sauraient répondre de façon satisfaisante aux buts fixés par ce travail.

Théorie des Jeux

Ce chapitre nous a semblé indispensable dans la mesure où il expose de façon relativement détaillée la Théorie des Jeux et les raisons qui la rendent relativement inadaptée à la problématique de cette thèse. Il contribue à inscrire notre travail dans un cadre théorique général.

Apprentissage et Anticipation dans les jeux

Sont énumérées dans ce chapitre les différentes méthodes classiques d’apprentissage et particulièrement celles qui ont été utilisées (avec ou sans succès) pour la réalisation de programmes de jeux.

Nous décrivons également les raisons rendant indispensables des capacités d’anticipation pour le type de jeux concernés par ce travail. Quelques systèmes utilisant un modèle des adversaires pour l'anticipation sont décrits.

Les stratégies humaines

Ce chapitre éclaire le lecteur sur les stratégies développées par les joueurs humains qui ont été intégrées à la méthode S.A.G.A.C.E. Il traite de la mémoire, de la gestion du hasard, de l’adaptation, de l’apprentissage, de la rationalité (ou plutôt son absence), de la modélisation.

La méthode S.A.G.A.C.E.

Après avoir proposé une présentation des systèmes de classeurs, puis une description des différents jeux utilisés dans le cadre de cette thèse, ce chapitre décrit la méthode S.A.G.A.C.E. en détails.

S.A.G.A.C.E. est illustrée à l’aide de nombreux exemples de jeux ayant fait l’objet d’implémentations qui sont décrites et commentées dans le chapitre suivant.

Expérimentations

S.A.G.A.C.E. a été implémentée pour cinq jeux différents et ce chapitre décrit les expériences et les résultats correspondants.

Conclusions et perspectives

Le titre de ce chapitre se suffit à lui-même.

Annexe A ; Captures d’écran

A titre informatif, certaines copies d’écran des différentes implémentations de S.A.G.A.C.E. sont décrites dans cette partie.

Annexe B ; Suntzu – exemples

Suntzu est un jeu complexe et cette partie lui est dévolue. Elle présente le formalisme des règles implémentées et un exemple de généralisation.

Annexe C ; Alésia – aspects théoriques

Pour ce jeu, nous avons démontré qu’aucune stratégie pure n’était envisageable. Cette démonstration est présentée à titre informatif. Il nous a paru important, pour ce jeu du moins, de montrer pourquoi une approche telle que S.A.G.A.C.E. est indispensable.


 

1 Il faudra bien, par exemple, anticiper également certains comportements d’assistants évoluant en fonction de leurs utilisateurs.