TABLE DES MATIERES

1 Introduction_______________________________________________ 14

1.1 Problématique__________________________________________________ 14

1.2 Plan de l’exposé________________________________________________ 15

2 Les jeux__________________________________________________ 17

2.1 Pourquoi étudier les jeux________________________________________ 17

2.2 Différents types de jeux__________________________________________ 18

2.2.1 Information disponible__________________________________________________ 18

2.2.2 Equité_______________________________________________________________ 22

2.2.3 Somme des jeux______________________________________________________ 22

2.2.4 Itération_____________________________________________________________ 22

2.3 Résultats de la Théorie des jeux__________________________________ 23

2.3.1 Information complète et parfaite__________________________________________ 23

2.3.2 Information complète et imparfaite________________________________________ 23

2.3.3 Information incomplète_________________________________________________ 24

2.4 Le travail présenté______________________________________________ 24

2.5 Jeux et intelligence artificielle____________________________________ 25

3 Anticipation_______________________________________________ 27

3.1 Définition______________________________________________________ 27

3.1.1 L'anticipation stratégique_______________________________________________ 27

3.1.2 L'anticipation aveugle__________________________________________________ 27

3.2 Domaines de recherche__________________________________________ 28

3.3 Les méthodes de l’Anticipation____________________________________ 29

3.4 Théorie de l'anticipation_________________________________________ 32

3.5 Applications publiées____________________________________________ 34

3.5.1 En Mathématiques :___________________________________________________ 34

3.5.2 En Economie :________________________________________________________ 35

3.5.3 En systèmes / logiciels (performances et optimisations) :_____________________ 35

3.5.4 En Robotique / Cybernetique :___________________________________________ 36

3.5.5 En Sciences Naturelles :_______________________________________________ 36

3.5.6 Dans le domaine des agents d’interface___________________________________ 37

3.5.7 Les Animats :________________________________________________________ 37

3.5.8 Divers :______________________________________________________________ 38

3.6 Analyse et critique de ces travaux :________________________________ 38

3.7 Problématique de l’Anticipation___________________________________ 40

3.8 Influence de l’anticipant sur l’anticipé______________________________ 40

4 Théorie des jeux___________________________________________ 43

4.1 Présentation___________________________________________________ 43

4.2 Les règles du jeu_______________________________________________ 44

4.3 Jeux sous forme extensive_______________________________________ 44

4.3.1 Exemple_____________________________________________________________ 45

4.3.2 Arbre simplifié________________________________________________________ 47

4.3.3 Exemple_____________________________________________________________ 47

4.3.4 Résolution des jeux sous forme extensive simplifiée_________________________ 48

4.4 Stratégies : forme normale_______________________________________ 54

4.4.1 Exemple_____________________________________________________________ 54

4.5 Equilibres______________________________________________________ 55

4.5.1 Définition____________________________________________________________ 55

4.5.2 Exemples____________________________________________________________ 55

4.5.3 Théorème____________________________________________________________ 56

4.6 Des jeux particuliers_____________________________________________ 56

4.6.1 Définition____________________________________________________________ 57

4.6.2 Théorème____________________________________________________________ 57

4.6.3 Point selle___________________________________________________________ 57

4.6.4 Stratégies mixtes_____________________________________________________ 58

4.6.5 Le théorème du MinMax________________________________________________ 59

4.6.6 Le théorème des stratégies optimales_____________________________________ 60

4.6.7 Détermination des stratégies optimales____________________________________ 60

4.6.8 Jeux 2 x n et jeux m x 2________________________________________________ 65

4.6.9 Cas général__________________________________________________________ 66

4.7 Les limites de la théorie des jeux__________________________________ 66

4.7.1 Jeux à information complète et parfaite____________________________________ 66

4.7.2 Jeux à information complète mais imparfaite________________________________ 69

4.7.3 Jeux à information incomplète___________________________________________ 70

4.8 Les limites des applications partielles de la théorie des jeux__________ 70

4.8.1 Les fonctions d’évaluation_______________________________________________ 70

4.8.2 La profondeur de recherche_____________________________________________ 71

4.9 Intérêt du cadre théorique________________________________________ 72

5 Apprentissage et Anticipation dans les jeux_____________________ 73

5.1 Apprentissage dans les jeux______________________________________ 73

5.1.1 Apprentissage par cœur________________________________________________ 73

5.1.2 Apprentissage supervisé________________________________________________ 75

5.1.3 Apprentissage par renforcement__________________________________________ 75

5.1.4 Apprentissage par découverte___________________________________________ 84

5.2 L’anticipation dans les jeux_______________________________________ 85

Le modèle coopératif :________________________________________________________ 86

5.2.2 Le modèle passif :_____________________________________________________ 87

5.2.3 Le modèle compétitif :__________________________________________________ 88

5.2.4 Modélisation de l’adversaire_____________________________________________ 90

5.2.5 Quelques systèmes utilisant un modèle de l’adversaire_______________________ 91

5.2.6 Les contre-mesures__________________________________________________ 101

6 Les stratégies humaines____________________________________ 105

6.1 Introduction___________________________________________________ 105

6.2 La mémoire humaine____________________________________________ 106

6.2.1 Mémoire sensorielle__________________________________________________ 107

6.2.2 Mémoire à court terme________________________________________________ 107

6.2.3 Mémoire à long terme_________________________________________________ 108

6.2.4 Mémoire et stratégies humaines________________________________________ 108

6.3 Le hasard_____________________________________________________ 110

6.3.1 Les problèmes du hasard______________________________________________ 110

6.3.2 L’humain est-il capable de manipuler le hasard ?___________________________ 111

6.4 L’adaptation___________________________________________________ 113

6.4.1 Adaptations réactives_________________________________________________ 113

6.4.2 Adaptations cognitives________________________________________________ 114

6.5 L’apprentissage________________________________________________ 114

6.5.1 Apprentissage par cœur_______________________________________________ 114

6.5.2 Apprentissage supervisé_______________________________________________ 114

6.5.3 Apprentissage par imitation____________________________________________ 115

6.5.4 Apprentissage par renforcement_________________________________________ 115

6.5.5 Apprentissage par découverte__________________________________________ 115

6.6 La rationalité__________________________________________________ 115

6.7 Les fonctions d’utilité___________________________________________ 117

6.8 Anticipation___________________________________________________ 118

6.8.1 Modélisation________________________________________________________ 118

6.8.2 Réflexivité de l’anticipation_____________________________________________ 118

6.9 Prise en compte des stratégies humaines_________________________ 119

7 La méthode S.A.G.A.C.E.___________________________________ 124

7.1 Introduction___________________________________________________ 124

7.2 Les systèmes de classeurs______________________________________ 126

7.2.1 Les différents modules d’un système de classeurs_________________________ 126

7.2.2 Cycles d’un système de classeur_______________________________________ 128

7.2.3 Apprentissage dans les systèmes de classeurs____________________________ 129

7.3 Les jeux utilisés_______________________________________________ 136

7.3.1 Pair / Impair (ou « matching pennies »)___________________________________ 137

7.3.2 Pierre / Ciseaux / Papier_______________________________________________ 137

7.3.3 ALESIA____________________________________________________________ 138

7.3.4 Le jeu des trois pierres________________________________________________ 139

7.3.5 SUNTZU____________________________________________________________ 140

7.4 Architecture générale de S.A.G.A.C.E._____________________________ 143

7.5 Implémentation de S.A.G.A.C.E.__________________________________ 145

7.5.1 Les bases de règles du S.C. Stratégique_________________________________ 145

7.5.2 Les bases de règles du S.C. d’anticipation________________________________ 168

7.5.3 L’interface entre les deux systèmes de classeurs__________________________ 180

7.5.4 Entraînement du système (génération de situations)________________________ 185

8 Expérimentations_________________________________________ 187

8.1 S.A.G.A.C.E. pour SUNTZU : Méthodes de créations de règles________ 187

8.1.1 Algorithme génétique_________________________________________________ 189

8.1.2 Généralisation_______________________________________________________ 189

8.1.3 Imitation____________________________________________________________ 189

8.1.4 Regrets____________________________________________________________ 190

8.1.5 Combinaison des méthodes____________________________________________ 191

8.2 S.A.G.A.C.E. pour ALESIA________________________________________ 192

8.2.1 Jeux contre un adversaire artificiel simple_________________________________ 192

8.2.2 Adversaires probabilistes______________________________________________ 193

8.2.3 Adversaires théoricien_________________________________________________ 195

8.2.4 Adversaires adaptatifs_________________________________________________ 195

8.2.5 Adversaires théoriciens adaptatifs_______________________________________ 197

8.2.6 Jeux contre NASH____________________________________________________ 202

8.2.7 Jeux contre un adversaire humain_______________________________________ 205

8.2.8 Une série d’étude____________________________________________________ 207

8.2.9 Création de règles____________________________________________________ 209

8.3 S.A.G.A.C.E. pour « Pierre / Ciseaux / Papier »______________________ 210

8.3.1 L’algorithme de Minasi________________________________________________ 210

8.3.2 « Minasi » contre un adversaire humain_______ ___________________________ 212

8.3.3 S.A.G.A.C.E. contre un adversaire humain_______________________________ 213

8.3.4 S.A.G.A.C.E. contre « Minasi »________________________________________ 215

8.4 S.A.G.A.C.E. pour « Pair / impair » (ou « Matching Pennies »)_________ 216

8.4.1 L’algorithme de Shannon______________________________________________ 216

8.4.2 « Shannon » contre des joueurs humains_________________________________ 218

8.4.3. « Minasi » contre un adversaire humain_________________________________ 219

8.4.4 S.A.G.A.C.E. contre un adversaire humain________________________________ 220

8.4.5 Prédiction et hasard__________________________________________________ 221

8.4.6 Martingale__________________________________________________________ 222

8.4.7 Autres séries d‘expériences____________________________________________ 222

8.5 S.A.G.A.C.E. pour le jeu des trois pierres__________________________ 227

8.5.1 Théorie contre un adversaire humain_____________________________________ 227

8.5.2 Apprentissage par renforcement contre un adversaire humain_________________ 228

8.5.3 S.A.G.A.C.E. contre un adversaire humain________________________________ 231

9 Conclusions et perspectives_________________________________ 232

9.1 Résumé_______________________________________________________ 232

9.2 Qualités de S.A.G.A.C.E._________________________________________ 232

9.3 Limitations de S.A.G.A.C.E_______________________________________ 233

9.3.1 les Métaconnaissances_______________________________________________ 233

9.3.2 le bluff______________________________________________________________ 234

9.4 1^ère Perpective. Ajout d’une nouvelle dimension : le bluff____________ 234

9.4.1 Bluff par imitation_____________________________________________________ 235

9.4.2 Bluff par « regrets »___________________________________________________ 236

9.4.3 Bluff par recombinaison de critères______________________________________ 236

9.4.4 Choix d’un jeu approprié_______________________________________________ 236

9.5 2^ème Perpective : généralisation de l’approche_____________________ 237

9.6 3^ème Perpective : application à d’autres domaines___________________ 237

9.6.1 Méthode des regrets__________________________________________________ 237

9.6.2 Amorçage__________________________________________________________ 238

9.6.3 Interfaces collaboratrices hommes-machines______________________________ 238

ANNEXE A Captures d’écran___________________________ 239

ANNEXE B SUNTZU - exemples -__________________ 244

ANNEXE C ALESIA - aspects théoriques -_________________ 249

10 Bibliographie_____________________________________________ 254