Matches in SemOpenAlex for { <https://semopenalex.org/work/W87408738> ?p ?o ?g. }
Showing items 1 to 47 of
47
with 100 items per page.
- W87408738 abstract "Resume : Dans le cadre de l’apprentissage multiagent, de nombreux travaux ont cherche jusqu’a present a etablir des algorithmes convergents vers un equilibre de Nash en jeux stochastiques. De tels algorithmes sont cependant limites dans la mesure ou ils sont incapables de gerer la multiplicite des equilibres de Nash et de converger vers l’equilibre Pareto-optimal si celui-ci existe. Ces algorithmes utilisent generalement une convention pour la selection de l’equilibre de Nash le plus approprie en cas d’equilibres multiples. Pour palier a cela, nous proposons un algorithme d’apprentissage etendant le Q-learning aux jeux stochastiques non-cooperatifs, qui converge en jeux uniformes (en anglais “self-play”, ce sont des jeux ou tous les agents utilisent le meme algorithme d’apprentissage) vers l’equilibre de Nash Pareto-optimal. Nous presentons des resultats experimentaux montrant la convergence d’un tel algorithme en jeux homogenes vers un equilibre de Nash, en tant qu’equilibre de meilleure reponse mutuelle (donc vers un equilibre de Nash Pareto-optimal), sans besoin de convention de coordination explicite." @default.
- W87408738 created "2016-06-24" @default.
- W87408738 creator A5002976111 @default.
- W87408738 creator A5057797080 @default.
- W87408738 date "2005-01-01" @default.
- W87408738 modified "2023-09-26" @default.
- W87408738 title "Apprentissage de la coordination multiagent : Q-learning par jeu adaptatif" @default.
- W87408738 cites W1481080069 @default.
- W87408738 cites W1542941925 @default.
- W87408738 cites W1605188341 @default.
- W87408738 cites W2096913736 @default.
- W87408738 cites W2097498347 @default.
- W87408738 cites W2103437045 @default.
- W87408738 cites W2104602264 @default.
- W87408738 cites W2107726111 @default.
- W87408738 cites W2110052587 @default.
- W87408738 cites W2119567691 @default.
- W87408738 cites W2120846115 @default.
- W87408738 cites W2125631327 @default.
- W87408738 cites W2145067550 @default.
- W87408738 cites W2164637474 @default.
- W87408738 cites W2341171179 @default.
- W87408738 cites W2575731723 @default.
- W87408738 hasPublicationYear "2005" @default.
- W87408738 type Work @default.
- W87408738 sameAs 87408738 @default.
- W87408738 citedByCount "0" @default.
- W87408738 crossrefType "journal-article" @default.
- W87408738 hasAuthorship W87408738A5002976111 @default.
- W87408738 hasAuthorship W87408738A5057797080 @default.
- W87408738 hasConcept C138885662 @default.
- W87408738 hasConcept C144237770 @default.
- W87408738 hasConcept C15708023 @default.
- W87408738 hasConcept C33923547 @default.
- W87408738 hasConcept C46814582 @default.
- W87408738 hasConceptScore W87408738C138885662 @default.
- W87408738 hasConceptScore W87408738C144237770 @default.
- W87408738 hasConceptScore W87408738C15708023 @default.
- W87408738 hasConceptScore W87408738C33923547 @default.
- W87408738 hasConceptScore W87408738C46814582 @default.
- W87408738 hasLocation W874087381 @default.
- W87408738 hasOpenAccess W87408738 @default.
- W87408738 hasPrimaryLocation W874087381 @default.
- W87408738 isParatext "false" @default.
- W87408738 isRetracted "false" @default.
- W87408738 magId "87408738" @default.
- W87408738 workType "article" @default.