Ciarletta, Laurent Abdallah, Idriss Henaff, Patrick Champagne, Jonathan Bonnavent, Matthieu
Dans le cadre de la mise au point de torpilles chez Naval group, les algorithmes de contrôles embarqués sont développés en simulation numérique. Le simulateur intègre plusieurs modèles pour évaluer les performances dans une mise en situation la plus plus proche de la réalité possible. Dans ce cadre, il est donc nécessaire de créer un modèle de l’op...
Pallez, Denis
Un problème d’optimisation est dit coûteux lorsque l’évaluation de l’intérêt d’une solution potentielle requiert un accès à des ressources très importantes, voire difficilement mobilisables. Ce type de problème pénalise fortement les méthodes d’optimisation pour trouver, dans un temps raisonnable ou plus généralement avec des ressources raisonnable...
Robledo Relaño, Francisco
This thesis presents advances in Reinforcement Learning (RL) algorithms for resource and policy management in Restless Multi-Armed Bandit (RMAB) problems. We develop algorithms through two approaches in this area. First, for problems with discrete and binary actions, which is the original case of RMAB, we have developed QWI and QWINN. These algorit...
Renard, Dimitri Annebicque, David Saddem, Ramla Roisin, Mathieu Riera, Bernard
This paper proposes a novel approach that combines Reinforcement Learning (RL) and IEC 61131-3 Programming Logic Controller (PLC) standards for generating logic controllers. We present a proof of concept to demonstrate the feasibility of this hybrid methodology, which could be implemented in a PLC environment.
Alaarabiou, Maxime Delestre, Nicolas Vercouter, Laurent
La problématique de l'explicabilité est à l'heure actuelle un enjeu important en intelligence artificielle, et plus spécifiquement en apprentissage par renforcement. Dans cet article, nous proposons une nouvelle classification des techniques d'explicabilité pour l'apprentissage par renforcement. Pour se faire, nous nous appuyons sur les aspects spé...
Brellmann, David
In Reinforcement Learning (RL), an agent learns how to act in an unknown environment in order to maximize its reward in the long run. In recent years, the use of neural networks has led to breakthroughs, e.g., in scalability. However, there are still gaps in our understanding of how to best employ neural networks in RL. In this thesis, we improve t...
Bujalance Martin, Jesús
Despite having known great success, reinforcement-learning algorithms still need to become more sample-efficient, particularly for robotics where it is much harder to train an agent outside of simulation. As the community leans towards data-driven approaches (offline reinforcement learning, decision transformers, etc.), in this thesis we focus on o...
Anne, Timothee
Doter des agents artificiels, tels que des robots, d'une capacité à apprendre à réaliser des tâches complexes et à s'adapter est une quête centrale de la recherche en intelligence artificielle. L'apprentissage par renforcement profond en est aujourd'hui une des méthodes privilégiées, mais n'est ni toujours simple à mettre en œuvre, ni toujours la p...
Calem, Laura
This PhD thesis, in the applicative context of autonomous driving, focuses on the exploration of diversity promoting mechanisms in generative models, which generate a probabilistic distribution of future trajectories given past trajectories. As trajectory forecasting datasets only provide one ground truth trajectory for a given past trajectory and ...
Vo, Thi Quynh Trang
Combinatorial optimization is a field of mathematics that searches for an optimal solution in a finite set of objects. It has crucial applications in many fields, including applied mathematics, software engineering, theoretical computer science, and machine learning. extit{Branch-and-cut} is one of the most widely-used algorithms for solving combin...