Publication search
with Advantage Actor-Critic as keyword
petráň, marcel
V posledních letech se ukázalo, že posilované učení je velmi slibné při řešení složitých her. Tento výzkum se zabývá aplikací technik posilování učení na sběratelské karetní hry se zaměřením na Hearthstone. Použili jsme algoritmy Proximal Policy Optimization (PPO) a Advantage Actor-Critic (A2C) k trénování agentů v různých scénářích. Náš výzkum zah...
Adjei, Derrick
This thesis explores the application of Reinforcement Learning (RL) to production job scheduling, specifically within the context of a factory environment. We developed an environment reflecting the dynamic operations of a factory floor, incorporating machines, jobs, and operations to be performed on jobs called recipes. We train Deep Q-Network (DQ...
Geursen, Izaak (author)
Current state-of-the-art airline planning models are required to decrease models either in size or complexity due to computational limitations, limiting the
operational applicability to problems of representative sizes. Models return suboptimal solutions, especially when confronted with factors of uncertainty. Considering the growing interest in th...