Moduł Reinforcement Learning Toolbox udostępnia funkcje i bloki dla strategii szkoleniowych wykorzystujących algorytmy uczenia się ze wzmacnianiem, w tym DQN, A2C i DDPG. Przy pomocy tych zasad można projektować kontrolery i algorytmy podejmowania decyzji dla złożonych systemów, takich jak roboty i systemy autonomiczne. Zasady postępowania można zaimplementować za pomocą głębokich sieci neuronowych, wielomianów lub tablicowania .
Zestaw narzędzi umożliwia tworzenie strategii i zasad oraz ich interakcji ze środowiskami reprezentowanymi przez modele MATLABa lub Simulinka. Pozwala również na weryfikację działania algorytmów, dobór ich parametrów oraz monitorowanie postępu uczenia. Aby poprawić wydajność uczenia, możliwe jest przyspieszanie symulacji przy pomocy obliczeń równoległych w chmurze lub na klastrach komputerowych i GPU (moduły: Parallel Computing Toolbox i/lub MATLAB Parallel Server).
Dzięki wsparciu dla formatu ONNX, istniejące zasady i modele mogą być importowane z głębokich sieci neuronowych uczonych w środowiskach, takich jak TensorFlow ™ Keras i PyTorch (przy pomocy Deep Learning Toolbox). Możliwa jest również automatyczna generacja zoptymalizowanego kodu C, C++ oraz CUDA w celu wdrożenia zaprojektowanych algorytmów na mikrokontrolerach i GPU.
Moduł Reinforcement Learning Toolbox zawiera przykłady przedstawiające sposób wykorzystania uczenia się przez wzmacnianie do projektowania sterowników dla robotyki i aplikacji dla autonomicznych pojazdów.