Spisu treści:
Definicja - Co oznacza Q-learning?
Q-learning jest terminem określającym strukturę algorytmu reprezentującą uczenie się wzmocnienia bez modelu. Oceniając politykę i stosując modelowanie stochastyczne, Q-learning znajduje najlepszą ścieżkę do przodu w procesie decyzyjnym Markowa.
Techopedia wyjaśnia Q-learning
Techniczny skład algorytmu Q-uczenia się obejmuje agenta, zestaw stanów i zestaw działań dla każdego stanu.
Funkcja Q wykorzystuje wagi dla różnych kroków w połączeniu ze współczynnikiem rabatu w celu wyceny nagród.
Chociaż może się to wydawać prostym pomysłem, Q-learning ma ogromne znaczenie w wielu rodzajach modeli uczenia wzmacniającego i uczenia głębokiego. Jednym z najlepszych przykładów jest wykorzystywanie głębokiego Q-learningu, aby pomóc programom uczenia maszynowego w nauce strategii gier w różnych typach gier wideo, na przykład w grach Atari z lat 80. Tutaj splotowa sieć neuronowa pobiera próbki gry, aby opracować stochastyczny model, który pomoże komputerowi z czasem lepiej grać w grę.
Q-learning ma duży potencjał w zakresie wspierania sztucznej inteligencji i uczenia maszynowego.
