Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic (2017)

First Author: Shixiang Gu

Attributed to: Unifying audio signal processing and machine learning: a fundamental framework for machine hearing funded by EPSRC

No abstract provided

Type: Conference/Paper/Proceeding/Abstract