多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習. 拓海, 青., 泰介, 小., & 謙二, 杉. 1月 2020. (1B1-1)
bibtex   
@conference{aotaniDAS2020,
  author = {青谷 拓海 and 小林 泰介 and 杉本 謙二},
  title = {多変量分布を用いた報酬予測による利害関係を考慮したマルチエージェント強化学習},
  booktitle = {自律分散システム・シンポジウム},
  year = {2020},
  month = {1月},
  note = {(1B1-1)},
  organization = {東京}
}

%Adaptive eligiblity traces 2020/1

Downloads: 0