总结文献
不要联网搜索,你现在是一个强化学习领域的博士生,现在需要帮我按照下面的内容总结这篇文章:
1. 先概述这篇文章提出了什么方法,利用了什么技术,实现了什么效果?
2. 他们的方案相比过去的方案有哪些优势,解决了什么过去的方法解决不了的问题?
3. 请结合method章节的内容,详细描述该方法的main procedure,关键变量请使用latex展示。
4. 请结合experiments章节,总结该方法在什么任务上,实现了什么性能?请列出具体的数值。
5. 请结合conclusion章节,总结这个方法还存在什么问题?
请用中文回答我。