Pre-LN|归一化提高预训练、缓解梯度不匹配,Facebook的模型超越GPT-3 在原始的Transformer架构中,LayerNorm通常在Residual之后,称之为Post-LN(Post-LayerNormalization)Transf... 2021-10-27
模拟|教机器人捏橡皮泥?MIT、IBM, UCSD等联合发布软体操作数据集PlasticineLab 虚拟环境(ALE、MuJoCo、OpenAIGym)极大地促进了在智能体控制和规划方面学习算法的发展和评估... 2021-06-21
世界|NeurIPS 2020 | 清华联合密歇根大学: 兼顾想象与现实的基于模型强化学习算法 为了提高样本利用效率,越来越多研究者们关注基于模型的强化学习,建立世界模型并基于虚... 2021-02-25