筛选结果 3篇

【UCL+上交】开源RL框架OpenR
【UCL+上交】开源RL框架OpenR

OpenR 研究团队成员包括:汪军教授,伦敦大学学院(UCL)计算机系教授,阿兰・图灵研究所 Turing Fellow,其指导的 UCL 一年级博士生宋研。利...

edwin99
edwin99
39 0 7个月前
OpenRLHF对齐大模型技术报告分析
OpenRLHF对齐大模型技术报告分析

待定。

edwin99
edwin99
22 0 12个月前
在线迭代RLHF全流程解决方案
在线迭代RLHF全流程解决方案

待定。

edwin99
edwin99
26 0 1年前