Thomas Coste 个人学术档案 - 学术资源搜索

202320245 53

Thomas Coste

在 cam.ac.uk 的电子邮件经过验证


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Reward Model Ensembles Help Mitigate Overoptimization T Coste, U Anwar, R Kirk, D Krueger Twelfth International Conference on Learning Representations, 2023	43	2023
Pangu-agent: A fine-tunable generalist agent with structured reasoning F Christianos, G Papoudakis, M Zimmer, T Coste, Z Wu, J Chen, ... arXiv preprint arXiv:2312.14878, 2023	8	2023
Bayesian Reward Models for LLM Alignment AX Yang, M Robeyns, T Coste, J Wang, H Bou-Ammar, L Aitchison ICLR 2024 Workshop on Secure and Trustworthy Large Language Models, 2024	7	2024

系统目前无法执行此操作，请稍后再试。

文章 1–3

每年引用数