Yannis Flet-Berliac 个人学术档案

引用次数

	总计	2019 年至今
引用	404	393
h 指数	10	9
i10 指数	10	9

120

201720182019202020212022202320241 9 12 47 92 107 87 45

开放获取的出版物数量

查看全部

5 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Philippe PreuxProfessor of computer science, Université de Lille, LIFL, SequeL, INRIA在 univ-lille.fr 的电子邮件经过验证
Matthieu GeistCohere (ex Google, on leave of Professor, Université de Lorraine)在 univ-lorraine.fr 的电子邮件经过验证
Olivier PietquinCohere | ex Google DeepMind (On leave - Professor at University of Lille)在 univ-lille.fr 的电子邮件经过验证
Emma BrunskillAssociate Professor of Computer Science, Stanford University在 cs.stanford.edu 的电子邮件经过验证
Allen NieStanford University在 stanford.edu 的电子邮件经过验证
Johan FerretResearch Scientist, Google DeepMind在 google.com 的电子邮件经过验证
Odalric-Ambrym MaillardInria Lille - Nord Europe在 inria.fr 的电子邮件经过验证
Edouard LeurentDeepMind在 deepmind.com 的电子邮件经过验证
Omar Darwiche DominguesCohere在 cohere.com 的电子邮件经过验证
Pierre MénardOvGU Magdeburg在 inria.fr 的电子邮件经过验证
Xuedong ShangINRIA (SequeL -> SCOOL)在 inria.fr 的电子邮件经过验证
William SteenbergenStanford University在 stanford.edu 的电子邮件经过验证
Debabrota BasuFaculty, Inria at University of Lille and CNRS (CRIStAL)在 comp.nus.edu.sg 的电子邮件经过验证
Yao LiuAmazon在 stanford.edu 的电子邮件经过验证
Florian STRUBCohere在 cohere.com 的电子邮件经过验证
Kefan DongStanford University在 stanford.edu 的电子邮件经过验证
Michal ValkoLlama @ Meta Paris & Inria & MVA - Ex: Gemini and BYOL @ Google DeepMind在 meta.com 的电子邮件经过验证
Emilie KaufmannCNRS & Univ. Lille (CRIStAL)在 inria.fr 的电子邮件经过验证

关注

Yannis Flet-Berliac

Postdoc, Stanford University

在 stanford.edu 的电子邮件经过验证 - 首页

Machine Learning Reinforcement Learning Deep Learning Artificial Intelligence


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Temperature decreases spread parameters of the new Covid-19 case dynamics J Demongeot, Y Flet-Berliac, H Seligmann Biology 9 (5), 94, 2020	157	2020
Adversarially Guided Actor-Critic Y Flet-Berliac, J Ferret, O Pietquin, P Preux, M Geist ICLR 2021, 2021	79	2021
The Promise of Hierarchical Reinforcement Learning Y Flet-Berliac The Gradient, 2019	32	2019
Learning Value Functions in Deep Policy Gradients using Residual Variance Y Flet-Berliac, R Ouhamma, OA Maillard, P Preux ICLR 2021, 2021	21	2021
rlberry - A Reinforcement Learning Library for Research and Education OD Domingues, Y Flet-Berliac, E Leurent, P Ménard, X Shang, M Valko GitHub repository, 2021	18	2021
Hearables in hearing care: Discovering usage patterns through IoT devices B Johansen, Y Flet-Berliac, M Korzepa, P Sandholm, N Pontoppidan, ... International Conference on Universal Access in Human-Computer Interaction …, 2017	18	2017
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data A Nie, Y Flet-Berliac, D Richmond, W Steenbergen, E Brunskill NeurIPS 2022, 2022	14	2022
SAAC: Safe Reinforcement Learning as an Adversarial Game of Actor-Critics Y Flet-Berliac, D Basu RLDM 2022, 2022	12	2022
MERL: Multi-Head Reinforcement Learning Y Flet-Berliac, P Preux NeurIPS 2019 Deep Reinforcement Learning Workshop, 2019	12	2019
Learning Preferences and Soundscapes for Augmented Hearing MJ Korzepa, B Johansen, MK Petersen, J Larsen, JE Larsen, ... IUI Workshops, 2018	12	2018
Waypoint Transformer: Reinforcement Learning via Supervised Learning with Intermediate Targets A Badrinath, Y Flet-Berliac, A Nie, E Brunskill NeurIPS 2023, 2023	9	2023
Only Relevant Information Matters: Filtering Out Noisy Samples to Boost RL Y Flet-Berliac, P Preux IJCAI 2020, 2020	9*	2020
PASTA: Pretrained Action-State Transformer Agents R Boige, Y Flet-Berliac, A Flajolet, G Richard, T Pierrot NeurIPS 2023 Foundation Models for Decision Making Workshop, 2023	4	2023
Offline Policy Optimization with Eligible Actions Y Liu, Y Flet-Berliac, E Brunskill UAI 2022, 2022	4	2022
Model-based Offline Reinforcement Learning with Local Misspecification K Dong, Y Flet-Berliac, A Nie, E Brunskill AAAI 2023, 2023	1	2023
Sample-Efficient Deep Reinforcement Learning for Control, Exploration and Safety Y Flet-Berliac	1	2021
High-Dimensional Control Using Generalized Auxiliary Tasks Y Flet-Berliac, P Preux Research Report hal-02295705, 2019	1	2019
Averaging log-likelihoods in direct alignment N Grinsztajn, Y Flet-Berliac, MG Azar, F Strub, B Wu, E Choi, C Cremer, ... arXiv preprint arXiv:2406.19188, 2024		2024
Contrastive Policy Gradient: Aligning LLMs on sequence-level scores in a supervised-friendly fashion Y Flet-Berliac, N Grinsztajn, F Strub, E Choi, C Cremer, A Ahmadian, ... arXiv preprint arXiv:2406.19185, 2024		2024
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators A Nie, Y Chandak, CJ Yuan, A Badrinath, Y Flet-Berliac, E Brunskil arXiv preprint arXiv:2405.17708, 2024		2024

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用