Chenlu Ye 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	101	101
h 指数	4	4
i10 指数	4	4

2023202412 89

合著作者

Tong ZhangUIUC在 tongzhang-ml.org 的电子邮件经过验证
Wei XiongComputer Science, University of Illinois Urbana-Champaign在 illinois.edu 的电子邮件经过验证
Quanquan GuAssociate Professor of Computer Science, UCLA在 cs.ucla.edu 的电子邮件经过验证
Hanze DongSalesforce Research在 salesforce.com 的电子邮件经过验证
Han ZhongPeking University在 stu.pku.edu.cn 的电子邮件经过验证
Nan JiangAssistant Professor of Computer Science, UIUC在 illinois.edu 的电子邮件经过验证
Heng JiProfessor, Siebel School of Computing and Data Science, AICE Director, UIUC, Amazon Scholar在 illinois.edu 的电子邮件经过验证
Ziqi WangUniversity of Illinois在 illinois.edu 的电子邮件经过验证
Yuheng ZhangUIUC在 illinois.edu 的电子邮件经过验证
Rui YangUniversity of Illinois Urbana-Champaign在 illinois.edu 的电子邮件经过验证
Yong LinPrinceton University在 princeton.edu 的电子邮件经过验证
Chen LiuHong Kong University of Science and Technology在 connect.ust.hk 的电子邮件经过验证
Qing LianHKUST在 connect.ust.hk 的电子邮件经过验证
Yuan YaoInstitute of Physics, Chinese Academy of Science在 iphy.ac.cn 的电子邮件经过验证
Jiafan HePhD student, Department of Computer Science, UCLA在 ucla.edu 的电子邮件经过验证
Jianqing FanProfessor of Statistics, Professor of Finance, Princeton University在 princeton.edu 的电子邮件经过验证
Yuan YAOHong Kong University of Science and Technology在 ust.hk 的电子邮件经过验证
Zhuoran YangYale University在 yale.edu 的电子邮件经过验证
Zhaoran WangAssistant Professor at Northwestern University在 northwestern.edu 的电子邮件经过验证

关注

Chenlu Ye

Hong Kong University of Science and Technology

在 connect.ust.hk 的电子邮件经过验证 - 首页

Reinforcement Learning Online Learning Statistical Machine Learning


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Iterative preference learning from human feedback: Bridging theory and practice for rlhf under kl-constraint W Xiong, H Dong, C Ye, Z Wang, H Zhong, H Ji, N Jiang, T Zhang Forty-first International Conference on Machine Learning, 2024	52*	2024
Corruption-robust algorithms with uncertainty weighting for nonlinear contextual bandits and markov decision processes C Ye, W Xiong, Q Gu, T Zhang International Conference on Machine Learning, 39834-39863, 2023	19	2023
A theoretical analysis of nash learning from human feedback under general kl-regularized preference C Ye, W Xiong, Y Zhang, N Jiang, T Zhang arXiv preprint arXiv:2402.07314, 2024	15	2024
Corruption-Robust Offline Reinforcement Learning with General Function Approximation C Ye, R Yang, Q Gu, T Zhang Neural Information Processing Systems, 2023	10	2023
Optimal sample selection through uncertainty estimation and its application in deep learning Y Lin, C Liu, C Ye, Q Lian, Y Yao, T Zhang arXiv preprint arXiv:2309.02476, 2023	3	2023
Towards robust model-based reinforcement learning against adversarial corruption C Ye, J He, Q Gu, T Zhang arXiv preprint arXiv:2402.08991, 2024	2	2024
Provably Efficient High-Dimensional Bandit Learning with Batched Feedbacks J Fan, Z Wang, Z Yang, C Ye arXiv preprint arXiv:2311.13180, 2023		2023

系统目前无法执行此操作，请稍后再试。

文章 1–7

每年引用数

重复的引用

合并的引用

添加合著者合著作者

上传 PDF

关注此作者

引用次数

合著作者

引用