Joshua Achiam 个人学术档案 - 学术资源搜索

引用次数

	总计	2019 年至今
引用	5244	5113
h 指数	9	9
i10 指数	9	9

0

1300

650

325

975

2018201920202021202220232024106 289 594 1010 1193 1263 763

开放获取的出版物数量

1 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

Joshua Achiam

Joshua Achiam

Research Scientist, OpenAI

在 berkeley.edu 的电子邮件经过验证 - 首页

Artificial Intelligence AI Safety


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
On First-Order Meta-Learning Algorithms A Nichol, J Achiam, J Schulman arXiv preprint arXiv:1803.02999, 2018	2327	2018
Constrained Policy Optimization J Achiam, D Held, A Tamar, P Abbeel arXiv preprint arXiv:1705.10528, 2017	1435	2017
Benchmarking Safe Exploration in Deep Reinforcement Learning A Ray, J Achiam, D Amodei https://cdn.openai.com/safexp-short.pdf, 2019	387	2019
Surprise-Based Intrinsic Motivation for Deep Reinforcement Learning J Achiam, S Sastry arXiv preprint arXiv:1703.01732, 2017	270	2017
Spinning Up in Deep Reinforcement Learning J Achiam https://spinningup.openai.com, 0	256
Responsive safety in reinforcement learning by pid lagrangian methods A Stooke, J Achiam, P Abbeel International Conference on Machine Learning, 9133-9143, 2020	245	2020
Variational Option Discovery Algorithms J Achiam, H Edwards, D Amodei, P Abbeel arXiv preprint arXiv:1807.10299, 2018	189	2018
Towards Characterizing Divergence in Deep Q-Learning J Achiam, E Knight, P Abbeel arXiv preprint arXiv:1903.08894, 2019	109	2019
A hazard analysis framework for code synthesis large language models H Khlaaf, P Mishkin, J Achiam, G Krueger, M Brundage arXiv preprint arXiv:2207.14157, 2022	18	2022
Advanced Policy Gradient Methods J Achiam Lecture [online] http://rail.eecs.berkeley.edu/deeprlcourse-fa17/f17docs …, 2017	5	2017
Exploration and safety in deep reinforcement learning JS Achiam University of California, Berkeley, 2021	3	2021
Variational Option Discovery Algorithms By admin No Comments J Achiam, D Amodei, H Edwards, P Abbeel
Training Dynamics Models for Accurate Long-Horizon Prediction E Knight, J Achiam, UC OpenAI

系统目前无法执行此操作，请稍后再试。

文章 1–13