关注
Robert Krzyzanowski
Robert Krzyzanowski
Poseidon Research
在 poseidonresearch.com 的电子邮件经过验证 - 首页
标题
引用次数
引用次数
年份
Sparse autoencoders work on attention layer outputs
C Kissane, R Krzyzanowski, A Conmy, N Nanda
AI Alignment Forum, 2024a. URL https://www. alignmentforum. org/posts …, 2024
112024
Interpreting attention layer outputs with sparse autoencoders
C Kissane, R Krzyzanowski, JI Bloom, A Conmy, N Nanda
arXiv preprint arXiv:2406.17759, 2024
82024
Saes (usually) transfer between base and chat models
C Kissane, R Krzyzanowski, A Conmy, N Nanda
AI Alignment Forum, 2024
52024
系统目前无法执行此操作,请稍后再试。
文章 1–3