Diagnosis, feedback, adaptation: A human-in-the-loop framework for test-time policy adaptation

A Peng, A Netanyahu, MK Ho, T Shu… - International …, 2023 - proceedings.mlr.press
Policies often fail at test-time due to distribution shifts—changes in the state and reward that
occur when an end user deploys the policy in environments different from those seen in …

Apprentissage neuronal profond pour l'analyse de contenus multimodaux et temporels

V Vielzeuf - 2019 - theses.hal.science
Notre perception est par nature multimodale, ie fait appel à plusieurs de nos sens. Pour
résoudre certaines tâches, il est donc pertinent d'utiliser différentes modalités, telles que le …