Horizon, es la plataforma de aprendizaje de refuerzo de código abierto de Facebook

El sistema se ha utilizado para personalizar M sugerencias, personalizar notificaciones y optimizar el video. Facebook publicó un documento en el que presenta Horizon, la plataforma de aprendizaje de refuerzo de fuente abierta (RL) de Facebook. Horizon es una plataforma de extremo a extremo diseñada para resolver problemas de RL aplicados en la industria donde los conjuntos de datos son grandes (de millones a miles de millones de observaciones), el bucle de retroalimentación es lento (frente a un simulador), y los experimentos deben realizarse con cuidado porque no No se ejecuta en un simulador. A diferencia de otras plataformas RL, que a menudo están diseñadas para la creación rápida de prototipos y la experimentación, Horizon está diseñado con los casos de uso de producción como una prioridad. La plataforma contiene flujos de trabajo para entrenar algoritmos RL profundos populares e incluye preprocesamiento de datos, transformación de características, capacitación distribuida, evaluación de políticas contrafactual y servicio optimizado. También muestra ejemplos reales de los modelos entrenados con Horizon que superaron significativamente y reemplazaron a los sistemas de aprendizaje supervisado en Facebook. Fuente: Facebook [gallery]]]>

Related Posts