我们面临的挑战是为机器学习模型提供实时特征,这些特征必须在事件发生后的几百毫秒内可供查询。数据源是我们存储在对象存储(如 GCS 或 S3)中的数据湖,每天有数十亿的原始用户行为事件涌入。批处理 ETL 每天更新一次特征,但对于实时推荐、反
2023-10-27