2024-06-14 2024-06-15 随手记 几秒读完 (大约53个字)@强化学习在推荐系统中的实践探索与业界进展链接:强化学习在推荐系统中的实践探索与业界进展,张启华,虎牙 web, 强化学习, DataFun 阅读更多
2024-06-09 2024-06-15 随手记 3 分钟读完 (大约490个字)@基于超网络的实时可控重排模型链接:淘宝推荐场景的利器:融合复杂目标且支持实时调控的重排模型 如何灵活调节多目标之间的权重。 对应论文:[[KDD/2023]] Controllable Multi-Objective Re-ranking with Policy Hypernetworks web, Alibaba, ReRank, DataFun 阅读更多
2024-06-09 2024-06-15 随手记 7 分钟读完 (大约1027个字)@淘宝推荐场景的利器:融合复杂目标且支持实时调控的重排模型链接:淘宝推荐场景的利器:融合复杂目标且支持实时调控的重排模型,王原博士,淘宝 web, Alibaba, ReRank, DataFun 阅读更多