arXiv ID:
2604.23993
arXiv 提交日期: 2026-04-27
EPM-RL:面向电商内部部署的产品映射强化学习方法 / EPM-RL: Reinforcement Learning for On-Premise Product Mapping in E-Commerce
1️⃣ 一句话总结
本文提出EPM-RL框架,通过强化学习将昂贵的大模型推理能力蒸馏到小型本地模型中,在保证产品映射准确性的同时大幅降低部署成本和延迟,使得电商平台可以安全、高效地在内部服务器上运行产品匹配系统。