arXiv ID:
2604.14388
arXiv 提交日期: 2026-04-15
FoodSense:一个用于从图像预测味觉、嗅觉、质地和声音的多感官食物数据集与基准 / FoodSense: A Multisensory Food Dataset and Benchmark for Predicting Taste, Smell, Texture, and Sound from Images
1️⃣ 一句话总结
这篇论文提出了一个名为FoodSense的数据集和基准模型,它能让AI通过看食物图片来预测和解释人对食物的味觉、嗅觉、口感和声音等多感官体验,而不仅仅是识别食物本身。