美团主办ICCV2021研讨会及挑战赛，专家齐聚食品分析，论文比赛斩获佳绩

近日，两年一度的计算机视觉领域顶级学术会议 ICCV (InternationalConference on Computer Vision) 圆满闭幕。本次大会中，美团入选2篇接收论文，一篇论文获HTCV研讨会最佳论文提名奖，拿下两项知名挑战赛亚军，涵盖了人脸技术、人体技术、模型优化、低功耗等多个领域。并首次联合中科院计算所、北京智源、巴塞罗那大学共同举办了LargeFineFoodAI（大规模细粒度食品分析）技术研讨会，吸引了来自不同时区的众多参会者积极参与及讨论，在国际舞台推动计算机视觉技术应用于食品分析领域，帮大家吃得更好，生活更好。

ICCV是计算机视觉三大顶会中公认级别最高的，其论文录用率非常低。今年ICCV共收到有效投稿6236篇，1617篇被收录，接收率仅为25.9%。在这些论文中，中国学者几乎拿下了“半壁江山”，占比45.7%，超过第二名美国近一倍，是第三名英国的近13倍。

美团举办大规模细粒度食品分析领域研讨会专家齐聚探讨人工智能助力食品健康

研讨会由专家特邀报告、挑战赛汇报及论文报告三个部分组成。在研讨会上，专家学者针对食品智能分析领域给出了有洞察力的剖析及新的问题定义，共同探讨了计算机视觉为食品领域赋能的发展方向和应用，促进了计算机视觉、食品科学、营养健康等跨领域的融合。

来自美国加州大学欧文分校教授、未来健康研究所创始主任Ramesh讲述了定制化食品模型的重要性。在模型设计中将个人偏好与身体所需的食物进行有效平衡，针对性地给每个用户推荐最贴合其营养均衡的食物。东京大学信息与通信工程系Kiyoharu教授介绍了一款新型的食物日志工具- FoodLog Athl，它可用于与饮食相关的医疗保健及饮食评估服务，该工具支持食物图像识别、营养膳食评估、食物营养值测算等功能。巴塞罗那大学数学与计算机科学学院Radeva教授探讨了不确定性估计的必要性并展示了食品图像识别中不确定性建模的方法。另外，美国卡耐基梅隆大学和普渡大学投稿的论文也被选中在研讨会上进行报告。

美团举办2项食品领域挑战赛推进学术交流

同时，美团还组织了首届“大规模食品图像识别和检索”挑战赛，吸引了国内外众多有实力的团队参与，包括清华大学、中国科技大学、南京理工大学、巴塞罗那大学、新加坡南洋理工大学等高校，阿里巴巴、深兰科技、OPPO、欢聚时代等公司在内的143个国内外团队参加比赛。

作为国内领先的生活服务平台，美团率先提出借助计算机视觉算法对食品图像进行细粒度分析，快速响应和满足商户和用户大量多样的在线食品图像审核、管理、浏览、评价等需求。两个赛道的数据集均源自美团自建菜品图像数据集“Food2K”，包含1,500个类别和大约800,000张图像。其中每张图像均由不同个人，采用不同设备，在不同环境场景下拍摄获取，是难得的可以公正评价算法鲁棒性和效果的图片数据。相比其他主流食品图像识别数据集，“Food2K”完全人工标注，噪声比控制在1%以内，数据分布与真实场景相符，并构建了统一的食品划分标准体系，该体系涵盖中西方12大类食品下属的2000类食物（以披萨为例，细分为如鲜虾披萨、榴莲披萨等类别）。

食品细粒度识别及检索技术相比于通用图像识别及检索难度更大，由于许多不同类型的食品外观看起来非常相近，而同一种类型的食品由于烹饪方法不同看起来差异较大。另外，光线、拍摄角度、拍摄背景的不同都会对算法的精度产生影响，即便是专业人员也很难快速准确的进行辨别。最终根据比赛结果及技术方案，来自欢聚时代、南京理工大学、OPPO的参赛团队分获识别赛道的前三名，来自深兰科技、中国科技大学以及OPPO的参赛团队分获检索赛道的前三名。

美团在ICCV2021的成绩单：2篇论文被顶会接收、在低功耗及ReID领域研讨会上论文被接收，并荣获挑战赛亚军

在本届ICCV大会上，美团共入选了两篇论文。分别为：

论文题目：《Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for Open-Set Semi-Supervised Learning》

摘要：本文针对开集半监督学习场景提出了一个通用的开集半监督图像分类训练框架，通过设计一个兼容图像分类任务目标的多模态匹配机制，为后续半监督图像分类任务剔除无标注数据中的离群样本，同时使用自监督学习技术，充分利用所有的无标注数据（包含离群样本），以增强模型特征提取器对图像高级语义的理解能力。

论文题目：《Learn to Cluster Faces via Pairwise Classification》

摘要：本文提出一种基于配对分类（Pairwise Classification）的快速人脸聚类方法，可以解决大规模数据推理对内存的依赖和效率的问题，同时，为降低聚类任务离群点所导致的簇中心估计偏移的影响，提出一种基于位次加权的样本密度值（Rank-Weighted Density）计算方式，用于指导预测阶段配对的选择，可运用基于k近邻中位次排序的单调递减函数给样本间相似度进行加权，更准确地估计簇中心，进一步提高了聚类的精度。在MS1M、IJB-B等公开数据集上，均取得了SOTA的性能。

在第五届lpcv低功耗视觉国际比赛和VIPriors行人重识别挑战赛中荣获亚军。

另外，同样在ReID领域的HTCV研讨会上，获得最佳论文提名奖：

论文题目：《Transformer Meets Part Model: Adaptive Part Division for Person Re-Identification》

摘要：基于局部划分的方法已经成为了行人重识别领域的最主流方法，主要有两种实现方式：一是将行人划分成几个固定区域，但是行人图像不对齐会导致性能下降；二是引入额外的行人姿态估计或者行人分割模型，但是需要更多的计算量和标注数据。受到最近Vision Transformer的启发，本文提出一种自适应的局部划分方法，无需额外标注，仅需极少的额外计算量，就可以自动提取不同的重要局部特征。目前该方法在Market-1501，CUHK03、DukeMTMC ReID和MSMT17四个最主流数据集上都达到了国际领先水平。

顺应AI潮流为数字中国建设贡献力量

美团AI以“帮大家吃得更好，生活更好”为核心目标，致力于在实际业务场景需求上探索前沿人工智能技术，并将之迅速落地在实际生活服务场景中。美团视觉智能部致力于构建世界一流的视觉核心技术能力与平台服务。当前，视觉智能部技术布局已涵盖图像处理、文字识别、视频分析、人脸/人体识别、无人驾驶视觉感知等多个领域，在积累了国际/国内领先技术成果的同时，兼顾方法创新与成果转化，深度赋能零售、智慧交通、物流仓储、无人配送等业务场景。

" 十四五 " 规划中提出 : 要坚定不移建设数字中国，加快数字化发展。在数字化浪潮席卷而来的当下，人工智能将已成为全新赛点，AI也成为中国经济发展的关键一环。美团也正发挥人工智能技术能力，持续探索更多的应用场景和应用空间，让更多的用户享受到科技带来的红利，为数字中国建设贡献力量。