知识图谱应用实战案例100篇(一)-阿里巴巴超大规模知识图谱预训练实践:商品分类

基于电子商务平台上亿级的庞大商品库,电子商务交易得以不断增长。

为了更好地支持日常业务,需要将这些海量的商品以一种更优的方式进行描述、存储和计算,并且需要支持融合不同来源的数据,建立实体之间的语义连接,因此采用了知识图谱这种数据构架

阿里巴巴积累了上千亿规模的商品数据作为商品知识图谱,这些数据来源于淘宝、天猫、阿里巴巴等在内的多个阿里旗下平台,囊括了品牌制造商、消费者、国家机构、物流提供商等多方利益相关者的数据。

从知识产权保护或购物体验的角度来看,商品信息的标准化和内外部数据的深度关联挖掘,对电子商务业务至关重要。

利用自然语言处理、语义推理和深度学习方法的最新进展,通过提供产品的全球概况、假冒产品治理、行业运营的完整产品信息,可以为搜索业务、推荐业务、平台治理、智能问答等开发人工智能相关服务,为消费者提供更好的使用体验。

目前,商品知识图谱包含标准产品、标准品牌、标准条码和标准分类四个关键组成部分,集成了公众情感、百科全书、国家行业标准等九大本体论数据集,运用实体识别、实体链接、语义分析等方法构建了大规模的知识图谱。

目前,商品知识图谱包含700多亿个三元组和300多万个规则,建立了一个完整而庞大的数据视图,极大地支撑了基于知识的项目服务。例如,商品知识图谱能支持语义搜索、智能问答、商品推荐等各种知识增强任务。

在阿里巴巴电商实际场景中,围绕商品知识图谱展开了一系列的技术研究和应用,其中主要业务场景包括商品分类、同款商品识别、商品推荐、商品标签发现、商品属性预测等。

为了在不同的任务中使用知识图谱信息,应用知识图谱预训练(Pre-trained Knowledge Graph,PKG)技术对知识图谱进行建模࿰

猜你喜欢

转载自blog.csdn.net/m0_50230964/article/details/121538207