汽车之家TextCaps竞赛斩获全球亚军

发表时间:2021-12-17

随着深度学习在多个人工智能的细分领域日趋成熟化和规模化,多模态融合正成为人工智能研究新的热点方向和趋势。作为国内知名互联网公司,汽车之家在人工智能研究和应用方面一直处于领先地位,并将多模态融合技术应用于为主机厂赋能的数字化产品中。近期,汽车之家人工智能算法团队在今年TextCaps任务中CIDEr获得了98.59分的成绩,名次仅次于微软,斩获全球亚军。

TextCaps是Facebook发布的一个大型的图像阅读理解任务,该项比赛囊括了图像识别、图像描述、图像字幕等多个图像领域最前沿的任务,一经宣布就吸引了众多国内外顶尖的学术专家以及科研团队参加。汽车之家代表队在众多来自全球顶尖的算法团队角逐中脱颖而出,在所有参加团队中排名第二、国内参加团队中排名第一,充分展现了汽车之家在高科技研究中攻坚克难的匠心精神。

Text-Caption是一个涉及图像中视觉信息和文字信息的多模态任务,其目的是对一张图片生成一句涵盖其所有信息的文字描述。它不仅需要利用模型去理解图片的内容,还需要用自然语言去表达它们之间的关系,需要参赛者在CVOcr、Object Detection、NLPText Generation、Model Fusion等领域都具备很高的专业知识,具有很高的挑战性。

基于公司的海量数据,汽车之家人工智能算法团队在语音、视觉、NLP等技术方向均积累了大量的应用经验,并基于人工智能多模态技术的领先优势赋能公司数据产品研发,在知识库构建、培训系统开发和智能生成等场景中广泛应用。以智能培训平台为例,该平台旨在满足主机厂新车发布后培训经销商销售能力的需求,结合汽车之家和平安集团的数据及技术优势,将人工智能多模态技术应用于智能陪练、防作弊、问答机器人3大场景模块。

随着公司创新业务的大力发展,越来越多的场景需要人工智能技术的加持,例如视频资源的结构化分析、视频/图片中文本知识结构化提取存储、通话中的语义理解等。汽车之家始终将科技软实力作为公司数字化的基石,其技术团队在多模态方向的技术积累与突破,不仅为公司的“生态化”战略推进打造技术护城河,同时为公司创新业务发展与赋能行业数字化转型提供了坚实后盾。