在国际人工智能算法比赛中,具备真实场景AI应用经验的机构优势明显,表明“场景”对AI技术演进越发重要
北京时间2020年10月25日,由国际计算机协会ACM ICMI 2020的EmotiW2020情感识别大赛在荷兰Utrecht经激烈角逐产生算法比赛结果。思图场景的AI应用实验室在与美国斯坦福大学、旧金山大学、滴滴等顶尖学府和机构的同台竞技中摘得桂冠,在经过论文评审及代码验证(code validation)环节后大赛官方正式公布了这一结果。此次比赛中具备真实场景AI应用经验的机构优势明显,表明了“场景”对AI技术演进的重要性。思图场景便是基于场景优势加速AI技术迭代的代表,这也是思图场景第二次获得EmotiW比赛成绩的第一名,这与其在金融AI领域的技术优势是分不开的。
基于视频的情感识别
基于图片的驾驶员注视区域预测
EmotiW2020视频情感识别世界大赛是世界范围内,视频情感识别领域最高级别、最具权威性竞赛。先后有微软、清华、北大、多伦多大学、中科院国家重点实验室、南卡罗来纳大学、EmoLab 、台湾清华大学、爱奇艺、intel Lab、、deepblue等百余支世界顶尖研究机构与院校参赛。参赛队伍需要通过设计人工智能模型和算法,对视频或图像中人物(从几个人到上千人)的表情、动作、姿态、所处环境和语音语调等进行综合识别分析,以“Positive/ Neutral/Negative”三个维度识别视频中任务的情感。思图场景的AI应用实验室组凭借基于场景应用实践的创新深度学习神经网络模型获得情感识别最高正确率,以≈76.85%的准确率荣获情感识别第一名。此外,思图场景还以≈81.51%的准确率获得另一项驾驶员注视区域预测比赛的第二名(第一名为滴滴,准确率为82.52%)。
基于音视频短片的情感识别,正确率结果排名
基于图片的项驾驶员注视区域预测,正确率结果排名
人工智能技术的发展已经从技术实现层面向应用实施层面转换,情感识别在各行业中的应用场景广阔,该领域已经吸引包括微软、谷歌、Facebook、Intel等世界巨头及其他业内人士的高度关注。但碍于实际应用场景的复杂性和专业性,AI技术需要基于应用场景进行优化并配合其他技术形成“解决方案”才能实施,这对企业或机构在AI技术能力和目标应用领域的专业度两方面都提出了很高要求,在金融AI应用领域思图场景是一个典型代表,其在两届EmotiW比赛中的成绩反映了其在金融场景的应用积累及由此带来的算法优势。
思图场景长期致力于商业场景下的人工智能应用研究,并与清华大学、北京航空航天大学及人工智能领域知名技术专家建立学术合作。思图场景的人工智能情感识别技术现已在金融智能营销和反欺诈场景投入商业应用,通过分析客户对产品的兴趣程度、注意力(关注度)以及声音、表情等视觉信息,达成对客户心理状态和实际意图的判断,进而为市场人员提供营销建议、为贷款信审人员提供风险提示,真正做到将人工智能视觉技术深度融入银行、保险及汽车金融业务场景,并产生实际价值。服务包括工行、平安、中信、宝马金融、大众金融、中信保诚人寿等业内知名企业,是人工智能业内少有的将人机交互、人机协作深度应用于金融线上化、自动化场景的企业。
本次比赛中滴滴凭借“营运车辆场景AI应用”的深厚积累取得驾驶员注视区域预测冠军也证明了“场景”对于AI技术发展演进的重要性,场景AI时代正加速向我们走来。思图场景和滴滴作为“场景AI”在不同业务领域的先导企业,通过国际大赛冠军成绩,印证了AI技术场景化发展的趋势,势必为各行业的业态发展创造更广阔的想象空间。
关键词: