近期,博泰车联网联手深声科技(Deepsound.cn),为东风汽车集团旗下的高端电动品牌岚图,提供高度自由化、个性化、低门槛的自定义声音服务。岚图H56(参数|图片)、岚图H97车型的用户,可定制车内的个性化音色,如将导航语音、语音助手替换为家人、明星、本人的音色,享受智能座舱语音交互新体验。
小鹏汽车的小P、理想汽车的理想同学、蔚来的NOMI、岚图汽车的岚图,众多新能源汽车品牌,都推出自己的车载语音助手,并通过OTA升级让语音助手不断进化。小鹏汽车语音负责人赵恒艺表示:“小鹏汽车认为未来车内交互的核心方式是语音而不是触控。”为何众多汽车厂商如此注重车载语音助手?
其实不难理解。
在传统燃油车时代,通过旋钮、按钮、拨片等物理按钮即可完成车内所有功能操作。但在智能化的新能源汽车时代,互联网、物联网、自动驾驶等技术的加持,使座舱承载的功能、信息急剧上升,全部使用物理按钮已无法满足当前需求。
一种解决思路是通过屏幕操作,车载屏幕也确实越来越大,理想ONE(参数|图片)整车屏幕尺寸总和达50.9英寸,智己汽车也将屏幕尺寸提升至39英寸。大屏确实解决了信息输出和展示问题,但用户操作和输入仍然是低效的,甚至由于操作层级增加导致操作成本进一步上升。实际行车过程中,若固定在位置上的驾驶员通过手指操控屏幕,对行车安全将造成极大威胁。
另一种解决思路,则通过智能语音交互完成人车对话,直接一个指令完成操作,理论上可以直达任何功能,不影响驾驶员眼睛、手、脚进行驾驶行为,相对于按钮操作,更加安全、人性、直接。对于汽车厂商来说,语音助手将逐渐成为品牌和用户最重要的交互方式,也是智能座舱的重要拼图,这便不难理解汽车厂商对车载语音助手的情有独钟了。
一个受用户青睐、使用率高的车载语音助手不仅应该满足用户的功能需求,更应该满足情感需求、陪伴需求,让语音助手就像你的爱人、小孩、朋友,让座舱有温馨、舒适的氛围,实打实提升驾乘体验,也是在提升汽车厂商的软实力。
车载语音如何满足情感需求和陪伴需求?各个厂商各显神通,综合技术可行性、成本、用户体验各方面,可以把声音克隆作为一个重要的参考选项。试想一下,上了一天班,满身疲惫,坐进车内时,便是孩子调皮、甜美的问候,是否疲劳会减去大半?堵车时,有朋友和你开启“闲聊模式”,是否少了一些枯燥?到达陌生的城市时,有个熟悉的声音在旁边指路,是否就少了一些焦躁呢?
听起来好像有点科幻,但与深声科技CEO周俊明的沟通中,我们了解到,声音克隆技术已经较为成熟,早在2020年春季的发布的小米10中,就已经搭载了深声科技提供的声音克隆服务,受到广大米粉追捧。用户仅需配合朗读20句话短文本,大约录音90秒,就能快速克隆出自己的声音,将个人的情感表达、发音特点等信息迁移到合成声音中,就连口音也能很好地克隆出来。
那么这种手机终端上的技术,运用到汽车座舱内是否可行?
答案是可行,甚至比手机终端的录音效果更好。一方面新能源汽车使用电机驱动而非燃油发动机,车内静谧性好,关上门窗之后便是一个绝佳的录音室;另外大部分主打智能座舱的车辆都有麦克风阵列,各个位置都有对应麦克风,隔音降噪效果较好。除此之外,录音过程也可通过手机,在APP或小程序上进行,操作便捷,同个品牌下的车主还可以互相分享自己的音色,具有一定的可玩性。
当然,声音克隆也引发我们对于隐私安全问题的担忧——是否自己随意说出的几句话,会导致自己的音色被克隆,引发诈骗或隐私泄露?
作为技术服务的输出方,深声科技也十分关注如何规避这项技术的非法应用,在推出之前就考虑了到法律伦理的问题,并给出了三点应对方案:
一是将声音克隆能力只授权给那些有控制能力的企业客户,对于C端用户来讲,只有选择音色的权限,没有自定义克隆声音内容的权限;
二是加强对内容安全的严格审核。不支持用户用随意一段语音进行克隆,要求用户对指定文本进行录音,从而降低声音被利用的风险;
三是通过身份认证、结合生物识别等技术,以限制声音克隆的使用。
其实声音克隆技术,并非深声科技所独有,但与竞争对手相比,周俊明表示:“声音克隆技术上,我们在音色还原度、发音准确率、音质清晰度等方面,具有明显的优势。让声音服务好每个人的生活是我们的愿景,深声致力于将语音AI技术融入人们生活的点滴之中,赋予企业和用户以创新与科技力量来创造更美好的世界。”
智能语音交互将是未来汽车重要的人车交互方式,是用户对智能座舱的重要感知点,非常需要“Think Big”,声音克隆允许用户自定义语音音色,在一定程度上是一个具备想象力的解决方案,相信在未来,会有越来越多的智能汽车厂商,还有像深声科技这样的人工智能科技企业,为用户提供更丰富的解决方案,真正让声音服务好每一次旅途!