6月8日消息,苹果刚刚在WWDC上宣布了名为Live Text的新功能,可以自动识别并转录照片中的文字,从而把所有照片中的文本数字化,支持中文等语言。这释放了一系列方便的功能,从将手写便条转换成电子邮件和信息,到在照片上搜索收据或食谱。
这当然不是智能手机的新功能,我们已经看到三星和谷歌等公司提供过类似的工具。但Live Text依然有不同之处。例如,使用该功能,用户可以读取照片或取景器中任何文本,并立即对其采取行动。用户可以复制并粘贴该文本,在Web上搜索它。如果是电话号码,可以立即拨打该号码。
苹果高管克雷格·费德里吉(Craig Federighi)在WWDC上宣布,Live Text将出现在搭载iOS15的iPhone上。他展示了几张照片,其中一张是会议后的白板,还有几张背景中包括餐厅标志的快照。
轻触右下角的Live Text按钮会给检测到的文本加下划线,然后轻轻一扫就可以选择和复制它。以白板为例,它收集了几句话的笔记,包括项目符号。同时,它还抓取了某餐厅的电话号码,可以拨打或保存。
苹果表示,这一功能是通过“深度神经网络”和“设备智能”实现的,后者是该公司对机器学习功能的描述。它强调了苹果注重隐私的AI方法,该方法专注于在设备上处理数据,而不是将数据发送到云端。 Live Text可以在iPhone、iPad和Mac电脑上运行,支持七种语言。
除了从照片中提取文本之外,iOS 15还将允许用户进行视觉搜索,这一功能听起来与谷歌的Google Lens完全一样。不同的是,在运行新系统的iPhone拍摄的每张照片中,文字都或多或少是被动捕捉的,用户不必进入扫描仪模式或启动单独的应用程序。
这对任何人来说都是一件好事,但对视力障碍的人尤其有帮助。苹果在WWDC发布会上没有详细介绍这一功能,但表示这款新工具可以识别照片中的“艺术、书籍、自然、宠物和地标”。(小小)