证监会同意海天瑞声科创板IPO注册 并陆续刊登招股文件

2021-07-14 09:30:46

来源:爱集微APP

7月13日晚,证监会官微发布消息称,证监会按法定程序同意北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)科创板首次公开发行股票注册,海天瑞声及其承销商将分别与上海证券交易所协商确定发行日程,并陆续刊登招股文件。

海天瑞声主要从事训练数据的研发设计、生产及销售业务。发行人通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。海天瑞声所属行业为软件和信息技术服务业。算法、算力、数据是人工智能技术发展的三大要素,其中训练数据是算法发展和演进的“燃料”。

海天瑞声是中国语音类基础数据服务领域的头部企业。根据艾瑞咨询出具的《2020年中国AI基础数据服务行业研究报告》,海天瑞声在中国语音类基础数据服务领域企业中营收份额占比排名第一。按数据类型划分,中国基础数据服务行业的市场需求可以分为语音类数据需求、图像类数据需求和自然语言处理类数据需求。现阶段国内基础数据服务商以提供图像类数据和语音类数据服务的公司为主。

在当前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的训练支撑则是深度学习算法实现的基础。深度学习分为“训练”和“推断”两个环节:训练需要海量数据输入,训练出一个复杂的深度神经网络模型;推断指利用训练好的模型,去“推断”现实场景中的待判断数据,并得出各种结论。训练数据越多、越完整、质量越高,模型推断的结论越可靠。因此,要使算法模型实现从技术理论到应用实践的落地过程,就需要提供大量的训练数据,对算法模型加以训练。

通常,从自然数据源简单收集取得的原料数据并不能直接用于深度学习算法的训练,必须经过专业化的采集、加工处理,形成相应的工程化数据集后才能供深度学习算法等算法、模型训练使用。海天瑞声是我国领先的训练数据专业提供商。自2005年成立以来,海天瑞声始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。

海天瑞声所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。其中智能语音为海天瑞声的优势领域,产品线已包含160余个主要语种及方言。海天瑞声的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。目前海天瑞声客户累计数量超500家,覆盖了主要的大型科技公司、人工智能企业及科研机构。

在多年经营中,海天瑞声高度重视自身核心技术优势的构建,在基础研究和产品研发两个维度持续投入。凭借多年研发积累,公司已经构筑了较为明显的核心技术先进性,主要体现在下述方面:

1、算法与数据处理技术并用:海天瑞声已掌握12项核心技术,通过算法与数据处理技术并用,可以满足算法在不同应用场景下的训练数据需求,可对大规模数据进行高效的加工或质检。截至2020年12月31日,海天瑞声已积累760余个自有知识产权的训练数据产品,可提供超过160余个语种/方言的训练数据。

2、工具和平台共建:海天瑞声自主开发了一体化数据处理平台,融入项目流程管理、质量把控、数据安全管理,嵌入生产所需的各类工具、软件模块,可实现高效、高质的训练数据生产,提升生产效率及质量控制水平。

3、在语音语言学基础研究方面有深厚积累:海天瑞声建立了成熟的发音词典构建流程、积累了深厚的语音语言学基础研究成果。截至目前,海天瑞声的产品/服务已覆盖160余个语种/方言,已积累下超过100个语种/方言的发音词典,累计词条数超过1,000万条,可构建高质量的智能语音训练数据。

截至目前,海天瑞声已经取得24项发明专利、1项实用新型专利授权及1项外观设计专利授权,134项计算机软件著作权,另有2项专利已提交申请。多年积累的核心技术和专业服务能力,使得海天瑞声能够更大规模、更有效率、更加精准地生产训练数据,在提升自身产出效率的同时也有效提高了训练数据对于客户算法模型的改善、优化效果。按照产品和服务的具体类型划分,海天瑞声的主营业务可分为训练数据定制服务、训练数据产品和训练数据相关的应用服务。( 校对/James)

关键词: 证监会 海天瑞声 科创板 IPO注册