读书郎——教育数据资产入表及应用创新项目

2024-11-29 13:31:11

来源:今日热点网

教育兴则国家兴,教育强则国家强。加快建设教育强国,推进教育数字化是重要内容。教育数字化可以提供个性化的学习方案,真正落实因地制宜、因材施教的教育理念,可以有效扩大优质教育资源覆盖度,缩小城乡、区域的水平差距,真正实现“办好人民满意的教育”这一国家战略目标。在数字中国建设不断深入的大背景下,回溯国内教育行业的发展历程和相关政策演变,当前我国教育行业正在发生从传统教育模式全面转向数字化教育的深刻变革。

教育数字化伴随着教育数据要素的开发利用,必然形成一定规模高质量的教育数据资产。我国高度重视数据要素的资产化价值化,2023年8月,财政部发布《企业数据资源相关会计处理暂行规定》,开始有序推进企业数据资源入表。“入表”一般是会计核算的通俗叫法,指通过会计确认计量、记录和报告等行为,对满足资产确认条件的数据资源通过资产负债表进行列示和披露,以提供内外部信息使用者决策所需的会计信息。

教育数据是典型的基于社会契约关系的多源数据,老师的知识数据、学生的学习数据可以通过脱敏加密、建模等技术提炼出具有教学支持功能的高质量教育数据产品。数据要素×教育,可以帮助学生创新高效学习,助力五育并举,减轻学校、老师和学生等多方的负担,赋能教育高质量发展。

教育数据资产入表,一方面意味着教育数据要素价值显性化,可以促进价值释放;另一方面可以辅助监管机构在内的教育领域多元参与方提高工作效率。

浙江省诸暨市政府于2021年提出《诸暨市新型智慧城市顶层设计(2020-2025)》,截止2023年底,诸暨教体局已初步建成以“学在诸暨”为核心的智慧教育公共服务体系,并通过“诸有优学”因材施教项目持续夯实精准教学和人工智能等方面的数字化能力,服务全市1万余名教师和18万名学生。

经过5年多的优化和沉淀,2024年上半年已基本完成了学校、学生、教师等基础信息和精准教学(智慧作业)等方面的专项数据治理,积累了大量标签化、价值化、可应用、可持续的教育行业数据。具备了在教育数据资产商业化运营领域探索如何在合法合规前提下有偿使用精准教育数据的基础,打造闭环运营场景机制的实施路径,为全国范围内开展教育数字化业务提供示范支持。

中国经济信息社和读书郎教育科技有限公司合作,以此次诸暨市教育数据资产入表实践为基础,基于无感采集的学生1300万+条作业错题数据,以及对该数据清洗加工和建模开发,构建了本项目所涉及的两项数据产品,分别是目标导向学习系统和即时响应学习系统。

围绕深入推动教育数据要素资产化、资产价值化,继续提高数据资产运营能力,积极创新更多数据要素应用场景,有效提升数据资产经济效益和社会效益。展望未来,我国教育行业将朝着数字化、智能化、个性化和多元化方向高质量发展,教育数据资源作为推动我国教育数字化转型的驱动力将会有着广阔的发展前景。

时间周期:

项目开始时间:2024年4月15日

中间重要时间节点:

2024年4月17日,完成项目调研,确定了入表的数据产品;

2024年5月30日,完成诸暨传媒集团教育数据资产入表工作;

2024年6月10日,完成教育行业数据资产入表蓝皮书;

2024年6月20日,在浙江大数据交易中心完成数据产品登记挂牌。

项目完结时间:2024年6月20日

数据要素价值需求

读书郎长期深耕诸暨市教育数据,已建成数据基座并成功运行五年,此次合作提出教育数据资产入表、数据产品设计和发布中国教育数据资产化蓝皮书的需求。

本项目基于学生学习过程数据化以及人工智能对学习过程的干预,帮助学生精准提升知识薄弱点,协助学校掌握学生全过程学习图谱,切实减轻学生、老师、家长多方负担,最终形成区域领先的可复制推广的新型公共文化服务品牌。

项目组调研发现,诸暨传媒集团所有数据均由数据中台统一管理,数据持续更新迭代,其数据资源大致分为四类:

一是基础类数据,包含学生、老师的基础信息数据如姓名、学号、班级等等,此外还包括学校基础组织信息。

二是业务系统产生的资源类数据,包含习题库、学生考试成绩、平时作业成绩、五育(德智体美劳)数据、教育服务类数据、教育管理类数据等。

三是精准教学类数据,如课堂互动信息数据,其产生方式一般是通过使用或教师填报产生。

四是教学评价类数据,由评价类系统或教师填报产生。

从数据来源方式判断,诸暨传媒集团的数据来源多为业务伴生类数据,部分数据由教师或学生填报产生,基本不涉及外采类数据。

通过该项目实施的诸暨市教育数据资产入表,以及相关数据产品登记,将提高诸暨市教育数据资产化水平,通过有效的数据管理和利用,教育机构可以实现数据的增值和效益最大化,提升教育教学的质量和效率,为学生提供更加优质的教育服务。

面临挑战

数据在教育领域发挥着尤为关键的作用,贯穿智慧教育发展全过程。必须充分发挥数据要素作用,注重收集、分析和应用教育过程中产生的数据,以数据驱动赋能引领教学、评价、教研和治理变革。

教育行业数据资产化,就是将教育过程中产生的各种数据转化为有价值的资产,并通过有效的管理和利用,实现数据的增值和效益最大化。包括了数据的收集、整理、分析、挖掘、应用等多个环节,不仅能提升教育教学智能化、精准化水平,更为企业提供了全新的价值创造和商业模式。

项目组在调研前期绘制了诸暨市的教育数据资源体系图,如下:

总结发现,诸暨市教育数据呈现出以下特点,这些特点为项目执行提出诸多挑战。

1、数据种类丰富:涵盖了学生、教师、学校、课程等多个方面,数据类型包括结构化数据(如学生成绩、出勤率等)和非结构化数据(如课堂录像、学生作品等),数据密度大,集中在教育中的方方面面。这些数据不仅来源于不同的渠道,而且具有不同的格式和类型。这种多样性为数据分析和挖掘提供了更多的可能性和选择空间,有助于发现更多的教育规律和价值。

2、更新频率高:教育数据由于密度较大,需要不断地更新和维护,以确保准确性和时效性,服务于持续的教育决策过程。

3、数据安全和隐私保护要求高:数据涉及大量的个人信息和隐私数据,如学生的姓名、年龄、家庭住址等。因此,在收集、存储和使用这些数据时,必须严格遵守相关法律法规和隐私保护原则,确保数据的安全性和隐私性。

4、潜在价值大:通过对这些数据的挖掘和分析,可以发现教育过程中的问题和不足,为改进教学方法和提高教育质量提供有力支持。此外,这些数据还可以用于预测学生的未来表现和发展趋势,为教育决策提供科学依据。通过挖掘数据中的潜在价值,教育机构可以开发新的增值产品和服务,如在线教育、个性化辅导等。教育数据若被合理挖掘和利用,可以极大提高教育质量和效率,有助于教育资源的优化配置和教育政策的精准制定。

在项目实施中,除了要充分考虑以上特点外,还需要关注数据安全和隐私保护等挑战,确保数据资产化的可持续发展。教育行业的数据资产管理和利用是一个复杂但极具价值的过程,需要专业的技能和工具来进行有效管理和分析,以实现其在教育改革和发展中的最大潜能。

数据处理

数据资产要求符合资产定义条件之“企业合法拥有或控制”,因此,数据来源及加工治理方式合规,是数据资产入表的前提。

对于自采类数据,重点需要关注数据来源是否合法以及加工治理方式是否合规。比如个人行为或消费数据可能涉及侵权。由于教育数据资源多源性的特点,部分教育数据的采集一般会涉及学生或教师的个人信息,该类信息如果不经授权,往往存在权利瑕疵。建议教育信息化行业其他企业,对于教育自采类数据,如果有上新系统或 APP 应用等情况时,最初应有协议说明,使用系统时涉及个人数据采集,需要个人明确授权。该类协议的目的,是为确保数据采集后,拥有数据源持有权,或者数据加工使用权,进而保障数据产品经营权。权利清晰,才能够避免后续入表存在的相关风险。

对于外购类数据,当前诸暨传媒集团基本不涉及外购数据。建议教育信息化行业相关企业,如果后期有外购数据,采购协议中相关合同的权利限制条款一定要仔细辨认。有些外购类数据资源采购合同条款有使用限制,比如明确指出“仅供内部研究使用”、“不得用于其他用途”等明显限制条款,则认为不符合资产定义中“企业合法拥有或控制”的条件,该项数据资源以及与之相关的成本支出不适宜作为数据资产入表。

因此,教育信息化行业相关企业在未来引进数据资源过程中,应充分重视合同条约中的相关权利限制事项,在合约谈判过程中应对合同条约有充分认知,避免出现权利瑕疵导致的数据资产认定问题。根据本次数据入表工作的结果,入表数据450万余条,估计130余万元,这些数据将通过未来产生的数据产品比如目标导向学习系统和即时响应学习系统从学校应用扩展至社会应用,预计覆盖3万以上学生,对提升社会家庭对教育满意度会有很好的反响。

应用技术与实施过程

一、数据资产入表

确认可入表的数据产品

1、数据产品概况及盈利模式梳理

资产定义要求与资源相关的经济利益很可能流入企业,而数据资源经济利益实现方式离不开数据产品。因此在调研过程中,诸暨传媒集团全面梳理了与数据资源强相关的数据产品和服务清单。按照产品服务对象不同,当前诸暨市传媒集团数据产品主要分为三大类:

第一是对内类产品:如班级、学校两期的变化及发展情况分析。该类产品的盈利模式一般由教育局统一采购,最终由教育局买单。

第二是对外类产品:如目标导向学习系统,该产品采集学生错题,基于错题加工成错题集,分析学生知识点掌握情况,个性化推荐错题巩固类课程等。即时响应学习系统,由学生对作业题进行拍照,并上传至云端。系统通过技术手段对所上传题目图像进行检测、切割、识别,进而搜索匹配到原题目,最后推送给学生题目解析和微课。该类产品的盈利模式一般是由家长付费购买。

第三是对内+对外类产品:包括考试系统、分析系统等,用于判断学生两期成绩变化。

2、确定可入表的数据产品

由于诸暨市传媒集团数据产品持有最终目的是服务当地教育事业发展而非销售,因此符合资产确认条件的数据产品均为无形资产。无形资产属于长期资产,其要求相应资源带来的经济利益流入至少要持续一年。对于教育信息化行业企业,其隐含的要求即为历史数据依然具有经济价值。由于近几年浙江省中小学教材变化不大,学生以往学习题目仍有价值,基于此,我们认为符合数据资产入表的数据产品有两项:

1)目标导向学习系统GLS(Goal- oriented leaning system )。

该产品基于学生错题加工形成错题集,分析学生知识点掌握情况,进而个性化推荐错题巩固类课程等。该产品数据输入层是学生错题;数据处理层依靠模型技术;数据输出层是针对学生的错题集产品。该产品目前尚未正式运营。

产品潜在的收费模式有以下几种:第一种方式是嵌入学习平板,然后配置收费接口。第二种是学习平板在一定服务器内服务期内免费升级到配备该学习系统,超出服务期另外收费;第三种方式是通过授权费,授权到运营商。如授权到浙江省通用的小程序产品浙学码,在入口开放功能使用。第四种是卖服务搭赠平板。第五种是平板产品进行分级,基础类平板不赠错题集,升级版平板搭赠错题集,基础班和升级版差别定价。或者旧版机器一开始没有搭载错题集功能,新机正常收费,旧机再收取升级费用。第六种是,通过技术手段筛选,哪些人用了收费服务。

数据产品的运营模式非常重要,因为资产的定义和确认条件要求“经济利益很可能流入企业”。因而,对于其他教育信息化企业,在设计数据产品时应重点考量该产品的未来运营模式,确保该数据产品相关数据能产生较为明确的经济利益。

2)即时响应学习系统RLS(real-time-respond learning system )。

该产品由学生对不懂或不会的作业题目进行拍照,系统将图像自动上传到云端,通过技术手段对图片进行检测、切割、识别,然后搜索匹配到原题,推送给学生题目解析和相关微课。

该产品预期未来收费模式有两种,一是项目制,通过签署合作协议,诸暨传媒集团买断该系统和系统附属题目数据权利,在全市范围推广,无需家长付费。后续诸暨传媒集团再利用运营商或收服务费的方式去进行该产品的运营和推广。第二种方式是项目建成后,传媒集团与项目建设单位进行运营收入分成。

数据资产登记

数据产品登记:针对目标导向学习数据服务、即时响应学习数据服务两个产品,通过浙江大数据交易中心确认交易主体准入资质、进行数据用途合法及使用限制合规审查,完成数据产品存证登记并上架挂牌至浙江大数据交易服务平台,获取数据产品登记证书。

数据知识产权登记:对两个数据产品的学生错题集等数据分析过程中涉及到的算法规则进行总结,在浙江大数据交易服务平台完成数据存证,提交浙江省市场监管局申请数据知识产权登记证书。

成本归集

由于数据资产入表的初始计量原则为历史成本法,因而,确定可入表的数据产品范围后,下一步就是与其相关的历史成本的归集。一般而言,与数据资产相关的成本包括人工成本、数据采购成本、软件成本、硬件成本四类,四项成本的合计金额即为数据资产入账的初始金额。诸暨传媒集团基本不涉及外部教育数据采购,此外,考虑到诸暨传媒集团教育产品开发的模式,相关数据安全与存储的软硬件权属均归属于第三方服务商。

因而,出于审慎原则,本次入表的成本仅为形成两项数据产品的人工成本。一般而言,人工成本应包含数据的采集、加工、治理、开发、安全运维成本。下图为教育行业数据资产投入示意图:

本项目中,目标导向学习系统GLS、即时响应学习系统RLS,这两项数据产品的人工成本主要包含两部分:第一项是数据加工成本:也即将题目录入系统的人员加工成本,主要包括题目标签、相关解析、微课录制等。第二是研发成本,也即产品研发部门针对该产品投入的相关图像切割、检测、识别等算法相关的研发人员的成本。该部分人员成本加总即为本次诸暨传媒集团数据资产入账初始成本。

列报披露

根据第三方服务商提供的工时统计结果,2024年1-3月,这两部分成本合计约为138.75万元。因而,本次诸暨传媒集团2024年1-3月数据资产入表金额为138.75万元。后续计量方面,根据我国当前教育模式,及浙江省中小学生教材变动情况判断,两项数据产品的摊销年限可以选择三年。此外,在成本模式下,当数据资源出现减值迹象时进行减值测试。根据减值测试结果,发生减值的,计提资产减值准备。最后,如果数据资源无形资产预期无法为企业带来经济利益时,应将无形资产的账面价值予以转销,终止确认该项无形资产。

二、模型算法应用

1、学生学习情况分析模型

为了深入了解学生的学习情况,本项目采用了基于机器学习的分类算法(如随机森林算法)构建学生学习情况分析模型。该模型以学生的学习行为数据(如学习时长、作业完成情况、考试成绩等)、个人信息(如年龄、性别、年级等)以及课程信息(如课程难度、课程类型等)为输入特征,通过对大量历史数据的训练,预测学生的学习成绩和学习状态(如优秀、良好、中等、较差等)。

在训练过程中,采用交叉验证和网格搜索等技术优化模型的参数,提高模型的准确性和泛化能力。例如,在对诸暨市某中学的学生数据进行训练时,经过多次参数调整,模型在测试集上的准确率达到了 85% 以上,能够有效地识别出学习困难的学生群体,为教师提供精准的教学干预依据。

2、作业推荐模型

作业推荐模型基于协同过滤算法和内容推荐算法相结合的方式。协同过滤算法通过分析学生之间的相似性,为目标学生推荐与他相似的学生所做过的优质作业;内容推荐算法则根据作业的知识点、难度等属性与学生的学习需求进行匹配推荐。具体来说,首先计算学生之间的相似度矩阵,然后根据相似度找到与目标学生最相似的邻居学生集合,从邻居学生的作业历史中筛选出推荐作业。

同时,对作业进行特征提取和标注,将与学生学习目标相关的作业推荐给学生。通过这种混合推荐算法,提高了作业推荐的准确性和个性化程度,满足了不同学生的学习需求。在实际应用中,根据学生的反馈和学习效果评估,作业推荐的满意度达到了 75% 以上,有效减少了学生的作业负担,提高了学习效率。

三、数据产品开发流程与实施过程

1、需求分析

在开发数据产品之前,进行了深入的需求调研和分析。与学校教师、学生、家长以及教育管理者进行沟通,了解他们在教学、学习和管理过程中的痛点和需求。例如,教师希望能够通过数据产品获取学生的学习情况反馈,以便及时调整教学策略;学生期望获得个性化的学习资源和指导;家长关注孩子的学习进展和成长情况;教育管理者需要数据支持来进行教育资源的优化配置和决策制定。根据这些需求,明确了数据产品的功能和特性,确定了以个性化学习和精准教学为核心的产品定位。

2、数据准备

基于需求分析,确定所需的数据来源和数据类型。从教育数字基座的各个子系统中收集相关数据,包括学生信息管理系统中的基本信息、学习成绩管理系统中的成绩数据、教学研一体化平台中的教学资源和教学活动数据等。对收集到的数据进行清洗、转换和整合,确保数据的质量和可用性。例如,对学生成绩数据进行异常值处理和归一化操作,将不同格式的教学资源数据统一转换为标准格式,以便后续的分析和应用。

3、模型训练与优化

根据数据产品的功能需求,选择合适的模型算法进行训练。如在目标导向学习系统中,使用学生学习情况分析模型和作业推荐模型。在训练过程中,将数据划分为训练集、验证集和测试集,采用监督学习的方式对模型进行训练。通过评估指标(如准确率、召回率、F1 值等)对模型进行评估和优化,不断调整模型的参数和算法,提高模型的性能。同时,采用集成学习等技术提高模型的稳定性和泛化能力。例如,在训练作业推荐模型时,结合多个基模型的预测结果进行综合推荐,提高了推荐的准确性和可靠性。

4、产品设计与开发

根据用户需求和模型功能,进行数据产品的设计和开发。设计了用户友好的界面,方便教师、学生和家长使用。在目标导向学习系统中,学生可以登录系统查看自己的学习情况分析报告、个性化学习路径和推荐作业;教师可以通过系统获取班级学生的整体学习情况,进行教学管理和干预。即时响应学习系统则提供了便捷的拍照上传功能,学生拍照后能够快速获取题目解析和微课资源。在开发过程中,采用敏捷开发方法,确保产品的快速迭代和优化,及时响应用户的反馈和需求变化。

5、测试与部署

完成产品开发后,进行全面的测试工作,包括功能测试、性能测试、安全测试等。功能测试确保产品的各项功能符合设计要求,能够正常运行;性能测试评估产品在高并发情况下的响应时间、吞吐量等指标,保证产品的稳定性和高效性;安全测试检测产品的安全性,防止数据泄露和非法访问。经过多轮测试和优化后,将数据产品部署到生产环境中,确保产品能够稳定地为用户提供服务。

6、数据资产确认登记

在数据产品运行过程中,持续进行数据采集工作,确保数据的完整性和及时性。从教育数字基座的各个业务系统以及外部相关数据源中,广泛收集与教育教学相关的数据,如学生学习过程数据、教师教学活动数据、学校管理数据等。依据相关会计准则和规定,对经过采集治理的数据资源进行资产确认评估。在完成数据资产确认后,进行数据资产登记工作。通过浙江大数据交易中心等权威机构,对确认的数据资产进行登记挂牌,包括提供详细的数据资产信息,如数据来源、数据内容、数据质量评估报告、应用场景说明等,接受机构的合规审查,确保数据资产的合法性和合规性。

7、数据资产后续管理与优化

数据资产入表后,持续进行后续管理和优化工作。建立数据资产监控机制,定期评估数据资产的使用效果、价值变化以及合规性状况。根据业务发展需求和数据资产实际表现,对数据资产进行更新、扩展或调整,确保其持续为企业带来价值。

生态合作伙伴

诸暨市传媒集团有限公司:诸暨所有教育化的项目管理归口均为诸暨市教体中心,教育信息化项目均由市教体中心统一招标建设。当中,通过相关市政府文件支撑的单一来源采购模式给到诸暨市传媒集团有限公司。承接教育信息化项目之前,一般由市大数据中心进行项目预审,诸暨传媒集团垫资建设,项目建设完成后,项目验收通过后,再由财政统一结算。

浙江大数据交易中心:针对目标导向学习数据服务、即时响应学习数据服务两个产品,通过浙江大数据交易中心确认交易主体准入资质、进行数据用途合法及使用限制合规审查,完成数据产品存证登记并上架挂牌至浙江大数据交易服务平台,获取数据产品登记证书。

清华大学五道口金融学院:提供数字经济发展相关政策、技术等智库支持,包括但不限于为政府平台公司提供数据资产运营支持。

服务效果

本项目圆满完成了客户需求:

第一,诸暨市教育数据资产入表工作已顺利完成,入表数据450万余条,估计130余万元。从全国范围来看,这是教育行业数据资产入表的首次成功试水,对同行业的数据资产入表有很大借鉴意义;

第二,完成数据产品设计“目标导向学习系统数据服务”和“即时响应学习系统数据服务”,并成功在浙江大数据交易所挂牌,将有利于诸暨市教育行业数字化、智能化发展,进一步实现教育数据要素价值;

第三,撰写完成并发布《教育行业数据资产入表蓝皮书》,对我国教育行业数据要素价值化、教育行业数字化转型提供有力参考。

诸暨市教育数据资产入表推动了当地的教育数字化发展,此次项目的实施对教育行业数字化发展起到了很大促进作用,将教育数据的资产运营落到了实处,例如,诸暨市目前已建成“菁菁浣江智习室”,此举充分挖掘了当地教育数据价值,是数据要素×教育的成功实践,也是数字经济与实体经济相结合的典型案例。

该项目实施的经济效益和社会效益分析如下:

经济效益:培育和完善数据产业新生态,打造开放共享的数据平台。

通过数据资产有效管理和商业化运作,加速推进教育数据要素的转化,不断培育教育数据产业生态,推动地方相关产业的发展。化解教育数字化财政投入不足、不稳定等难题。

以数据资产入表为切入点,依托“平台+终端”双覆盖、“校内+校外”大循环两大应用场景,通过目标导向学习系统数据服务、即时响应学习系统数据服务等一系列数据产品,在校内以政策性引导为主推广智慧课堂教学方式(目前第一个学校已经落地),在校外以市场化为主打造“菁菁浣江智习室”(已申请文化类注册商标,第一个示范点已投入使用),目标覆盖学生3万+,年运营收入6000万+,并同步解决教学资源分配不平衡、课后托管服务无序发展等社会痛点问题。

社会效益:推动教学模式创新,推进教学减负增效。

以新质生产力和数字经济双向奔赴,为构建区域新发展格局发挥示范引领作用。实现无感采集学生1300万+条作业错题数据,以及对该数据清洗加工和建模开发探索大数据时代下数据资源入表新机制,挖掘教育数据,显化资源价值,打造试点创新示范标杆。通过部署AI作业批改机,使每位任课老师作业批改时间平均每天减少1.5小时,教学过程数字化又有利于促进学校规模化因材施教。

相关企业介绍

·读书郎教育科技有限公司

读书郎教育科技有限公司是新一代信息产业领域集教育科技产品研发、科技创新、先进制造为一体的高新技术企业,公司已于2022年7月12日在香港主板成功上市。主要产品包括:智慧教育公共服务体系一站式解决方案、智慧校园方案、学生平板、早教产品、智慧桌椅等系列产品。读书郎秉承科技创新、科学管理理念,被认定为广东省企业技术中心,获得“广东省知识产权示范企业”、获认定为“广东省专精特新企业”及“广东省创新型中小企业”等称号。

·中国经济信息社

中国经济信息社是新华社直属的专业经济信息服务机构,是国家高端智库建设试点单位。今年4月,中国经济信息社响应国家数据要素政策,结合自身优势,成立数据资产运营研究中心。中心以服务国家数据战略为使命,在数据资源化、产品化、资产化的全生命周期,提供“智库研究+专业咨询+数据产品开发与运营”的综合解决方案,促进数据要素在“聚数、用数、乘数”各环节的全链条价值释放。目前已在全国完成十多家企业数据资产入表咨询服务项目。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词: