B站up主开发出会写高考作文的AI

2020-10-29 10:27:58

来源:站长之家

近日,B站up主图灵的猫发布了一则视频称,自己一人历时100天花费近500个小时,训练出了一个会写作文的人工智能Essaykiller,Essaykiller由17亿参数、2亿数据、1万行代码组成。

据介绍,Essaykiller是一个基于OCR、NLP领域模型所构建的生成式文本创作AI框架,目前第一版finetune模型针对高考作文(主要是议论文),可以有效生成符合人类认知的文章,多数文章经过测试可以达到正常高中生及格作文水平。

Essaykiller由4个神经网络组成,包括了:

第一部分的识别网络,通过外接摄像头的实时OCR以及卷积神经网络进行汉字的识别与提取。

第二部分语言网络分为两个子网络,一个网络负责读题能力,另一个负责写作能力。后者为整改AI的核心。

第三部分为判分网络,取出Essaykiller生成的多篇文章中,打分最高的一篇文章进行输出。

图灵的猫称,搭建完上述架构后Essaykiller就算出生了,Essaykiller借鉴了Alpha Go的设计理念,只要0.1分钟就可生成多篇文章,可利用API调用单独的神经网络,对一百篇作文进行通顺度打分。

随后,图灵的猫对Essaykiller进行了大量的训练:阅读了大量的优质散文、议论文、历年高考满分作文等进行训练。Essaykiller共学习了360万张图像数据、2亿条中文预训练语料、上千篇微调文章。

但在训练的过程中却出现了小插曲。

图灵的猫称,由于自己的RTX2060S显卡经受不住这么大的网络规模以及计算量,导致内存“爆掉了”。据悉,Essaykiller的神经网络达到了17亿之多,已经超越了目前市面上可见的任何一个单GPU的运算内存限制。

在尝试了2080ti、谷歌TPU V3、Tesla V100之后,图灵的猫最后找到了RTX8000——目前世界上最大单卡显存的显卡,解决了这个问题。

最终!!Essaykiller在137个小时之后,学习完了全部的内容。

图灵的猫对两个地区的两个全国卷的作文进行了测试,并通过高考格式排版脚本利用改装后的外接装置对文本进行输出,宣布大功告成。

值得一提的是,目前该up主已经将这整个项目开源,并上传到了Github,同时还将训练好的Al迁移到了线上服务器,大家只要进入网页输入题目或者句子Essaykiller就会生成独一无二的文章。

关键词: AI 高考作文