对话网易有道CEO周枫:教育大模型的出路在哪里
子曰教育大模型在行业绝对是个另类。
5月29日的子曰大模型新品发布会上,网易有道给出了这样的成绩单:一季度AI订阅业务收入5000万,同比增长140%;在线营销服务业务近5亿,同比增长近126%。
但,你有没有发现哪里有点不对劲?
别人给产品起名:Dall-E、Sora、Gemini、Claude …有道给产品起名:Q Anything;Hi Echo;小P家庭教师…一点都不Fancy,这种产品也会有人买单?
所以有道到底做了什么,让消费者心甘情愿掏钱?最重要的是,它有没有可能代表了未来大模型一种可行的商业模式?
发布会后,零态LT(ID:LingTai_LT)和有道CEO周枫及子曰大模型落地应用的负责人,深入聊了聊。
1、GPT5都要来了,有道慌不慌
要讨论大模型,绝对绕不开GPT。
从GPT-4o的惊艳登场,到微软发布会暗示GPT5正在路上,紧接着GPT就宣布向免费用户开放。一连串的组合拳都在不断向所有大模型从业者提出严峻的挑战。更要命的是,奥特曼一直都非常看重AI在教育领域的落地,有道慌不慌?
周枫表示,GPT对子曰有压力,但不多。因为子曰擅长的,GPT不擅长。
尽管OpenAI在人工智能领域的发展速度相当迅猛,其GPT-4o技术已经充分展示了实时交互对于吸引用户的巨大潜力。不过,从技术角度来看,GPT使用的是端到端模型技术并非OpenAI一家独有。
事实上,这种技术在人工智能行业内被广泛采用。以有道的翻译服务为例,2018年之前,翻译系统由多个模型串联而成;而2018年之后,该系统转变为端到端模型,实现了文本的直接转换,无需中间的语法分析或拆分步骤。
▲图:发布会现场
GPT-4o的重要意义在于,它将语音识别、文本处理和声音合成等功能整合在一起,这标志着行业发展的必然趋势,也是所有公司努力的方向,有道亦不例外。
然而,当深入探究各个行业后有道发现,真正重要的并非仅仅是交互方式和实时性。实际上,与业务密切相关的要素往往与这些技术特性正交,即相互独立。以教育行业为例,有道专注于解决家长和学生面临的实际问题,而非单纯的技术展示。
家长并不关心机器是否能解决算术问题,他们关心的是产品是否理解并解决他们在教育孩子过程中遇到的具体问题。例如,孩子在学习过程中遇到的难点,或是考试中真正会考察的内容。对于高中生而言,家长更关心的是未来的职业规划。
这些问题,才是消费者最为关心的。
有道认为,解决消费者最关心的关键问题才是他们的核心任务。有道首先是一家教育公司,其次才是AI大模型,甚至在产品宣传的时候还要尽可能的避免AI、大模型这些概念。
毕竟,家长和学生看到“AI”“教育大模型”的时候,不一定能理解这个东西是什么、能干啥;但他们看到“小P家庭教师”的时候,一定知道它是什么,能干啥。
周枫还举了个例子。针对高考填志愿难的需求,有道推出了领世志愿填报应用,受到了广泛欢迎。许多家长表示,他们曾向许多人咨询问题,但未得到满意的答复,而机器提供的答案却超出了他们的预期。
其实相比填报志愿,我更关心的是近年来,学生因心理压力,不断爆出抑郁甚至跳楼的案例。而这个问题,有道用即将上架的小P移动端app的心语树洞功能回答了我。
▲图:心语树洞功能
诸如此类的操作,有道没少做。这个时候回过头再看GPT的时候,我对周枫说的“我们擅长的东西”有了更直观的体会。从我最近使用GPT-4o的体验来看,它确实已经具备了一定的教辅能力。比如我问了它一篇文言文文章,它是这么回应的。
▲图:GPT解读文言文
事实上,我问GPT的时候刻意用了一个错字,第二句“遂”契应该是“遽”契,然而GPT-4o没有发现。
在教育下一代的时候,正确答案里隐藏着一个不正确的内容,远比一上来就表现的不靠谱更可怕。这是通用大模型让人不放心的地方,也是教育垂直大模型值得深耕的地方,因为:
2、领域做深了,谁都抢不走
最近谷歌搜索仓促推出的AI功能,因为胡说八道引发热议。很多人上传了各种荒谬回答的截图,比如建议孕妇应该抽烟、人们应该每天吃一点小石子等,逼的谷歌搜索VP亲自下场道歉。
▲图:谷歌搜索VP回应
GPT-4o有时候也固执的让人无奈。
我问它草莓这个单词里有几个r,GPT坚称只有2个,即便它自己亲自拼写了一遍,即便我亲自问它有没有可能里面有3个r。
▲图:GPT-4o出错
机器学习三巨头之一,卷积神经网络创始之一的Yann LeCun认为,现在的大模型智力还比不过雪橇三傻。
这样的AI应用到教育上,怎么能让人放心?
有道给出的解决办法非常简单:取大模型的长处,服务于十多年深耕教育领域的经验和心得。
周枫不止一次提到,大模型可以做到以前想做却做不到的事情,比如Hi Echo这样的英语口语教练,不仅可以实时对话,还能够评估孩子的口语水平并给出改进建议。但模型本身并不是最终目的,而是作为实现这些应用并满足用户需求的手段。
大道理谁都会讲,但吹得牛要真的实现,只有一个办法“深耕”。首先是深耕教育,这是核心;其次是深耕大模型,这是手段。两者结合,就是有道的壁垒。
这种典型的实用主义,配合上有道对教育的长期坚持,就组合成了有道的AI长期主义。
3、教育大模型的未来,在哪里
在当前AI技术迅猛发展背景下,直接面向用户的AI产品已成为市场增长的重要驱动力。目前大模型主要有两种商业模式,要么卖API,要么卖订阅服务,有道显然是后者。
有道认为,AI订阅服务是推动AI技术发展和普及的自然途径。目前,有道正处于这一领域的起步阶段,但他们坚信,通过加速扩大产品规模和提高用户订阅量,将能够实现快速增长。
AI与会员模式的结合,为有道带来了健康增长的前景。AI技术不仅增强了产品的付费价值,而且构建了竞争壁垒。随着用户对高质量服务付费意愿的上升,有道将重点关注三个方面:提高AI的渗透率和使用频次,推动会员营收的健康增长;在供给侧创造更多高价值功能,同时在需求端寻找优享用户;关注创新和新技术,快速实现落地,并持续探索新场景。
而背后所依赖的,是有道坚持“AI+内容”的双轮驱动策略。教育内容是公司长期坚持的业务方向,而AI技术则是公司在不断变化的时代中的新焦点。
▲图:有道产品体验中
在过去一年中,有道围绕AI技术主要完成了三项工作:训练大模型、将AI功能嵌入原有产品、推出AI生产力工具。自2016年起,有道就开始构建AI基础能力,并组建了语言、视觉、声音等多个团队,积累了包括神经网络翻译(NMT)、计算机视觉、智能语音AI技术和高性能计算(HPC)在内的四大底层技术能力。
自2017年起,有道与主流技术Transformer紧密结合,将AI能力统一在大模型之下,并特别重视端侧的落地应用。例如,有道词典笔2代在2019年首次搭载了离Transformer NMT,这一技术的持续赋能确立了有道学习硬件在行业内的领先地位。
在底层技术不断创新的同时,有道也在细分场景下研发了多项“黑科技”。例如,虚拟人口语教练在语音识别能力方面取得了重大突破,支持多语种的流式低延迟语音识别技术,能够适应中式英语、英语、中英混合等多种场景。此外,声学降噪、回声消除、自动语音检测、自动断句等技术的应用,使得虚拟人口语教练能够像真正的倾听者和交流者一样,与用户进行自然、流畅的互动。
在AI虚拟人的驱动方面,有道利用自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,实时驱动虚拟人的面部表情和口型变化,使虚拟人能够以更加自然和生动的方式与用户进行一对一交互,显著提升了对话的真实感和用户体验。
另外,有道的自研ASR算法是公司AI技术实力的重要体现。2021年,网易有道ASR团队在“Interspeech 2021-非母语儿童语音识别”算法竞赛中取得了两项冠军。
有道的实用主义,是对技术发展的洞察;而AI长期主义,却是对教育本质的坚守。无论技术如何发展,真正能给用户带来价值的,只能是能够深入理解并满足用户需求的企业。
有道的实践,为我们提供了一个值得仔细琢磨的案例。
作者|吴狄
编辑|胡展嘉
运营|陈佳慧
出品|零态LT