文 | 周鑫雨
【資料圖】
編輯 | 鄧詠儀
一位滿(mǎn)分100能考98分的英語(yǔ)教師,你愿意跟著TA學(xué)習(xí)嗎?
網(wǎng)易有道將這個(gè)問(wèn)題中的“英語(yǔ)教師”,加上了AI的前綴。
2023年7月26日,網(wǎng)易有道基于自研教育領(lǐng)域大模型“子曰”,推出了6個(gè)應(yīng)用:“LLM翻譯”、“虛擬人口語(yǔ)教練”、“AI作文指導(dǎo)”、“語(yǔ)法精講”、“AI Box”以及“文檔問(wèn)答”。
去年11月,OpenAI發(fā)布的ChatGPT技驚四座,有道CEO周楓對(duì)36氪直言有道團(tuán)隊(duì)的緊迫感:2022年12月,團(tuán)隊(duì)花了一個(gè)月思考大模型如何與業(yè)務(wù)結(jié)合;2023年1月的年度戰(zhàn)略會(huì)上,有道首席科學(xué)家段亦濤關(guān)于ChatGPT聊了整整40分鐘。
“我們也聊了很多創(chuàng)業(yè)團(tuán)隊(duì),包括像智譜、智源、百川智能等公司和機(jī)構(gòu)——大家有一定的共識(shí),就是大模型必須得自己動(dòng)手做才能理解更深層次的東西?!弊鳛橐患覒?yīng)用公司,掌握底層模型的自主權(quán)是有道選擇自建模型,而非調(diào)用第三方模型服務(wù)的其中一個(gè)主因。而另一個(gè)原因在于,當(dāng)2月有道立下入局大模型的軍令狀時(shí),市面上還沒(méi)有能力出色的模型。
由于落地場(chǎng)景較為垂直,且考慮到控制投入成本,“子曰”20B的參數(shù)規(guī)模在動(dòng)輒百億千億的大模型賽道中并不算大。至于模型效果,周楓告訴36氪,“子曰”在英語(yǔ)場(chǎng)景下已經(jīng)能夠做到98%的答題準(zhǔn)確率。
“子曰”的對(duì)話(huà)能力演示,該測(cè)試網(wǎng)頁(yè)不會(huì)單獨(dú)開(kāi)放。圖源:有道
但知識(shí)教學(xué)是容錯(cuò)率接近于0的領(lǐng)域,98%的準(zhǔn)確率意味著50道題中就有1題失分。用戶(hù)是否能夠?yàn)椤白釉弧笔O?%的錯(cuò)誤率買(mǎi)單?周楓對(duì)36氪表示,人類(lèi)老師的準(zhǔn)確率本來(lái)就是波動(dòng)的,在主觀題領(lǐng)域,機(jī)器的答題準(zhǔn)確率已經(jīng)超過(guò)了人類(lèi),“但至于98%是不是足夠高,我們還沒(méi)完全驗(yàn)證”。
模型技術(shù)最為成熟的翻譯和語(yǔ)法講解領(lǐng)域,成為“子曰”落地的主要場(chǎng)景。
比如接入LLM(大語(yǔ)言模型)后的有道翻譯,可以根據(jù)上下文語(yǔ)境提供更地道、信達(dá)雅的翻譯,這一功能將在今年Q3上線;已經(jīng)登陸有道翻譯的AIBox則更像一個(gè)懂英語(yǔ)的桌面助手,能夠針對(duì)鼠標(biāo)的選取內(nèi)容進(jìn)行翻譯和文字潤(rùn)色。
LLM翻譯演示,圖源:有道
AIBox演示,圖源:有道
同樣已經(jīng)上線有道翻譯的“文檔問(wèn)答”功能則作為文檔翻譯的輔助,可以根據(jù)用戶(hù)的提問(wèn),基于文檔內(nèi)容給出答案。
文檔問(wèn)答功能演示,圖源:有道
AI作文指導(dǎo)和語(yǔ)法精講功能,將在今年8月成為有道教學(xué)硬件的一部分。有道的學(xué)習(xí)機(jī)和詞典筆能夠?qū)τ脩?hù)拍攝或者掃描上傳的作文等試題進(jìn)行分析,給出相應(yīng)的題目講解和答題建議。
AI作文指導(dǎo)功能上線有道學(xué)習(xí)機(jī)X10,圖源:有道
語(yǔ)法精講功能上線有道詞典筆X5,圖源:有道
但作為toC的教育應(yīng)用廠商,有道自研大模型后,還需要面對(duì)高昂的計(jì)算推理成本。周楓表示,有道翻譯每天都有上億條翻譯需求,團(tuán)隊(duì)需要對(duì)后臺(tái)進(jìn)行更多的優(yōu)化。關(guān)于運(yùn)營(yíng)成本,他透露,“以AIBox為例,成本已經(jīng)優(yōu)化到了20元/月”。
有道面臨的第二個(gè)難題,則是“雙減”頒布后,如何進(jìn)一步吃下中國(guó)超百億元的英語(yǔ)培訓(xùn)市場(chǎng)。團(tuán)隊(duì)選擇的是將大模型植入虛擬人中,用低價(jià)策略提供標(biāo)準(zhǔn)化的口語(yǔ)訓(xùn)練服務(wù)。
此次有道新發(fā)布的數(shù)字人口語(yǔ)教練Echo,在7月初舉辦的世界人工智能大會(huì)上就已經(jīng)亮相。背后的支撐技術(shù),除了有道自研的“子曰”大模型,還有網(wǎng)易伏羲大模型提供的虛擬人生成技術(shù)。目前,Echo能夠識(shí)別中式英語(yǔ)、英語(yǔ)、中英混合等語(yǔ)言,并且像口語(yǔ)老師一樣不斷引導(dǎo)用戶(hù)用英語(yǔ)交流。
數(shù)字人口語(yǔ)教練Echo,圖源:作者試用
數(shù)字人口語(yǔ)教練的推出,對(duì)以真人教學(xué)為主導(dǎo)的教育行業(yè)而言,也必將造成沖擊——其中也包括有道的英語(yǔ)課程?!袄蠋煹慕谭赡苄枰淖?,在原來(lái)的真人教學(xué)場(chǎng)景中,老師們是傳授學(xué)生一套學(xué)習(xí)的方法,培養(yǎng)學(xué)生的學(xué)習(xí)能力。但Echo出現(xiàn)后老師們的看家本領(lǐng)就被學(xué)了?!敝軛鞲嬖V36氪,“總體而言,AI能夠解決教育人力不足的問(wèn)題,長(zhǎng)遠(yuǎn)來(lái)看還是好事?!?/p>
以下是周楓與36氪的部分對(duì)話(huà)(內(nèi)容略經(jīng)編輯):
36氪:您提到英語(yǔ)場(chǎng)景“子曰”可以做到98%準(zhǔn)確率,但用戶(hù)能在知識(shí)教學(xué)上接受2%的錯(cuò)誤率嗎?
周楓:這是很好的問(wèn)題。之前美國(guó)做了一個(gè)教育評(píng)估,發(fā)現(xiàn)機(jī)器做得比人準(zhǔn)。什么叫機(jī)器做得比人準(zhǔn)?核心原因是人本來(lái)就不準(zhǔn)。
這就是我們對(duì)教育的一個(gè)看法,我們覺(jué)得教育應(yīng)該是自上往下的過(guò)程,老師是絕對(duì)正確的,所以才能教好學(xué)生。但事實(shí)情況是,老師不是絕對(duì)的,本身就會(huì)有一個(gè)波動(dòng)。而技術(shù)可以做到穩(wěn)定。
當(dāng)然,98%是不是足夠高?我們還沒(méi)有完全印證。目前試用下來(lái)大家都是滿(mǎn)意的。我們肯定希望能做到100%,目前的98%我們認(rèn)為已經(jīng)可以讓用戶(hù)用,其實(shí)沒(méi)有東西100%準(zhǔn)確的。
36氪:AI英語(yǔ)口語(yǔ)教練對(duì)有道本來(lái)的真人教師精品課程會(huì)產(chǎn)生沖擊嗎?
周楓:對(duì)教英語(yǔ)團(tuán)隊(duì)來(lái)說(shuō)會(huì)是一個(gè)巨大的好消息,當(dāng)然他們自己可能過(guò)一個(gè)月才能認(rèn)識(shí)到這一點(diǎn)。其實(shí)教育最大的挑戰(zhàn)就是因?yàn)槿肆Σ蛔恪?984年的一篇論文討論了一個(gè)問(wèn)題:學(xué)生的成績(jī)是否是由天賦決定的。最后它用實(shí)驗(yàn)數(shù)據(jù)說(shuō)明,學(xué)生的成績(jī)和花在上面的教學(xué)精力有關(guān),所以一對(duì)一的教學(xué)效果會(huì)好很多,教師其實(shí)就是幫你解決學(xué)習(xí)能力的問(wèn)題。
以前真人的教法是設(shè)計(jì)一套方法要求你一定自己練,不練就懲罰你。而現(xiàn)在有了更好的產(chǎn)品,這些所謂的技巧可能要被滅掉,老師沒(méi)有必要講這些抽象的東西,學(xué)生直接在設(shè)備上訓(xùn)練就可以了。所以我覺(jué)得老師一開(kāi)始不一定就認(rèn)這些新技術(shù),但是我相信很快他們也會(huì)接受。
36氪:市面上開(kāi)源模型特別多,一個(gè)小團(tuán)隊(duì)就可以做出翻譯軟件或者口語(yǔ)訓(xùn)練的應(yīng)用,您覺(jué)得會(huì)給有道帶來(lái)一些壓力嗎?
周楓:很有可能,我們現(xiàn)在能做的事情是讓我們爭(zhēng)取到一點(diǎn)時(shí)間,可以早一點(diǎn)把產(chǎn)品推出來(lái)。之前我們1月份看的時(shí)候,市面上沒(méi)有成熟模型可用,所以我們被逼著自己訓(xùn)練模型。
如果說(shuō)我們做得好,大眾喜歡用,對(duì)我們的APP端的產(chǎn)品會(huì)有一個(gè)大的推動(dòng)。但是我不覺(jué)得這個(gè)東西做完就可以一勞永逸,生意上沒(méi)有一勞永逸的事,只有不斷創(chuàng)新才行。
36氪:在互聯(lián)網(wǎng)時(shí)代做產(chǎn)品跟現(xiàn)在大模型AI時(shí)代做產(chǎn)品思維有不一樣嗎?有道對(duì)產(chǎn)品團(tuán)隊(duì)有怎樣的新要求?
周楓:最直接要求可能每個(gè)業(yè)務(wù)都要看大模型。但是我覺(jué)得從方法論,從用戶(hù)的角度出發(fā),沒(méi)有變化。大模型是一個(gè)非常好的機(jī)會(huì)和手段,可能這樣的東西十年才能出現(xiàn)一次,甚至更長(zhǎng)三十年才能出現(xiàn)一次。
現(xiàn)在丁磊(網(wǎng)易CEO)對(duì)所有團(tuán)隊(duì)都有要求,我們搞的AIGC大賽是丁磊親自抓的,他自己做評(píng)委主席,我們所有部門(mén)頭都去做評(píng)委,還是搞得挺轟轟烈烈的??梢钥吹骄W(wǎng)易游戲最近也在拼命推AIGC,就是人工智能的NPC。所以我覺(jué)得所有人都要去思考和推動(dòng),其實(shí)就是這么一個(gè)大的變化。
歡迎交流!
關(guān)鍵詞: