7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議(簡稱“WAIC 2024”)在上海啟幕。本屆大會備受關注的熱點領域之一是“人工智能+教育”,“教育與人才”被列為大會行業論壇的十大重點議題之一。
7月6日,在“AI 產業創新與投資發展主題會”上,學而思CTO田密以《教育大模型,構建未來個性化學習藍圖》為題發表了主題演講,首次分享了九章大模型在產業化層面的未來愿景和規劃。
“人工智能+教育”發展到今天,能在多大程度上替代老師?
田密:很多人認為大模型的進步會對教育行業產生顛覆性影響。Sora剛出來時,很多人問我,將來還需要輔導班老師嗎?今天的大模型發展非常迅速,但還沒有達到徹底替代老師的地步。
教育行業有一個“不可能三角理論”,即個性化、高質量和大規模很難同時實現。以學而思為例,最早推出了學而思小班,可以做到高質量和個性化,但是無法實現大規模;后來推出了學而思大班,實現了大規模和高質量,但沒有做到個性化;再后來我們推出了各種AI課程,勉強實現了個性化和大規模,但其質量和真人老師相比仍有很大差距。AI技術的發展使“不可能三角”成為可能,而大模型技術的出現是一縷曙光。
教育行業面臨的最大問題是師資的匹配,優質資源不足,但事實上學習階段的孩子們隨時需要向老師提問。AI老師就彌補了這樣的空白,能夠非常耐心地進行陪伴式講解,孩子們不用擔心被說笨或者擔心老師會不耐煩,就像醫生接診一樣,AI老師能夠回答很多學生的問題。
人工智能對于教育而言,意味著什么?
田密:在大模型技術出現之前,AI技術已經在教育的各個環節中發揮了作用,包括備課、教學、練習、評估和管理。例如,備課時可以用AI技術幫助老師自動生成講義和試卷;授課環節中,AI可以充當教學助手,提供智能答題器,幫助老師做智能提醒和個性化的TTS。在練習階段,AI可以實現自適應練習、中文作業批改和整頁批改;在評估環節,AI可以進行口語評測等。
隨著大模型時代的到來,所有的教育AI科技都可以通過大模型技術重新實現一遍。這意味著AI不僅可以優化現有的教育環節,還可以在個性化和規?;矫鎸崿F更大的突破,更好地滿足不同學生的需求。
大模型和傳統的深度學習技術有什么本質差異呢?
田密:第一,大模型更加通用。過去需要上百個大大小小的模型來提供AI服務,工作量非常大?,F在,一個大模型可以處理所有任務,極大地降低了訓練成本,提高了訓練效率,并且通用性得到了保障。
第二,大模型有了通用大模型作為基座。過去,教育大模型只能學習教育相關的語料。如今,通過通用大模型,教育大模型可以融合更多的世界知識和教育知識,從而變得更加聰明,情商更高。
第三,大模型支持多輪交互。這使得人機交互或師生交互更加容易、便捷和自然。大模型生成的多輪交互方式讓互動變得更加流暢,提升了用戶體驗。
教育大模型是怎么訓練出來的?訓練模型的方式和通用大模型有差別嗎?
田密:沒有本質上的差別,通常會分成幾個階段。以九章大模型為例,你會發現,大模型學習知識的方式、手段和人類很相似。我們把訓練過程分為三個階段。
階段一,預訓練。就像一個孩子要看大量的書去學習,通過自學獲取基本知識和理論框架。
階段二,有監督微調。相當于請了一名老師給孩子講解標準的解題套路,孩子向老師學習解題步驟,比如一二三步驟分別怎么做。
階段三,強化學習。相當于孩子不斷地進行多輪練習,每次練習后進行批改和反饋,不斷進階提升。
這個過程讓大模型像孩子一樣學習一門學科,比如數學。其中,最關鍵的是數據。訓練什么樣的模型需要什么樣的數據。在不同的訓練階段,比如預訓練階段,需要海量的題庫、講義和教輔書;微調階段需要大量的步驟清晰的解決方案數據;強化階段需要用獎勵模型對結果進行反饋。
在這一點上,學而思具備優勢。我們一直在投入教育科技研發,從2003年成立起就在積累題庫數據,這些都是訓練大模型寶貴的原材料。
此前有網友讓九章大模型和ChatGPT分別去答高考數學卷,引來熱議。在開發團隊內部有沒有做過類似的對比實驗,結果如何?
田密:大模型和人類一樣,有文科生和理科生的區別。我們發現,很難在一個大模型里同時學好數學、語文和英語。九章采用了多專家模型方式,有專門的數學專家模型、語文專家模型和英語專家模型,最終以MoE方式組合起來提供全科服務。
九章作為以數學領域的解題和講題算法為核心的大模型,在高考數學題目上比GPT-4o得分更高。“點睛”分析也是九章的特色,它在解題的同時拆解了題目的考點,更適合學習者參考。
大模型應用最大的阻礙在于“幻覺問題”。通過搜索召回增強技術,可以比較有效地緩解這一問題。這個技術很簡單,在大模型生成之前,先搜索并召回相關的內容,拼裝到程序中作為提示詞工程的一部分,這樣輸出就會有約束,不會胡亂生成答案。例如,將學生的學習畫像放進去,就可以生成個性化的回答,這是大模型落地應用的關鍵點。
今天現場有一些觀眾嘗試用手機拍攝一道四年級數學題,大模型并沒有直接給出答案,而是分析了題目考察的知識點和形式,再引導用戶一步步思考。這和一些拍題軟件的講解方式區別很大,讓大家感受到了人工智能在個性化引導學習方面的潛力。
田密:我們認為,所有教育場景都值得用大模型重新做一遍。到今天,學而思已經在解題、對話、批改、講題和推薦這五大場景中重構了教育科技。
解題很好理解,就是實時解答一個題目;對話是指具有常見的對話能力;批改方面,AI可以批改中文和英文作業,甚至細致到數學題的步驟級別,識別出答案的對錯和錯誤的具體步驟;講題則是AI一對一地講解題目;推薦則是在大模型的基礎上做到步驟級的個性化推薦,使得標簽更加精準,推薦效果更好。
具體來看,這些過程如下:
1.自動解題:九章大模型在數學評測網站Matheval上排名第一。在我們官網上也有展示,一道高中的函數題,大模型會先分析題目,識別出考察的知識點,然后進行步驟詳解,最終完成解題并提供考點分析,這樣可以讓學生更清楚地了解題目的考察重點。
2.口語對話練習:在我們的APP中,有口語評測功能,讓孩子通過游戲化的過程進行學習。我們會對學生的口語回答進行評測,包括流利度和發音。
3.作業批改:中文作文批改涉及字詞判斷、錯別字、段落批改、內容建議和潤色方法。英文作文批改分為三個步驟:批改、建議和潤色。數學題的批改更為復雜,特別是主觀題,需要對步驟進行批改,識別錯誤步驟并提供個性化講解。
4.講題:我們推出了“九章隨時問”小程序,它是一個數學AI老師,不是直接給出答案,而是一步步講解,任何不懂的地方可以隨時追問。這個功能的目的是讓孩子學會主動提問,培養批判性思維。
5.推薦:個性化學習的核心在于題目推薦。過去的診斷只能精確到題目級別,而現在可以拆解成多個步驟,每個步驟考察的知識點不同,對題目錯因的判斷更加精準,從而推薦的效果也更好。
總的來說,AI時代的教育需要孩子主動提問,因為AI幾乎無所不知。提問的能力在很多情況下不被鼓勵,但AI讓這一過程變得自然,孩子們可以更加放松地提出問題。AI老師會盡可能激發孩子的主動提問,通過不斷的反問和設問,引導孩子學會主動學習。這是AI給教育帶來的一個變化。
有人擔心AI會讓教育變得更惰性,認為是拍照抄答案。對此你怎么看?
田密:并不是這樣的。拍照講解之后會有追問,這才是真正的方向。我們的AI老師會盡可能去激發孩子主動問問題。我們會把問題拆成很多個小步驟,每一步都問孩子“你怎么看這一步?”、“你覺得這么做是對的嗎?”或者“你認為有什么重要的方法嗎?”通過不斷地反問和設問,讓孩子自己學會主動提問。
這種方法不僅幫助孩子理解題目,更培養了他們的批判性思維和主動學習的能力。AI在教育中的作用不僅是提供答案,更是引導學生思考,鼓勵他們獨立解決問題。這樣,AI不僅不會讓教育變得更惰性,反而會推動教育質量的提升,使學習變得更加積極和主動。
芥末堆:國內外大模型在教育領域的應用,目前還遇到什么樣的難題?解決方向會是在哪里?
田密:坦率地講,雖然目前大模型很熱,但從全球來看,真正落地用的產品并不多。大家看到比較成熟的應用主要有兩個,一個是搜索,另一個是聊天(chat)。
目前,大模型的應用還處于早期階段,教育領域也是如此。簡而言之,教育上的大模型未來要成為AI老師。AI老師需要具備多種能力,比如解題、講題、口語練習和批改答疑。然而,目前還沒有哪一個產品能夠將這些功能完美地結合在一起。
我們都希望有一個全能的AI老師,但實現這一目標非常困難?,F在的實際做法是將這些能力分解并逐步落地。例如,我們的“隨時問”專注于講解和答疑,口語練習則集成在一些應用程序中。這些能力逐步落地,最終有一天可能會形成一個完整的產品。
目前,AI老師還遠未成熟。這與自動駕駛有些類似?,F在智能座駕很火,但真正意義上的全自動駕駛(L4以上)尚未實現。然而,這并不妨礙一些具體功能的落地,比如自動泊車、智能變道和高速巡航。AI老師也是如此,它會逐步替代老師的許多工作,最終成為一個比較全能的AI老師。
今天,整個AI大模型對教育行業的影響和賦能還處于非常早期的階段。學而思將把三項最重要的核心AI能力——解題、講題和批改,向全行業開放。我們希望將核心能力開放給行業中的所有參與者,包括各類硬件廠商,如AIPC、手機、iPad和汽車制造商,以及一些公立學校的2B2C應用。我們希望通過大模型的應用能力,真正推動教育行業的發展,為整個教育的數字化轉型貢獻一份力量。
人們看到五月剛剛經歷新一輪升級的“小思”也來到了今天的舞臺。“小思對話”上新了記憶式系統,新增了情緒識別,可以根據提問者的聲音、狀態識別他當下的情緒,并以對應語氣進行回應。還會通過對話記錄,在家長端提供成長報告和養育建議??瓷先ピ絹碓较裾嫒死蠋熈?。
田密:是的,“小思對話”的升級使其越來越像真人老師。然而,反過來說,有些人擔心AI大模型會不會顛覆教育行業,讓AI老師完全代替真人老師。對此,我的答案是否定的。我們認為大模型會給每名老師配備一個AI助教,每個孩子配備一個AI學伴。
老師有很多固定的工作,比如備課和作業批改,這些重復性的工作可以由AI大模型替代。這樣一來,老師就可以把精力集中在對孩子的關愛、喚醒和激發上。對于孩子來說,AI學伴可以24小時在線陪伴他們學習和成長,孩子可以隨時向AI學伴提問,沒有任何壓力,不用擔心問題是否愚蠢,也不用擔心需要重復講解幾遍才能聽明白。
AI可以幫助孩子保持對學習的樂趣和自信,這才是教育行業大模型賦能的終極意義所在。通過這種方式,AI不會替代老師,而是增強老師的能力,讓教育變得更加人性化和個性化。
從整個教育產業結構來看,大模型的融入將會引發怎樣的變化?未來三年內,教育產業在整合大模型時面臨的主要挑戰是什么?
田密:人們都看到大模型的潛力,也都在積極地擁抱這個事情,但目前來看,無論是公立學校、培訓機構還是從業者,對于未來的變化尚不是特別清晰。大家都意識到變革將會發生,但具體的變化何時到來,以及線上與線下的關系是否會被顛覆,人人都在探索。
大模型在教育產業的應用不會是一蹴而就的,而是一個漸進的過程。類似于自動駕駛技術從L1到L5的逐步演進,大模型的應用也需要逐步落地。因此,首先需要明確教育行業中可以應用大模型的場景,并逐一實施落地,同時不斷提升模型的性能。數據的收集和積累是關鍵中的關鍵。只有通過收集大量真實用戶數據,并建立完整的數據閉環,才能實現全面的AI教師服務。
我們的孩子幾乎都是移動互聯網的原住民,從小就在各種電子產品中成長。未來的孩子將會成為AI的原住民,他們從出生起就接觸到帶有AI功能的產品。
教育是一個非常敏感的領域,人們對教育的容錯率很低。就像自動駕駛技術如果應用不當可能導致事故一樣,教育中如果傳授的知識有誤,家長和社會都會產生極大的不滿。這就要求在大模型演進過程中要極為謹慎,特別是在進入公立學校領域時,對教學內容的準確性要求更加嚴格。
因此,大模型在教育中的融合過程將是緩慢而長期的。在此過程中,需要克服的主要挑戰包括技術性能的提升、數據隱私與安全的保護、教育內容的準確性保障以及社會接受度的提升。這些挑戰的解決將決定大模型在教育產業中的成敗。
出品 | 芥末堆教育組
作者 | 昆布
責編 | Rachel
頭圖 | 學而思參加2024WAIC世界人工智能大會