AI大模型應該是目前整個科技行業最火熱的概念,作為國內知名的AI領域的龍頭企業,科大訊飛自然不會落后。很早開始,他們就在從事語音及語言、自然語言理解、機器學習推理及自主學習等核心技術研究。并且在過去幾年,訊飛已經將很多產品和技術推向了包含電子消費、教育、醫療、辦公、車載、智慧城市在內的多個行業和市場。
上周六,科大訊飛正式對外發布了新一代認知智能大模型——星火。這名字取自“星星之火,可以燎原”之意,體現了科大訊飛對于對于AGI的遠景目標。除此之外,早在2001年科大訊飛“半場會議”上,創業團隊就提出了“燃燒最亮的火把,要么率先燎原,要么最先熄滅”。同時 “星火”一詞還來自中國傳統文化二十八星宿中的“心宿”星座,被視為吉祥的象征,代表著力量、勇氣和堅韌不拔的精神。所以從星火這個名字,也能看到訊飛的野心。
【資料圖】
發布會后,我們第一時間深度體驗了這款大模型,在這里我們分享一些我們對這款AI大模型的感受和體驗。
中文自然語義理解能力更強
訊飛星火認知大模型在交互和界面設計上與大家熟悉的ChatGPT比較類似。作為一款對話類的自然語言模型,它通過自然對話方式做到對用戶需求的理解與任務的執行。
既然是對話模型,首先要考驗的是模型對于自然語義的理解能力。這方面中文相當有發言權。因為中文之所以復雜,除了本身表意的屬性之外,在日常交流過程中,同樣的文字、語句所表達的含義可能會隨著語境、音調、習慣甚至是標點符號的變化而截然不同、傳統的交互模型在面對中文這類復雜的自然語言的時候經常翻車,就是因為無法準確理解這些變化背后的含義。
舉個例子:我單身的原因有兩個:一是誰都看不上,二是誰都看不上。兩個原因在語句上完全一樣,但含義卻截然不同。將中文作為母語的我們能夠通過對整個語境的理解,很快明白二者之間的不同。
但AI會怎么理解呢?
我們將這句話輸入ChatGPT,讓它解釋這兩種說法有何不同。ChatGPT給出的解釋是:
顯然ChatGPT認為,這兩種表述的意思都是一樣的。只是“沒有得到注意和認可”和“不被看重,缺乏吸引力”的區別。
再來看看訊飛星火給出的解釋:
顯然,訊飛星火模型給出的解釋更為準確,它能夠判斷出這句話中“對別人的挑剔”,甚至還能夠分析出一種說法是相對自嘲的,而第二種說法“顯得自我膨脹”。這種判斷是更符合我們對于這句話的雙重理解的含義。
這里其實就體現了訊飛星火對于中文自然語義超高的理解能力,這主要是得益于其本身作為一款中國本土市場的AI模型,能夠基于海量中文文本語料進行訓練,同時在相關的核心算法上也更貼近與中文的使用環境和習慣,在對于中文自然語義的理解方面,訊飛星火認知大模型擁有先天的優勢。
我們還輸入了一些其他比較復雜,或者有多重含義的中文語句,訊飛星火都能夠根據所在的語境的不同給出相對準確的判斷,能夠很自然的理解這些語句背后想要表達的真實意圖。
生成文本能夠“拿來即用”
相對于這些單一的自然語言的理解能力,文本生成能力應該是這類語言大模型在當下最具“生產力”的特性。訊飛星火同樣支持強大的文本生成能力,它能夠根據需求創作出郵件、講稿、文案等等任何文本內容。
這種文本生產的過程非常簡單,你只需要賦予身份、描述背景、提出需求,這三個步驟就能夠讓AI模型生成文本,最后你可以再根據生成的文本進行一些細節上的調整和條件的補充。經過我們的實測,訊飛星火大部分時候生成的文本,都能夠做到“拿來即用”的水平。
還是舉例來看,我們告訴訊飛星火:你現在是一位小學班主任,你的一名學生因為經常違反課堂紀律,現在需要給他的家長寫一封書信,告訴他們孩子的基本情況并且希望他們能夠協助你和學校妥善的解決這個問題。
以下是訊飛星火提供給我們的內容:
可以看到,訊飛星火能夠根據你簡單的描述,直接生成信件的基本內容。并且這封信件的內容本身在邏輯性、通順性、可讀性方面都沒有什么問題。你可能注意到,這封信件的措辭和一些描述可能相對比較生硬和直接,需要修改地委婉一些。于是我們向訊飛星火提出需求:希望措辭能夠委婉一些,并且淡化孩子違反紀律的描述,更注重強調孩子的教育和關切問題。
在我們提出了更細化的要求之后。訊飛星火能夠準確理解“委婉”的含義,最終生成的文本內容在整體的措辭和語氣方面都顯得要溫和許多。它甚至還能夠自己拿出一些可行性的建議和意見,來解決存在的問題。讓整個信件內容傳達出了對孩子問題的關注,以及希望尋求家長的協助,共同來幫助他解決問題的態度。
現實中如果你真的想要借助星火來生成一些文本內容。你可以向它提出一些更為具體和細致的要求,進而獲得更理想的最終文本。實際上,僅從文本內容的創作能力來看,訊飛星火這類AI的水平已經超過了大多數的普通人。
未來的想象空間還很大
除了上述的這些能力之外,訊飛星火還在諸多場景化的能力方面做出了嘗試和創新。
比如在多題型可解析數學能力能力上,星火認知大模型目前就具備很強的能力,能夠解答常見的計算、幾何、方程、代數以及情景應用題等,我們嘗試過將一些初高中的數學題直接輸入模型,模型能夠直接生成運算步驟和答案,準確率非常高。
尤其是在一些涉及到大量中文自然語義的情景應用題型上,星火認知大模型能夠憑借自身更為本土化的中文語義理解能力,在運算的精確性上很多時候比GPT還要高。我們都知道,訊飛這些年在教育領域一直都有深入的拓展,推出了很多面向教育市場的產品,后續借助訊飛星火大模型的能力,這些教育類產品能力將會得到飛速提升,也將會給教育行業帶來更多的賦能。從長遠來看,訊飛在這方面的創新和布局,擁有很廣闊的應用前景和想象空間。
和當前行業其他的大模型相比,訊飛星火目前在核心算法、數據積累、算力支撐等方面都有自己的獨到優勢。短期來看,立足于訊飛本身在深度學習算法、大模型技術、行業大數據、知識圖譜、多模態感知、系統工程技術方面優勢積累,接下來我們有望看到訊飛星火能夠不斷地進行技術迭代,尤其是在中文認知的智能領域,有望實現對ChatGPT這樣的行業標桿的追趕。
訊飛官方表示,當前訊飛星火在文本生成、語言理解、數學能力方面已經超過了ChatGPT。并且訊飛官方也公布了接下來的迭代升級時間節點:6月9日,星火將突破開放式問答、多輪對話能力明顯提升、數學能力再升級;8月15日,代碼能力升級以及多模態交互能力提升,希望能幫助到更多的合作伙伴及開發者團隊;10月24日,將實現通用模型對標ChatGPT,中文超越ChatGPT的當前版本,英文能做到相當水平,并在教育、醫療等領域做到業界領先。
訊飛星火采用的是“1+N”架構,其中“1”是通用認知智能大模型算法研發及高效訓練底座平臺,“N”是應用于教育、醫療、人機交互、辦公、翻譯、工業等多個行業領域的專用大模型版本。
在這次訊飛星火的發布會上,科大訊飛就重點發布了星火認知大模型在教育、辦公、汽車、數字員工等行業的應用成果。比如給我們留下非常深刻印象的“星火認知大模型+訊飛聽見”。借助星火認知模型的能力,還能夠對文字內容進行深度分析,可以一鍵生成包括新聞稿件、宣傳文案、多語種翻譯等多種文本內容,它甚至還可以根據內容,進行提問追溯。對于我們這樣的文字工作者來說,這些功能無疑是我們一直以來都夢寐以求的。
類似的應用場景還有教育行業,訊飛已經將星火認知大模型的強大能力加入到自家的學習機、辦公本、錄音筆等智能硬件設備上,實現諸如類人批改和修訂語篇規整等多重的智慧能力。這些新功能的加入能夠極大提升現有產品的使用體驗,真正做到生產力的大幅度提升。另外,當前訊飛在國內車載智能語音應用已經做到了市場占有率第一,這一次認知大模型技術會讓車載人機交互再上一個新的臺階,實現更自由、更擬人化地溝通。
未來,訊飛星火認知大模型還將賦能包括醫療、城市、政法、工業等在內的更多行業,這也是接下來,訊飛這款大模型最值得關注的看點。
目前訊飛已經將星火認知大模型加入到了訊飛開放平臺,將賦能開發者打造更具價值的AI應用。官方還宣布,首批來自36個行業的3000余家企業開發者將接入星火大模型,聯合各行業合作伙伴共建大模型“星火”生態。
這里也可以看出訊飛“星火”命名的背后含義,盡管目前它還是一個星星之火,但在可見的未來,它很有可能成長為AI領域的燎原之勢,能力不容小視。
標簽: