當前位置:首頁(yè) > 百科 > 正文內容

理財AI勇闖「無(wú)人區」:理解專(zhuān)家、成為專(zhuān)家

涼山印刷報價(jià)4個(gè)月前 (07-08)百科9
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

機器之心原創(chuàng )

作者:吳昕

這是一條少有人走過(guò)的路。

用十年時(shí)間成為全球在線(xiàn)服務(wù)數億用戶(hù)的財富管理平臺后,擺在螞蟻財富面前的是一段少有人走過(guò)的路:

這 5 億活躍用戶(hù)第一次動(dòng)動(dòng)手就能接觸到各類(lèi)普惠的理財產(chǎn)品,但真正理財行為成熟的僅占兩成。而放眼中國 7.2 億基金投資者里,每 3600 人才能分到 1 位傳統理財顧問(wèn)來(lái)服務(wù)。投多顧少,對很多普通投資者來(lái)說(shuō),往往處于專(zhuān)業(yè)服務(wù)的「無(wú)人區」。俗話(huà)說(shuō),「瞎子引瞎子,二人掉深淵」,用戶(hù)側對專(zhuān)業(yè)服務(wù)的需求呼喚技術(shù)的進(jìn)步。

2020 年,「 AI 理財助理」支小寶正式對外上線(xiàn),螞蟻財富希望能補足行業(yè)服務(wù)的空白。不久,螞蟻財富又投入 50 個(gè)人年—— 一個(gè)操作系統的開(kāi)發(fā)成本——再造支小寶 ( 1.0 )。

誰(shuí)曾想半年后,這位剛達專(zhuān)業(yè)水準的 AI 助理,又率先搭上大模型的快車(chē),從檢索式 AI( 1.0 )進(jìn)化到生成式AI( 2.0 ),讓 4300 萬(wàn)普通投資者先一步擁有了自己的「私人理財專(zhuān)家」。

據螞蟻財富保險智能服務(wù)部總經(jīng)理陸鑫介紹,技術(shù)團隊用最新的大模型技術(shù)去實(shí)現支小寶這樣一個(gè)嚴謹產(chǎn)業(yè)應用時(shí),做了三層工作:底層是面向嚴謹應用定制的鳳凰大模型 Finix,中間層是模仿專(zhuān)家思考和工作流程的 agentUniverse (下文簡(jiǎn)稱(chēng) aU )專(zhuān)業(yè)智能體框架,兩者結合支撐了最上層支小寶有效的投顧服務(wù)。

一、空降熱搜,AI 的話(huà)大家聽(tīng)懂了

兩個(gè)月前,金價(jià)狂飆,連帶新版支小寶空降熱搜。

「能不能買(mǎi)?」「要不要買(mǎi)?」用戶(hù)的咨詢(xún)如潮水般涌來(lái)。一個(gè)月內,支小寶已發(fā)出上萬(wàn)次針對黃金的理性投資提醒。雖有些「爹味」,但支小寶卻真的讓很多盲目跟風(fēng)的人冷靜了一下。在熱搜話(huà)題里,有人甚至調侃,「 AI 幾句話(huà),立省 10 萬(wàn)。」

熱搜似乎只是一個(gè)縮影,實(shí)際上反映出大語(yǔ)言模型煥新理財助理后產(chǎn)生的巨大變化——提醒變得通俗易懂,讓人聽(tīng)得進(jìn)去。新版支小寶上線(xiàn)不久,用戶(hù)已超四千萬(wàn)。

「黃金現在能買(mǎi)嗎?」面對這個(gè)大家普遍關(guān)心的問(wèn)題,支小寶很快給出直觀(guān)全面的分析,提醒在高點(diǎn)保持觀(guān)望,不急于馬上增持。論據上,既綜合了平臺上幾十家基金公司的共識和分歧、利空利好因素,也考慮了個(gè)人持倉。

同樣的問(wèn)題扔給通用大模型,TA 的回答更像隔靴搔癢,因為不會(huì )對我們的問(wèn)題做任何假設,所以,說(shuō)了很多,卻又像什么都沒(méi)說(shuō)。

面對「小米現在怎么樣」這樣有些沒(méi)頭腦、模糊的查詢(xún),支小寶現在也能給出滿(mǎn)意的答復。

021yin.com/s?__biz=MzA3MzI4MjgzMw==mid=2650925141idx=1sn=8df59379ca62b77ae022b3ab4b0f1debchksm=84e42c2bb393a53d8b209d427946299280357699690c9c23e21a8ece087f5e794aa2bbcbf7a6token=181982128lang=zh_CN#rd

支小寶底層引入嚴謹應用大模型 Finix 和專(zhuān)業(yè)智能體框架 aU 后,金融意圖識別準確率從 80% 提升到 95%,用戶(hù)的平均對話(huà)輪次增加了約 40%。這無(wú)疑是質(zhì)的提升,技術(shù)團隊說(shuō)到,面向嚴謹應用去定制大模型技術(shù)后,讓支小寶不僅「更像一個(gè)人」還能「像一位專(zhuān)家」,能解決用戶(hù)的真實(shí)疑惑。

余音未落,我們瞥見(jiàn)支小寶首頁(yè)右上方顯示,已有 600 多萬(wàn)人發(fā)起了提問(wèn)。

二、「模仿專(zhuān)家」的關(guān)鍵:意圖理解的飛躍

在「模仿專(zhuān)家、成為專(zhuān)家」的「職業(yè)規劃」下,支小寶的技術(shù)發(fā)展也被分為兩層:一層,讓支小寶模仿專(zhuān)家去理解用戶(hù);第二層,讓它不再被動(dòng)等待問(wèn)題,通過(guò)主動(dòng)服務(wù)用戶(hù),成為專(zhuān)家。

「模仿專(zhuān)家」準確把握用戶(hù)意圖,這在投顧服務(wù)中尤其具有挑戰性。

不同于搜索場(chǎng)景中明確詳細的用戶(hù) query,理財對話(huà)中,用戶(hù)的表達往往簡(jiǎn)單模糊,如「小米現在怎么樣」、「現在黃金怎么樣」,乃至錯字或縮寫(xiě),如「推薦一支軍工基」。前大模型時(shí)代,AI 依靠關(guān)鍵詞匹配或淺層語(yǔ)義分析,很容易判斷失誤,導致服務(wù)偏離用戶(hù)真實(shí)需求。

支小寶 1.0 嘗試過(guò)用上下文建模緩解這一問(wèn)題,終究不過(guò)揚湯止沸。接入大語(yǔ)言模型后,基于大語(yǔ)言模型的多智能體( Agent )框架(「仿金融專(zhuān)家多智能體協(xié)同推理」)徹底顛覆了傳統從 NLU 到生成的 Pileline 。

當你問(wèn)「小米現在怎么樣」,可以腦補這樣一段畫(huà)面,支小寶內部的多個(gè) Agent 將各司其職:

一個(gè)用戶(hù)服務(wù) Agent 結合服務(wù)歷史和用戶(hù)畫(huà)像,生成多個(gè)可能的意圖假設,一個(gè)知識檢索 Agent 為每個(gè)假設搜集背景知識和相關(guān)資訊,一個(gè)專(zhuān)業(yè)顧問(wèn) Agent 從市場(chǎng)和投顧專(zhuān)業(yè)視角補充觀(guān)點(diǎn)和建議。

通過(guò)多專(zhuān)家的「協(xié)同推理」,這些來(lái)自不同 Agent 的信息吉印通起來(lái)確定最可能的用戶(hù)意圖,置信度最高的意圖被認定為用戶(hù)真實(shí)意圖。最后,Agent 們協(xié)作生成最終回答。

這種基于大語(yǔ)言模型的多智能體框架,很容易讓人聯(lián)想到電影《頭腦特工隊》中人腦的運作。樂(lè )樂(lè )、憂(yōu)憂(yōu)、怒怒、厭厭和驚驚,各司其職,共同決定主人萊莉對外界刺激的反應。

新的解題模式與傳統方式有兩個(gè)明顯不同。

新框架下,系統不是直接做出判斷,而是沿著(zhù)分歧的「枝條」、「分叉」,推理各種可能。「你可以理解成是一個(gè)地圖,或者是一棵帶有分支的樹(shù),然后沿著(zhù)分支漫游。」技術(shù)團隊打了個(gè)比方。

另外,得益于「協(xié)同推理」,即便個(gè)別 Agent 判斷失誤,其他 Agent 也可以通過(guò)協(xié)同推理予以糾正,大大提高了系統的魯棒性。

「我們利用專(zhuān)家多智能體的專(zhuān)業(yè)知識和推理能力,吃掉了用戶(hù)表達中不可避免的的模糊和存疑,最后,用更大規模的嚴謹應用大模型兜住了前面所有可能的誤差。」技術(shù)團隊解釋道,將對話(huà)系統的基礎從傳統 Pipeline 升級到嚴謹應用大模型 Finix和專(zhuān)業(yè)智能體框架 aU 的組合后,金融意圖識別準確率從 80% 躍升至 95%。

值得一提的是,在「仿金融專(zhuān)家多智能體協(xié)同推理」過(guò)程中,「用戶(hù)畫(huà)像」扮演著(zhù)關(guān)鍵角色,這也是螞蟻財富的傳統強項。

大模型技術(shù)突破之前,他們就能通過(guò)分析用戶(hù)在平臺上的有效脫敏信息,包括理財行為、理財偏好等生成用戶(hù)畫(huà)像。1.0 階段就沉淀了多個(gè)專(zhuān)業(yè)的金融模型,能在平臺噪音中提煉用戶(hù)動(dòng)機,預測用戶(hù)行為。

現在,支小寶還有一個(gè)專(zhuān)門(mén)團隊負責用戶(hù)畫(huà)像生產(chǎn),借助大語(yǔ)言模型,用戶(hù)畫(huà)像的顆粒度和洞察深度又被提升到了新高度。

三、「成為專(zhuān)家的 AI 」: 不止被動(dòng)解答還能主動(dòng)搭話(huà)

螞蟻財富很早就涉足到理財這個(gè)垂直領(lǐng)域的自然語(yǔ)義理解,投入很多精力去讓機器人聽(tīng)懂問(wèn)題,但結果發(fā)現大部分人在專(zhuān)業(yè)嚴謹應用中難以開(kāi)口問(wèn)出有效問(wèn)題,所以支小寶在技術(shù)上做了一些嘗試,跳出問(wèn)答界面,成為專(zhuān)家,去主動(dòng)服務(wù),詢(xún)問(wèn)用戶(hù)是否需要幫助

在支小寶問(wèn)答首頁(yè),大量用戶(hù)真實(shí)問(wèn)題聚合成的「猜你想問(wèn)」、「熱門(mén)問(wèn)題」很接地氣,能免去小白和 i 人用戶(hù)「難以開(kāi)口」的尷尬。

「幫我挑只新能源基金」,接到命令后,支小寶迅速調用各類(lèi) API,篩選出 10 只備選基金,提示風(fēng)險并表達對新能源行業(yè)的中性立場(chǎng),也主動(dòng)提供看好的消費行業(yè)基金供參考。

完成對話(huà)后,支小寶還會(huì )主動(dòng)預判下一步需求,如「看看消費行業(yè)的基金」或「新能源行業(yè)的后市展望。」選擇其中一個(gè),對話(huà)會(huì )繼續開(kāi)展下去。

,時(shí)長(cháng)00:28

除了中心化的對話(huà)窗口,現在的支小寶還能深入到用戶(hù)理財場(chǎng)景中,作為專(zhuān)家主動(dòng)和用戶(hù)交互,發(fā)起對話(huà),引導 TA 進(jìn)入下一個(gè)服務(wù)場(chǎng)景。

比如,用戶(hù)查看基金持倉陣地、進(jìn)入基金詳情頁(yè)時(shí),支小寶會(huì )主動(dòng)搭話(huà),問(wèn)詢(xún)是否需要解讀漲跌,或者調整持倉。如果主動(dòng)引導「命中」用戶(hù)需求,讓他們覺(jué)得有用,用戶(hù)很可能會(huì )繼續提問(wèn),推動(dòng)服務(wù)走向深入。

這種多輪溝通的能力,正是破解金融服務(wù)難題的關(guān)鍵所在。這就像我們在看病求醫問(wèn)藥的時(shí)候,需要醫生和我們的多輪復雜溝通才能摸清「癥結」,「開(kāi)具處方」。

技術(shù)團隊進(jìn)一步解釋說(shuō),大模型壓縮了海量的世界知識和金融知識,有一定的推理能力,而專(zhuān)家智能體引入行業(yè)專(zhuān)家的 SOP 進(jìn)一步強化了這種推理能力,讓支小寶學(xué)會(huì )預測用戶(hù)在享受某項服務(wù)后,下一步最可能需要什么。

過(guò)去,由于技術(shù)局限性,支小寶追求對話(huà)準確性,并不會(huì )特別關(guān)注輪次。現在,輪次已經(jīng)成為衡量服務(wù)深度的重要指標:用戶(hù)與新版支小寶的對話(huà)輪次提升了約 40%。

四、對齊:成為「專(zhuān)家」的關(guān)鍵一環(huán)

在向「專(zhuān)家」進(jìn)階的路上,AI 其實(shí)也跟人一樣努力。每個(gè)月,技術(shù)團隊都會(huì )拿出包含 2000 多個(gè)問(wèn)題的評測數據集,讓人類(lèi)專(zhuān)家和支小寶來(lái)一場(chǎng)雙盲 PK,看看后者有沒(méi)有長(cháng)進(jìn)。

現在,面對「巴菲特現在為什么加倍下注油氣股票 」、「巴菲特為什么減持比亞迪」、「橋水基金的投資哲學(xué)是什么」這樣的問(wèn)題,支小寶也能像金融專(zhuān)家一樣解讀。

通用大語(yǔ)言模型雖然可以通過(guò)檢索增強生成( RAG )迅速捏合一個(gè)摘要式答案,卻難以像分析師一樣深入剖析問(wèn)題。

,時(shí)長(cháng)00:26

回答「巴菲特現在為什么加倍下注油氣股票 」。

讓支小寶向專(zhuān)家對齊,正是這支隊伍的核心工作,其中一個(gè)極其重要的工作就是「對齊訓練」,這也是 ChatGPT 獲得成功的關(guān)鍵。

不過(guò),「理財專(zhuān)家」定位使得支小寶的對齊水位需要比 OpenAI 的「 3H 」( Helpful、Harmless、Honest )更高,面向理財這樣的嚴謹應用,支小寶技術(shù)團隊「由內到外」向專(zhuān)家對齊,對齊標準從 3H 升級為嚴謹性和專(zhuān)業(yè)性,整體工作也可謂細致入微。

首先,對齊工作背靠?jì)蓚€(gè)核心訓練環(huán)節——監督微調( SFT )和基于人類(lèi)反饋的強化學(xué)習( RLHF ),前者明確指示模型應該完成哪些任務(wù),后者教導模型如何以人類(lèi)偏好的標準完成這些任務(wù)。

為了讓支小寶能?chē)乐數赝瓿扇蝿?wù),大模型底座就需要努力克服眾所周知的模型幻覺(jué)。類(lèi)似于駕照訓練讓司機對齊了安全駕駛的標準,支小寶底層模型也對齊了嚴謹的標準。在監督微調( SFT )階段,他們從數據、量綱、實(shí)體、關(guān)系、事實(shí)、觀(guān)點(diǎn)和計算等維度拆解「嚴謹」,為不同任務(wù)場(chǎng)景準備相應的數據集,教會(huì )支小寶如何嚴謹地處理數字、觀(guān)點(diǎn)、實(shí)體,保障它們的可信可溯源。

在基于人類(lèi)反饋的強化學(xué)習( RLHF )環(huán)節,他們進(jìn)一步訓練大模型對嚴謹性和專(zhuān)業(yè)性的自發(fā)遵從,這也是讓大語(yǔ)言模型勝任嚴謹應用的關(guān)鍵。新版支小寶會(huì )在缺乏信息時(shí)「認慫」,避免強答;會(huì )像人類(lèi)專(zhuān)家一樣,提供專(zhuān)業(yè)分析的同時(shí),識別和安撫用戶(hù)情緒,這都歸功于這個(gè)訓練環(huán)節為系統對齊了專(zhuān)家的回答標準。

接受完監督微調( SFT )和基于人類(lèi)反饋的強化學(xué)習( RLHF )「調教」的大語(yǔ)言模型,就像手握駕照的司機,上路總歸有危險,還需要安全的汽車(chē)和交通系統。為此,技術(shù)團隊也安排了數據鏈路、智能體反思、安全圍欄、攻防巡檢等系統性措施進(jìn)一步保障支小寶的嚴謹性。

不過(guò),知易行難,最大的挑戰其實(shí)是構建專(zhuān)家水平的高質(zhì)量指令集所需要的定力和資源——當你為大語(yǔ)言模型寫(xiě)好劇本后,接下來(lái)就要準備相應的指令數據(和銀子)。

技術(shù)團隊花了大量心思構建金融能力指令集。他們借鑒了布魯姆模型,這是教育心理學(xué)中一種廣受認可的能力評估方法,提供了清晰的認知發(fā)展路徑,將能力培養劃分為記憶、理解、應用、分析、評價(jià)、創(chuàng )造等遞進(jìn)階段,為訓練過(guò)程提供了明確主線(xiàn)。

通過(guò)將這六個(gè)認知層次與不同業(yè)務(wù)場(chǎng)景交叉對應,技術(shù)團隊詳細定義了支小寶在每個(gè)場(chǎng)景和認知階段應掌握的具體技能,并據此設計訓練任務(wù),最終形成了一套專(zhuān)業(yè)的金融能力培養方案。

在數據標注上,螞蟻財富也投入了大量精力和資源。支小寶底層的嚴謹應用大模型面向專(zhuān)家進(jìn)行對齊訓練,這意味著(zhù)只有專(zhuān)家水準的人才能滿(mǎn)足標注工作的嚴謹性和專(zhuān)業(yè)性,他們不僅為此組建了一個(gè)具有專(zhuān)業(yè)標注能力的團隊,還維護著(zhù)一支具有金融和算法復合能力的技術(shù)隊伍,專(zhuān)門(mén)針對高難度問(wèn)題構建精準的金融語(yǔ)料和數據,確保支小寶能夠在復雜的金融領(lǐng)域游刃有余。

五、接力:「原生大模型技術(shù)人員」

時(shí)間倒轉 2018 年,支小寶的「前身」——內部代號為「安娜」的智能理財 AI 項目啟動(dòng),恰逢 OpenAI 的 ChatGPT 前身 GPT-1.0 開(kāi)始研發(fā)。當時(shí),AI 的真正威力尚未完全釋放。

支小寶的初期團隊匯聚了 NLP、CV 和工程技術(shù)等多領(lǐng)域的精英。他們懷著(zhù)探險家的熱情出發(fā),卻很快發(fā)現前路崎嶇難行。每一步都像在荒野中開(kāi)辟道路,即便親眼目睹大語(yǔ)言模型帶來(lái)的巨大突破,仍難以完全信任它的潛力。過(guò)往積累的知識和技能仿佛一夜貶值,也徒增一些不安與壓力。

如今,這個(gè)技術(shù)團隊也不斷擴充著(zhù)新鮮血液,一群「原生大模型技術(shù)人員」正成為團隊中堅力量。這些人能丟掉之前的技術(shù)包袱,天生以大模型思維解決問(wèn)題,仿佛從不擔心技術(shù)的邊界,在不知不覺(jué)中拓展了曾經(jīng)的技術(shù)邊界。

技術(shù)更迭如同潮水,一浪高過(guò)一浪。就像多年前支付寶的掃碼支付,當那聲清脆的「滴」響起,曾經(jīng)令人驚嘆的技術(shù)復雜性瞬間歸于平靜。總有一天,轟轟烈烈的大模型還有它的原生技術(shù)人員,也將沉淀為后代生活中一個(gè)平凡的 Token。

但更多的普通人,已經(jīng)就此獲益。

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全