當前位置:首頁(yè) > 百科 > 正文內容

騰訊研究院AI速遞 20240815

揭陽(yáng)打印店3個(gè)月前 (08-15)百科12
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

生成式AI

一、 超級AI誕生?史上最強超算9月上線(xiàn),英偉達最強芯片加持

1. SingularityNET公司的新型超級計算機將于9月上線(xiàn),配備英偉達最強GPU,旨在推動(dòng)人類(lèi)級別的人工智能(AGI)發(fā)展;

2. 超算采用多層次認知計算網(wǎng),包括深度神經(jīng)網(wǎng)絡(luò )、大型語(yǔ)言模型(LLM)和多模態(tài)系統,支持復雜AI系統訓練;

3. 超算網(wǎng)絡(luò )使用先進(jìn)硬件如NVIDIA L40S GPU和AMD處理器,結合新型神經(jīng)-符號AI方法,減少資源需求,提高計算效率。

021yin.com/s/SrSdRY1_M-eOGsFIJuTTvQ

二、 馬斯克突然發(fā)布 Grok 2大模型 ,能解「9.8 和 9.11 哪個(gè)大」

1. Grok-2, 新一代大模型,已在性能上與GPT-4o相媲美,特別在編碼、復雜問(wèn)題解決及數學(xué)方面表現出色;

2. 模型包括Grok-2和Grok-2 mini兩個(gè)版本,均已在X平臺上向用戶(hù)發(fā)布,展示了顯著(zhù)的進(jìn)步和多模態(tài)理解能力;

3. xAI計劃通過(guò)新的企業(yè)API平臺發(fā)布Grok-2,強化安全功能,并通過(guò)新計算集群提升模型核心推理能力。

021yin.com/s/nBaY2srcMSzvEoecOyh1Cg

三、 谷歌版Her,搶先OpenAI登場(chǎng),高級語(yǔ)音模型Gemini Live

1. 谷歌推出Gemini Live語(yǔ)音模型,將在全球30億安卓和22億iOS設備上線(xiàn),提供自然對話(huà)體驗和多種聲音選擇;

2. Gemini深度集成安卓和Pixel設備,支持跨應用程序操作和上下文感知功能,提高用戶(hù)交互便利性;

3. Gemini Live面臨技術(shù)挑戰,包括安全問(wèn)題和實(shí)時(shí)演示中的技術(shù)故障,但谷歌決定快速推進(jìn)以競爭市場(chǎng)領(lǐng)先地位。

021yin.com/s/mR5XpquGCcd6HNrptBnw0Q

四、 最強智能體Agent Q發(fā)布!Llama 3零樣本成功率提升340%

1. Agent Q是一個(gè)自監督智能體,能通過(guò)互聯(lián)網(wǎng)任務(wù)進(jìn)行自我對弈和強化學(xué)習,具備推理、規劃和自我修復功能;

2. 利用Llama 3模型,Agent Q在一天內將零樣本成功率提升340%,特別在真實(shí)世界預訂任務(wù)中表現出色;

3. 結合引導式蒙特卡洛樹(shù)搜索(MCTS)和直接偏好優(yōu)化(DPO),Agent Q提高了多步推理任務(wù)的泛化能力和成功率。

021yin.com/s/xVB7ZiCsrNbCrQZKb2mwjA

五、 沒(méi)有等來(lái)OpenAI開(kāi)源GPT-4o,等來(lái)了騰訊的開(kāi)源版VITA

1. VITA是由騰訊優(yōu)圖等機構開(kāi)發(fā)的首個(gè)開(kāi)源多模態(tài)大語(yǔ)言模型(MLLM),能同時(shí)處理視頻、圖像、文本和音頻,提供多模態(tài)交互體驗;

2. 采用Mixtral 8×7B為基礎,進(jìn)行雙語(yǔ)指令微調和多模態(tài)對齊,增強了視覺(jué)和音頻能力;

3. VITA實(shí)現了非喚醒交互和音頻中斷的人機交互功能,通過(guò)復式部署模型,提高了環(huán)境輸入的連續跟蹤能力。

021yin.com/s/_ILH_GZaKMUlRaqsZBU0Eg

六、 全球首個(gè)AI流媒體音樂(lè )App來(lái)了!一直生成一直聽(tīng),國產(chǎn)

1. 吉印通萬(wàn)維開(kāi)發(fā)的全球首個(gè)AI流媒體音樂(lè )App Melodio,提供無(wú)限流式AI生成音樂(lè ),支持中英文歌曲生成;

2. Melodio允許用戶(hù)通過(guò)簡(jiǎn)單的Prompt輸入生成音樂(lè ),同時(shí)提供歌曲參考模式,增強音樂(lè )生成的多樣性和個(gè)性化;

3. 吉印通萬(wàn)維還推出了Mureka,一個(gè)AI音樂(lè )創(chuàng )作平臺,使用類(lèi)Sora架構,支持高質(zhì)量音頻生成,提升音樂(lè )創(chuàng )作的易用性和專(zhuān)業(yè)性。

021yin.com/s/30HmpWkChdG5jlAs2Bydjw

七、 蘋(píng)果大模型新成果:GPT-4o扮演用戶(hù),考察大模型工具調用

1. 蘋(píng)果發(fā)布新開(kāi)源Benchmark ToolSandbox,采用場(chǎng)景化測評方法,考察大模型在真實(shí)環(huán)境中的工具調用能力;

2. ToolSandbox測試包括對話(huà)交互和狀態(tài)依賴(lài)場(chǎng)景,使用GPT-4o模擬用戶(hù)與模型進(jìn)行交互,提高測試的實(shí)際應用相關(guān)性;

3. 測試結果顯示閉源模型如GPT-4o表現優(yōu)于開(kāi)源模型,尤其在多工具調用和多輪對話(huà)任務(wù)中,但所有模型在狀態(tài)依賴(lài)任務(wù)和規范化場(chǎng)景中面臨挑戰。

021yin.com/s/O1uf5y0aCjVIvsvRVkdBBw

前沿科技

八、 谷歌同步發(fā)布Pixel 9 ,讓 Android 的 AI 體驗搶先 iOS一步

1. Google發(fā)布Pixel 9系列,首次將大型多模態(tài)AI模型Gemini Nano整合進(jìn)Android系統,提前于iOS實(shí)現設備內AI功能;

2. Pixel 9系列包括四款AI手機,具備高級語(yǔ)音功能Gemini Live,支持多應用跨界調用和AI圖像功能;

3. 由Gemini Live提供自由流暢的交流體驗,支持免提功能,允許用戶(hù)在多種場(chǎng)景下無(wú)縫與AI進(jìn)行互動(dòng)。

021yin.com/s/w6BmotpEqxtgNZDtxvND8Q

報告觀(guān)點(diǎn)

九、 “L2越厲害,就離L4越遠”和樓天城聊Robotaxi和AI世界觀(guān)

1. 樓天城認為L(cháng)2自動(dòng)駕駛技術(shù)的高度發(fā)展與L4自動(dòng)駕駛技術(shù)的目標相距甚遠,反之亦然;

2. 在自動(dòng)駕駛技術(shù)發(fā)展中,數據的多少并非決定性因素,當自動(dòng)駕駛技術(shù)超越人類(lèi)水平后,過(guò)多的數據可能成為干擾項;

3. 自動(dòng)駕駛的發(fā)展需要通過(guò)多個(gè)階段,每個(gè)階段都有其關(guān)鍵技術(shù)和挑戰,例如從1000小時(shí)到10000小時(shí)的跳躍需要考慮如何降低其他車(chē)輛的風(fēng)險。

021yin.com/s/0_wiRFV-ZTF9pWvk_CCkkQ

十、 菲爾茨獎得主陶哲軒最新演講:AI 將催生出一個(gè)大數學(xué)時(shí)代

1. 陶哲軒認為AI將推動(dòng)數學(xué)進(jìn)入一個(gè)新的大數學(xué)時(shí)代,尤其在數學(xué)證明和計算領(lǐng)域顯示出巨大潛力;

2. 他指出AI在數學(xué)上的實(shí)現相對普通,主要通過(guò)輸入數字和權重計算,但其對數學(xué)研究方式的潛在改變是革命性的;

3. 陶哲軒強調,盡管AI在生成準確結果方面有時(shí)會(huì )出現問(wèn)題,但其在處理大規模數學(xué)項目和形式化驗證方面的應用前景令人期待。

021yin.com/s/e0K_bfOqYew8H0_P1fPh2Q

??訂閱下方合集,獲取每日推送

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全