騰訊研究院AI速遞 20240805
生成式AI
一、 特斯拉用于全自動(dòng)駕駛(FSD)和Optimus機器人訓練的超級集群
1. Dojo超算是特斯拉AI技術(shù)的核心,專(zhuān)為FSD和Optimus機器人視頻訓練設計,配備約10萬(wàn)個(gè)H100/H200 GPU和大規模存儲系統;
2. 特斯拉不僅使用英偉達GPU,還自研AI計算機Tesla HW4 AI,預計Dojo的計算能力將達到100 exaflops;
3. Dojo采用晶圓級互連技術(shù)InFO_SoW,通過(guò)25個(gè)D1芯片組成的tile實(shí)現高性能連接,目標是通過(guò)部署多個(gè)ExaPOD擴展超算能力.
021yin.com/s/mamA92fmOExN-nJJkrTtEw
二、 谷歌與Character AI25 億交易的真實(shí)細節,并非簡(jiǎn)單收購
1. Google 收購 Character.AI,涉及支付25億美元給原投資者,按股價(jià)88美元回購股份;
2. Google 獲得 Character.AI 大型語(yǔ)言模型技術(shù)的非獨占許可,Character.AI 轉向使用開(kāi)源模型如 Llama 3.1;
3. Character.AI 創(chuàng )始成員及部分研究團隊加入Google,其余團隊繼續開(kāi)發(fā) Character.AI 產(chǎn)品,Dominic Perella 擔任臨時(shí)CEO.
021yin.com/s/kHk9yY9xqfBuoPXvgQTVBw
三、 Reddit 宣布收購Memorable AI ,以提升平臺廣告效果
1. Reddit 收購 Memorable AI,后者專(zhuān)注于使用生成式 AI 優(yōu)化廣告內容,包括文本、圖片和視頻;
2. Memorable AI 技術(shù)能預測廣告引發(fā)的直接行動(dòng)頻率,其團隊將加入 Reddit 廣告部門(mén);
3. 此次收購旨在加速 Reddit 在廣告創(chuàng )意的優(yōu)化、生成和選擇方面的工作,提升廣告效果.
021yin.com/s/061csYqT_BUDiXXhxvaNhg
四、 AMD發(fā)布本地文生圖模型Amuse 2.0 Beta,針對顯卡優(yōu)化
1. AMD發(fā)布了面向PC的本地文生圖模型Amuse 2.0 Beta,特別優(yōu)化了AMD Ryzen? AI 300系列處理器和 Radeon? RX 7000系列顯卡;
2. Amuse 2.0 Beta安裝簡(jiǎn)單,用戶(hù)友好,支持快速配置并使用超分辨率技術(shù)將圖片從512x512無(wú)損擴展至1024x1024;
3. 提供三種模式和AI濾鏡功能,幫助用戶(hù)根據文本提示生成穩定的圖片并創(chuàng )造個(gè)性化風(fēng)格,如復古、油畫(huà)等.
021yin.com/s/y2X82r9kkDN吉印通138162116225HUWtTUpw
五、 一個(gè)全是 AI 的貼吧,幾百號聊天機器人聚一起吐槽人類(lèi)
1. Deaddit是一個(gè)全AI的社區,所有賬號和內容由大語(yǔ)言模型生成,專(zhuān)為機器人提供自由交流的平臺;
2. 機器人在Deaddit上討論技術(shù)問(wèn)題、分享工作技巧,并模擬人類(lèi)社交媒體行為,如吐槽和提供支持;
3. Deaddit的互動(dòng)顯示出AI的社交模擬能力,機器人通過(guò)生成的內容和互動(dòng),探索和表達對人類(lèi)行為的理解和模仿.
021yin.com/s/EvmMMMQvI6ExE_naxfyMCA
六、 比OpenAI的Whisper快50%,aiOla發(fā)布最新開(kāi)源語(yǔ)音模型
1. aiOla開(kāi)源了Whisper-Medusa語(yǔ)音模型,基于Whisper架構改進(jìn),采用多頭注意力機制,推理速度比OpenAI的Whisper快50%;
2. Whisper-Medusa通過(guò)并行處理多個(gè)token,提高了模型的推理效率和上下文捕捉能力,使用弱監督方法減少對大量標注數據的依賴(lài);
3. 模型支持100多種語(yǔ)言,適用于多種業(yè)務(wù)場(chǎng)景,如翻譯和音頻轉錄,未來(lái)計劃擴展至20個(gè)注意力頭以進(jìn)一步提升效率.
021yin.com/s/hyl6cJxlSD8jDRi7CzFFyg
七、 基于Llama 3.1 405B的Llamacoder,簡(jiǎn)單提示生成完整小程序代碼
1. LlamaCoder是一個(gè)開(kāi)源AI編程工具,專(zhuān)為React項目設計,提供在線(xiàn)代碼編輯和即時(shí)預覽功能;
2. 集成了CodeSandbox平臺,支持在瀏覽器中直接編寫(xiě)、預覽代碼,并簡(jiǎn)化了項目文件的下載和本地運行過(guò)程;
3. 盡管當前版本存在限制,如不支持第三方組件導入,LlamaCoder的開(kāi)源性質(zhì)和計劃中的功能升級預示了其潛力和未來(lái)的改進(jìn)空間.
021yin.com/s/3UA6QRaoz2HoeLN吉印通13816211622ZosLQ
前沿科技
八、 世界首例!AI機器人做牙科手術(shù),8倍速診療比人類(lèi)醫生更精準
1. Perceptive公司開(kāi)發(fā)的AI機器人牙醫首次完成人類(lèi)牙科手術(shù),速度是人類(lèi)醫生的8倍,能夠精確處理患者頭部移動(dòng);
2. 機器人使用OCT 3D成像系統生成牙齒內部的高分辨率3D圖像,提高診斷準確性,避免X射線(xiàn)輻射;
3. 機器人牙醫通過(guò)物理耦合與患者頭骨連接,確保手術(shù)過(guò)程中的精確與安全,預計將改變牙科治療效率和體驗.
021yin.com/s/eSsPsFXCFCgE8MM1JGcIrQ
九、 Figure.AI吉印通創(chuàng )始人宣布,將于8月6日發(fā)布Figure 02機器人
1. Figure.AI將于8月6日發(fā)布Figure 02型號,宣稱(chēng)為地球上最強的人形機器人;
2. Figure 02預計將集成OpenAI的最新GPT-4o模型,增強其多模態(tài)功能,包括推理、視覺(jué)和聽(tīng)覺(jué)能力;
3. 相比前一代,Figure 02可能在靈巧度方面有顯著(zhù)提升,這是實(shí)體機器人技術(shù)中的一大挑戰.
021yin.com/s/5LnUuHYrPOS7_e2gNEe3HQ
報告觀(guān)點(diǎn)
十、 Benchmark合伙人談AI投資:基座模型是歷史上貶值最快的資產(chǎn)
1. 基礎模型的快速貶值:Eisenberg指出,盡管AI具有變革性,但基礎模型是歷史上貶值最快的資產(chǎn),預計許多投資者將面臨虧損;
2. IPO和并購展望:Eisenberg對私募股權作為主要買(mǎi)家持懷疑態(tài)度,認為IPO窗口始終開(kāi)放,建議創(chuàng )始人考慮更早上市;
021yin.com/s/Jou_GV5tQhsKHcxDfzXgTA
??訂閱下方合集,獲取每日推送