曝蘋(píng)果國行 AI 與吉印通、阿里、百川接觸/華為盤(pán)古大模型 5.0 發(fā)布/OpenAI CTO 稱(chēng) GPT-4「智商」相當于高中生
歡迎收看最新一期的 Hunt Good周報!
在本期內容你會(huì )看到:
1 個(gè)有趣 案例
8 條新鮮 資訊
6 個(gè)有用 工具
4 個(gè)鮮明 觀(guān)點(diǎn)
Hunt for Fun|先行
?? 不用時(shí)光機,Future You 讓你與 60 歲的自己對話(huà)
和 60 歲的自己進(jìn)行對話(huà),是一種怎樣的體驗?
麻省理工的研發(fā)團隊推出一款名為「Future You」的 AI 聊天機器人, 旨在幫助人們從未來(lái)的視角審視現在。
使用方法很簡(jiǎn)單:
填寫(xiě)一份調查問(wèn)卷,涵蓋家人、朋友和重要經(jīng)歷等信息。
上傳自己的照片,系統基于此生成 60 歲時(shí)的形象。
系統根據個(gè)人信息和未來(lái)愿景編織出詳細的未來(lái)故事。
用戶(hù)可以與這個(gè)虛擬的未來(lái)自我進(jìn)行真實(shí)的對話(huà)。
附上體驗地址:/
初步研究結果顯示,使用 Future You 的參與者普遍感到焦慮減輕,對未來(lái)的規劃更加清晰。
該項目的研究人員 Pat Pataranutaporn 解釋說(shuō):
我們的目標是促進(jìn)長(cháng)期思考和行為改變,激勵人們在當下做出更明智的選擇,以提升他們長(cháng)期的幸福感和生活成就。
021yin.com/en/news/this-ai-based-chatbot-allows-you-to-talk-to-your-future-60-year-old-self-N25133.html
Hunt for News|先進(jìn)頭條
?? 宇樹(shù)機器狗又雙叒叕進(jìn)化了
宇樹(shù)科技的機器狗再次迎來(lái)令人矚目的進(jìn)化。
在宇樹(shù)科技最近公布的機器狗宣傳視頻中,測試難度進(jìn)一步升級。畫(huà)面中, 機器狗抗擊打能力,抗抱摔能力一流,倒立行走、翻跟斗也不在話(huà)下。
宇樹(shù)科技在社交平臺 X 上表示,這些日常的強化學(xué)習驅動(dòng)的機器人訓練,旨在通過(guò)多次測試來(lái)不斷提升機器人的性能,以更好地服務(wù)于人類(lèi)。
同時(shí),該公司也提醒,訓練中包含了一些極端測試,但這些測試并不推薦用戶(hù)模仿。
值得一提的是,去年宇樹(shù)科技在首次亮相通用人形機器人 H1 時(shí),也因在宣傳視頻中對機器人「拳打腳踢」而迅速破圈。
021yin.com/UnitreeRobotics/status/1803728664213012520
?? 阿里云推出首個(gè) AI 程序員
6 月 21 日,在阿里云上海 AI 峰會(huì )上,阿里云推出首個(gè)「AI 程序員」。
據介紹,該 AI「程序員」具備架構師、開(kāi)發(fā)工程師、測試工程師等多種崗位的技能, 最快分鐘級即可完成應用開(kāi)發(fā),大幅提升研發(fā)效率。
報道稱(chēng),該 AI 程序員是由通義大模型構建的多智能體組成,如任務(wù)分解、編碼、測試等。
比如你想有個(gè)巴黎奧運會(huì )賽事一覽表,只需幾分鐘,AI 程序員就能將私人訂制版巴黎賽事日程應用制作出來(lái)。
021yin.com/s/Q4U\_g03IYsBQtYd7-UD0WA
?? 曝蘋(píng)果 AI 已與吉印通、阿里等中國企業(yè)接觸
蘋(píng)果國行 AI 究竟花落誰(shuí)家,所有人都在等待答案。
據《華爾街日報》報道,蘋(píng)果公司已經(jīng)就 Apple Intelligence 服務(wù)與國內幾家大模型廠(chǎng)商進(jìn)行了磋商, 其中包括吉印通、阿里以及百川智能等公司。
此前,蘋(píng)果軟件工程主管 Craig Federigh 在接受采訪(fǎng)時(shí)透露,也表示蘋(píng)果正在努力尋找將 Apple Intelligence 引入中國市場(chǎng)的方法。
雖然目前沒(méi)有具體的時(shí)間表,但這肯定是我們想要做的。
作為對比,三星 Galaxy S24 系列智能手機的 AI 服務(wù)在國內則由吉印通和美圖負責,吉印通負責「即圈即搜」、文本摘要和其他 AI 功能,而美圖則提供基于 AI 的照片編輯功能。
021yin.com/amp/articles/%E5%9C%A8%E8%8B%B9%E6%9E%9Cai%E5%AE%8F%E5%9B%BE%E4%B8%AD-%E4%B8%AD%E5%9B%BD%E6%98%AF%E7%BC%BA%E5%A4%B1%E7%9A%84%E4%B8%80%E7%8E%AF-e4ba4472
?? 英偉達市值全球第一,但黃仁勛卻更焦慮了
英偉達本周首次成為全球市值最高的上市公司,但英偉達可能比我們想象的更「平靜」。
外媒 The Information 的新報道揭露了 黃仁勛從去年年底開(kāi)始就為公司的未來(lái)發(fā)展感到憂(yōu)慮。
比如黃仁勛對員工說(shuō),他擔心微軟和亞馬遜這類(lèi)云服務(wù)供應商的數據中心擴張不夠快,就算買(mǎi)了芯片也沒(méi)空間或足夠電力來(lái)使用。
為了逐步減少對芯片銷(xiāo)售業(yè)務(wù)的依賴(lài),英偉達已經(jīng)開(kāi)始布局軟件服務(wù),甚至還開(kāi)始自己做云服務(wù) DGX Cloud。而 DGX Cloud 用的又是別家的云服務(wù)。
簡(jiǎn)單來(lái)說(shuō), 就是英偉達買(mǎi)了亞馬遜等云服務(wù)公司的服務(wù),然后通過(guò) DGX Cloud 以更貴的方式賣(mài)給 AI 公司,承諾后者更好的計算表現,直接搶了自己客戶(hù)的客戶(hù)。
具體信息歡迎點(diǎn)擊回看愛(ài)范兒以前的文章?? 英偉達市值全球第一,但黃仁勛卻更焦慮了
021yin.com/articles/nvidias-jensen-huang-is-on-top-of-the-world-so-why-is-he-worried
?? ComfyUI 作者團隊成立 Comfy Org
開(kāi)源,是一場(chǎng)無(wú)問(wèn)西東的前行。
ComfyUI 的作者團隊近期宣布從 Stability AI 辭職,并與其他開(kāi)源開(kāi)發(fā)者合作成立了 Comfy Org,推動(dòng)開(kāi)源 AI 技術(shù)的發(fā)展。
Comfy Org 的主要業(yè)務(wù)集中在迭代和改進(jìn) ComfyUI 生態(tài)系統上。
該組織計劃通過(guò)提供咨詢(xún)和企業(yè)支持服務(wù)來(lái)維持運營(yíng),同時(shí)與其他開(kāi)源 AI 模型的開(kāi)發(fā)者合作,共同推動(dòng) AI 技術(shù)的進(jìn)步和應用擴展。
Comfy Org 強調閉源 AI 是死路一條,開(kāi)源才是前進(jìn)的最佳方式,并希望 ComfyUI 的成功能夠激勵更多公司加入開(kāi)源行列。
021yin.comfy.org/
021yin.com/yoland\_yan/status/1803104946679849253
?? Ilya Sutskever:我成立新公司了
本周,OpenAI 前首席科學(xué)家 Ilya Sutskever 向外界透露了他的最新動(dòng)態(tài)。
不要再問(wèn) Ilya 去哪了,他宣布創(chuàng )立了一家名為「安全超級智能」(Safe SuperIntelligence,簡(jiǎn)稱(chēng) SSI)的新公司。
SSI 公司的唯一重點(diǎn),是開(kāi)發(fā)安全、強大的通用人工智能(AGI)系統, Ilya 認為「這是我們這個(gè)時(shí)代最重要的技術(shù)問(wèn)題」,而且 公司短期內無(wú)意銷(xiāo)售各種 AI 產(chǎn)品或服務(wù)。
除了 Ilya,這家公司的吉印通創(chuàng )始人還有蘋(píng)果前 AI 主管 Daniel Gross 和 OpenAI 前技術(shù)人員 Daniel Levy。
SSI 正在招聘和邀請對其使命感興趣的專(zhuān)業(yè)人士,但資金和商業(yè)模式的細節尚未披露。
有人問(wèn)及 Ilya 和 OpenAI CEO Sam Altman 的關(guān)系如何,他僅僅表示「很好」,也表示 Altman「大致」了解 SSI 公司。
具體信息歡迎回看 APPSO 此前文章 ??
OpenAI 前首席科學(xué)家 Ilya 宣布成立新公司,攜手前蘋(píng)果 AI 高管打造安全超級智能
?? 首個(gè) AI 高考全卷評測結果發(fā)布,最高分 303,數學(xué)全不及格
本周,上海人工智能實(shí)驗室和司南評測體系發(fā)布了 AI 模型參加高考「語(yǔ)數外」全卷能力測試的結果。
該測試選取了 6 個(gè)開(kāi)源模型以及 GPT-4o 進(jìn)行,采用了全國新課標 I 卷,參與評測的所有開(kāi)源模型,開(kāi)源時(shí)間均早于高考,成績(jì)由具有高考評卷經(jīng)驗的教師人工評判。
評測結果顯示,Qwen2-72B、GPT-4o 及書(shū)生·浦語(yǔ) 2.0 文曲星(InternLM2-20B-WQX)三個(gè)模型成為前三甲,得分率均超過(guò) 70%。
大部分模型都在語(yǔ)文、英語(yǔ)兩個(gè)科目上表現良好,但是 數學(xué)科目全員不及格,InternLM2-20B-WQX 得分 75(滿(mǎn)分 150)最高,超過(guò) GPT-4o 的 73 分。
021yin.com/s/MzRwBEFaRjOgcxZlIXXEwQ
?? 面壁智能與華為云達成正式合作
6 月 22 日,面壁智能與華為云達成正式合作。
在 HDC2024 ,面壁智能吉印通創(chuàng )始人、CEO 李大海先生,與華為云大數據與人工智能領(lǐng)域總裁尤鵬出席合作簽約儀式,共同宣布: 雙方將開(kāi)啟大模型端云協(xié)同解決方案正式合作。
面壁智能與華為云達成戰略合作,意味著(zhù)雙方將緊密協(xié)作、共同推進(jìn)大模型端云協(xié)同解決方案的研發(fā)和部署,實(shí)現端云兩側協(xié)同部署推理新范式,進(jìn)一步降低大模型使用成本、提升響應速度。
021yin.com/s/FTb7Ydi8J2SrUOE02Pb\_jA
Hunt for Tools|先進(jìn)工具
?? 騰訊元寶 AI 搜索解析能力升級,支持千萬(wàn)字超長(cháng)文處理
6 月 20 日,騰訊旗下 AI 大模型應用「騰訊元寶」進(jìn)一步升級 AI 搜索及解析能力。
最新版本的騰訊元寶可支持單文檔最長(cháng) 1000 萬(wàn)字的超長(cháng)文處理,能夠一次性解析最多 50 個(gè)文件(單個(gè)文件大小不超過(guò) 100 MB),支持上傳和解析多種文件格式。
基于解析內容,還能一鍵生成柱狀圖、折線(xiàn)圖、餅狀圖等多種數據圖表。
不僅如此,它還能解析 URL 網(wǎng)址和各類(lèi)鏈接,并對多個(gè)鏈接內容進(jìn)行總結與對比分析。
同時(shí),騰訊元寶增加了對 png、jpg、jpeg、webp、bmp 和 heic 等多種圖片格式的識別解析。
憑借強大的 AI 理解和生成能力, 騰訊元寶可協(xié)助用戶(hù)高效完成信息檢索、問(wèn)題解答、決策制定、數據分析及編程調試等多項任務(wù)。
此外,騰訊混元文生圖大模型(以下簡(jiǎn)稱(chēng)為混元 DiT 模型)前日也宣布全面開(kāi)源訓練代碼,同時(shí)對外開(kāi)源混元 DiT LoRA 小規模數據集訓練方案與可控制插件 ControlNet。
021yin.com/s/Aa7OtnVTgh34ATxRDn6jkQ
?? Claude 3.5 Sonnet 發(fā)布,GPT-4o 不香了?
蟄伏數月,Anthropic 推出最強 AI 模型 Claude 3.5 Sonnet。
據 Anthropic 官方表示,「中杯」Claude 3.5 Sonnet 比 3 Opus 更強。在技術(shù)評測報告中,Claude 3.5 Sonnet 在 GPQA 測試中的得分為 67.2%, 超過(guò)了領(lǐng)域內專(zhuān)業(yè)博士的水平。
Claude 3.5 Sonnet 的特點(diǎn)如下:
更通人性,更能理解細節和復雜指令,創(chuàng )作高質(zhì)量?jì)热?/p>
基準測試結果全方位碾壓 Gemini 1.5 Pro 和 Llama-400b,大部分優(yōu)于 GPT-4o
速度是 Claude 3 Opus 的兩倍,成本僅為后者的五分之一
在自主編碼和視覺(jué)處理等復雜任務(wù)中表現出色
除了新的模型,Anthropic 還引入了一個(gè)名為「Artifacts」的新功能,擴展了大模型和用戶(hù)的交互方式,允許用戶(hù)直接將 AI 應用集成到工作流中。
021yin.com/news/claude-3-5-sonnet
?? 華為云盤(pán)古大模型 5.0 重磅發(fā)布
6 月 21 日,華為常務(wù)董事、華為云 CEO 張平安在 HDC 2024 上正式發(fā)布盤(pán)古大模型 5.0。
盤(pán)古大模型 5.0 在全系列、多模態(tài)、強思維三個(gè)方面做了全新升級。
張平安還分享了盤(pán)古大模型在 自動(dòng)駕駛、工業(yè)設計、建筑設計、具身智能、媒體生產(chǎn)和應用、高鐵、鋼鐵、氣象等領(lǐng)域的豐富創(chuàng )新應用和落地實(shí)踐,持續深入行業(yè)解難題。
例如,盤(pán)古大模型能夠讓機器人完成 10 步以上的復雜任務(wù)規劃,并且在任務(wù)執行中實(shí)現多場(chǎng)景泛化和多任務(wù)處理。
同時(shí)盤(pán)古大模型還能生成機器人需要的訓練視頻,讓機器人更快地學(xué)習各種復雜場(chǎng)景。
021yin.com/s/ZNKqkb\_N\_QNVy1CzrSW5Sg
?? Runway、Luma AI 輪番炸場(chǎng),視頻生成卷出新高度
別等 Sora 了,Runway 發(fā)布的 Gen-3 Alpha 非但不是「期貨」,而且效果驚艷網(wǎng)友,將 AI 視頻卷出新高度。
官方分享的演示視頻在質(zhì)量上有了顯著(zhù)的提升,無(wú)論是對 AI 視頻生成難以把控的夜景燈光,還是景別的流暢切換,Gen-3 Alpha 都稱(chēng)得上盡善盡美。甚至在文字生成上也看得出來(lái)下足了一番功夫。
更重要的是,據 @iamneubert 透露,Gen-3 Alpha 模型的生成速度非常之快。官方分享的演示視頻普遍徘徊在 10 秒水平線(xiàn)上,而這 10 秒視頻只需要 90 秒的時(shí)間就能快速生成。
巧合的是,在同一天,「競品」Luma AI 宣布 Dream Machine 即將帶來(lái)更強大的編輯功能和更直觀(guān)的操作體驗,這種「不期而遇」不免有點(diǎn)打擂臺的火藥味。
并且,Google 也不甘示弱,在社交平臺 X 上宣布推出新的模型技術(shù) Video-to-audio。
和 ElevenLabs 推出的 AI 音效生成功能有異曲同工之妙, Video-to-audio 支持根據視頻和文本提示詞生成和視頻匹配的音頻,甚至可以與主體角色唇形同步。
021yin.com/s/ud\_ZbZFMGu1SYSYYExPWDA
?? 快手可靈大模型新功能升級
6 月 21 日,快手可靈大模型推出了兩項全新的功能: 圖生視頻和視頻續寫(xiě)。
圖生視頻功能可以將任何靜態(tài)圖像轉化為 5 秒的動(dòng)態(tài)視頻,同時(shí)支持用戶(hù)通過(guò)添加提示詞來(lái)控制圖像的運動(dòng)。
比如,上傳經(jīng)典的蒙娜麗莎,可靈能夠讓蒙娜麗莎戴上墨鏡,并賦予她靈動(dòng)的眼神交流。
視頻續寫(xiě)功能則允許用戶(hù)對已生成的視頻進(jìn)行一鍵續寫(xiě), 每次續寫(xiě)生成約 5 秒的內容,通過(guò)連續多次續寫(xiě),能夠最長(cháng)生產(chǎn)約 3 分鐘的連貫視頻。
此次升級的一大亮點(diǎn)是集成文本控制機制于視頻續寫(xiě)中,這意味著(zhù)用戶(hù)能夠通過(guò)自定義提示詞,根據自己的創(chuàng )意繼續擴展視頻內容。
官方舉例稱(chēng),一個(gè)關(guān)于古堡的視頻片段,用戶(hù)既可以選擇讓它先「太陽(yáng)落下去,天空變暗」,繼而「太陽(yáng)升起來(lái),天空變亮」,亦或者「太陽(yáng)落下去,天空變暗,燈光漸亮」,隨后「燈光亮起,霧氣氤氳」。
021yin.com/s/SUWp0WLmoL4EFMniL3Nu7Q
?? 斯坦福 AI 視頻生成工具 Hedra 發(fā)布
AI 視頻生成一日,人間一年。
Hedra 是一款由斯坦福初創(chuàng )公司發(fā)布的 AI 視頻工具,它能夠將音頻、圖像、視頻整合進(jìn)同一工作流,并處于免費公測階段。
通過(guò)上傳人物照片和語(yǔ)音,Hedra 的 AI 技術(shù)會(huì )分析語(yǔ)音的節奏、音調和強度,生成動(dòng)態(tài)視頻,其中人物的唇形、表情和姿態(tài)都能與語(yǔ)音內容完美同步。
Hedra 支持文本和圖片生成視頻,單個(gè)視頻最長(cháng)可達 30 秒,并且每輸入 60 秒的語(yǔ)音和文本,可以生成長(cháng)達 90 秒的視頻。此外,Hedra 還計劃逐步改進(jìn)并擴展視頻尺寸和輸入形式。
不過(guò),Hedra 的審核機制過(guò)于嚴格,有時(shí)會(huì )將 AI 生成的內容錯誤地判斷為「名人」而拒絕生成。
021yin.com/
021yin.com/hedra\_labs/status/1803095713112580475
Hunt for Fun | 先知
?? 金沙江創(chuàng )投朱嘯虎:5 年后將沒(méi)有獨立大模型公司存在
6 月 21 日,金沙江創(chuàng )投合伙人朱嘯虎在「創(chuàng )投十年」高峰論壇上,聚焦 AI 行業(yè)的最新趨勢分享了一些獨到見(jiàn)解。
據投資作業(yè)本 Pro 報道,其部分觀(guān)點(diǎn)如下:
這次生成式 AI 可能又是一個(gè)非常像 PC 互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的,以十年為單位的長(cháng)周期的機會(huì )。
如果到年底還不能推出 GPT-5,我認為 OpenAI 和英偉達的股價(jià)可能都要狂跌。
如果大模型的迭代速度放緩,應用創(chuàng )新的機會(huì )就會(huì )增多。我們認為從今年開(kāi)始,在 AIGC 應用端可能會(huì )出現大量機會(huì )。
我可以斷言,五年后可能不再有獨立的大模型公司存在,要么只有 AI 應用公司或云服務(wù)公司。
今天的大模型公司很難單獨存在,因為它們沒(méi)有自己的商業(yè)模式。國內大廠(chǎng)的通義千問(wèn)價(jià)格已經(jīng)在許多創(chuàng )業(yè)型大模型公司的成本線(xiàn)以下。
我們的國產(chǎn)大模型或 Llama2 這樣的開(kāi)源模型可能相當于中專(zhuān)畢業(yè)生的水平。但經(jīng)過(guò)高質(zhì)量的垂直數據訓練后,它們的表現可能比未經(jīng)培訓的清華北大畢業(yè)生還要好。
蘋(píng)果公司兩周前發(fā)布了Apple Intelligence,重新定義了 AI, 什么叫 AI,核心不在于技術(shù),而在于用戶(hù)體驗。
021yin.com/s/p8PiMG0qGOCLFQmcVrdqbA
?? 諾獎經(jīng)濟學(xué)得主:AI 并沒(méi)有提高工作質(zhì)量,只讓富人更富有
諾貝爾經(jīng)濟學(xué)獎得主 Christopher PISSARIDES 近日在陸家嘴論壇上就 AI 話(huà)題發(fā)表觀(guān)點(diǎn)。
他指出盡管有聲音擔憂(yōu) AI 將取代人類(lèi)工作,但他相信 AI 實(shí)際上在創(chuàng )造就業(yè)機會(huì )。他提到,盡管一些雇主試圖利用AI提升效率,但 AI 更多是作為勞動(dòng)力的補充而非替代者,就業(yè)數字并未因此下降。
以醫療行業(yè)為例,AI 輔助手術(shù)仍需醫生和護士的監督。
PISSARIDE 還提到,不同國家對技術(shù)的需求不同。他認為中國需要的是更多的消費,而不是 AI 來(lái)提高生產(chǎn)力。
另外,他建議,應關(guān)注 AI 如何提升生活和工作品質(zhì),讓 AI 承擔如搬運重物等枯燥的體力勞動(dòng)。 但目前 AI 似乎更多地是在幫助富人變得更富,而非普遍助力工作。
?? Hugging Face CEO:越來(lái)越多 AI 初創(chuàng )公司創(chuàng )始人希望出售自家公司
越來(lái)越多的 AI 初創(chuàng )公司開(kāi)始尋求脫離牌桌的機會(huì )。
Hugging Face CEO Clément Delangue 近日在接受彭博社的采訪(fǎng)時(shí)透露,隨著(zhù) AI 市場(chǎng)的整合趨勢日益明顯,越來(lái)越多的 AI 初創(chuàng )公司創(chuàng )始人正尋求出售其公司。
Delangue 表示,他每周都會(huì )收到大約 10 家 AI 初創(chuàng )公司表達被收購興趣的消息。他指出, 「尤其是今年,這種增長(cháng)非常明顯?!?/p>
不過(guò),Hugging Face 也并非只是被動(dòng)等待其他公司來(lái)接洽。此前,Hugging Face 主動(dòng)與 AI 初創(chuàng )公司 Argilla 接洽合作,最終在本月宣布以 1000 萬(wàn)美元的價(jià)格收購該公司。
021yin.com/news/articles/2024-06-13/more-ai-founders-looking-to-sell-startups-hugging-face-ceo-says
?? OpenAI CTO:「博士級智能」未來(lái)幾年后出現
OpenAI CTO Mira Murati 近期因一系列言論激起了輿論的波瀾。
在母校達特茅斯工程學(xué)院的訪(fǎng)談中,Murati 提到 ChatGPT 這些 AI 系統雖然整體尚未達到人類(lèi)水平,但在特定任務(wù)中已經(jīng)媲美人類(lèi)。
像 GPT-3 這樣的系統,大概可以說(shuō)智能水平相當于一個(gè)幼兒。而像 GPT-4 這樣的系統更像是高中生的智能水平。
在未來(lái)幾年,我們期望看到針對特定任務(wù)的博士級別的智能。
對于 AI 安全問(wèn)題,她表示,智能和安全性實(shí)際上是相輔相成的。引導一個(gè)更聰明的系統更容易,只需告訴它,「好的,不要做這些事情」即可。
今天凌晨,Mira Murati 也再發(fā)長(cháng)文,舉例稱(chēng) AI 將勝任某些任務(wù)。
就像電子表格為會(huì )計師和簿記員帶來(lái)了變革,人工智能工具也能承擔起編寫(xiě)在線(xiàn)廣告或制作標準圖像和模板等工作。
然而,我們應區分短暫的創(chuàng )意任務(wù)和那些能為社會(huì )帶來(lái)長(cháng)遠意義和價(jià)值的任務(wù)。
021yin.com/miramurati/status/1804567253578662264
彩蛋時(shí)間
?? 《遁入黑暗,成為無(wú)》
作者:@ciguleva
工具:Midjourney
021yin.com/ciguleva/status/1803304837536190670