當前位置:首頁(yè) > 百科 > 正文內容

OpenAI 入局「AI搜索」后,攪起了風(fēng)雨還是水花?

惠州印刷公司2個(gè)月前 (08-03)百科21
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

近期,OpenAI 正式發(fā)布了其大模型搜索產(chǎn)品 SearchGPT。與此同時(shí),微軟 Bing 在其技術(shù)博客中宣布向小部分人群開(kāi)放全新的 AI 生成搜索功能...「AI+搜索」賽道近期涌進(jìn)多個(gè)重要玩家。

隨著(zhù)大型語(yǔ)言模型技術(shù)的興起,LLM+搜索產(chǎn)品展現出了巨大的潛力和優(yōu)勢,包括改善用戶(hù)搜索體驗、提高搜索效率等。自以 Perplexity 為代表的AI 搜索應用出現,一直有聲音在探討谷歌作為頭部搜索引擎的地位是否將被動(dòng)搖,但事實(shí)是谷歌如今仍占據絕大部分市場(chǎng)份額。有外媒評論稱(chēng),「谷歌正在走向衰亡,谷歌勢不可擋。現在感覺(jué)這兩件事都是真的。」

解讀要點(diǎn)

1.「AI 搜索賽道」近期涌進(jìn)了哪些關(guān)鍵玩家?

2. 谷歌占據的九成搜索引擎市場(chǎng)份額是否會(huì )受到影響?

3. 國內外 AI 大廠(chǎng)、創(chuàng )企都是如何做「AI + 搜索」應用的?三種不同的路線(xiàn)有哪些差異?

4. AI 搜索對比傳統搜索在技術(shù)上有何不同?

5. AI 搜索想要顛覆傳統搜索,必須邁過(guò)的關(guān)鍵坎兒有哪些?

OpenAI、Perplexity 能否撼動(dòng)谷歌占據的九成搜索引擎市場(chǎng)份額

1、據 Statcounter 4 月數據顯示,全球搜索引擎市場(chǎng),谷歌占據了 90.9%的市場(chǎng)份額,緊隨其后的是微軟的必應,僅占 3.6%。谷歌占據了搜索引擎市場(chǎng)的絕對頭部地位。與此同時(shí),「AI+搜索」賽道也打得火熱。近期,OpenAI 正式發(fā)布了自己的大模型搜索產(chǎn)品 SearchGPT;風(fēng)頭正勁的生成式 AI 搜索引擎 Perplexity 被媒體爆出新消息,其公司估值 30 億美元,軟銀將向其投資 1000 萬(wàn)至 2000 萬(wàn)美元。

2、隨著(zhù)大型語(yǔ)言模型技術(shù)的興起,LLM+搜索產(chǎn)品展現出了巨大的潛力和優(yōu)勢,包括改善用戶(hù)搜索體驗、提高搜索效率等。自以 Perplexity 為代表的AI 搜索應用出現,一直有聲音在探討谷歌作為頭部搜索引擎的地位是否將被動(dòng)搖,但事實(shí)是谷歌如今仍占據絕大部分市場(chǎng)份額。有外媒評論稱(chēng),「谷歌正在走向衰亡,谷歌勢不可擋。現在感覺(jué)這兩件事都是真的。」[9]

① 谷歌也曾嘗試「下手」AI 加持搜索引擎,在今年 5 月推出了其 AI 搜索服務(wù) AI Overview,但因其給出內容的準確性問(wèn)題受到吐槽和差評,后谷歌對其進(jìn)行了改進(jìn)以及使用限制。[10]

② 雖然谷歌的 AI Overview 效果不佳,但據谷歌母公司 Alphabet 近期公布的其二季度財報顯示,谷歌搜索和云計算業(yè)務(wù)收入飆升,收入近 850 億美元。報告稱(chēng),僅搜索業(yè)務(wù)就收入 485.09 億美元,實(shí)現了 13.80%的同比增長(cháng),占據了公司總營(yíng)收的 57.2%。單從財報表現來(lái)看,谷歌的搜索業(yè)務(wù)影響并未受到太大影響,谷歌搜索業(yè)務(wù)背后的關(guān)鍵核心收入來(lái)自其廣告業(yè)務(wù),來(lái)源自商家對精準營(yíng)銷(xiāo)和高效廣告投放的需求。[11]

3、盡管谷歌在搜索引擎市場(chǎng)占據絕對的優(yōu)勢,但「AI+搜索」賽道依舊「熱火朝天」。今年 1 月,Perplexity 表示其月活躍用戶(hù)已超過(guò) 1000 萬(wàn),僅印度就有超過(guò) 100 萬(wàn)用戶(hù)。同時(shí),其估值從今年年初的 5 億美元到現在的 30 億美元,翻了近 6 倍。此外,微軟、字節等國內外巨頭、大廠(chǎng)近期也紛紛「擠進(jìn)」「AI+搜索」賽道。

三種路線(xiàn):各家做AI+搜索的方式有哪些差異?

近期,微軟、OpenAI、字節等國內外 AI 大廠(chǎng)、創(chuàng )企均推出了「AI+搜索」的新功能、應用或有相關(guān)動(dòng)作。微軟 New Bing 發(fā)布了全新的 AI 生成搜索功能;OpenAI 推出大模型搜索產(chǎn)品 SearchGPT;字節豆包、月之暗面的 Kimi 推出了 AI 瀏覽器插件......

觀(guān)察各家發(fā)力「AI+搜索」的不同做法,大致可以分為三類(lèi):巨頭、大廠(chǎng)通常選擇在自家已有的搜索引擎上添加 AI 相關(guān)功能;獨角獸、創(chuàng )企選擇基于已有的 LLM 技術(shù),開(kāi)發(fā) AI 原生的新搜索應用;此外,還有大廠(chǎng)、創(chuàng )企另辟蹊徑,推出輕量化產(chǎn)品瀏覽器 AI 插件。

1、微軟:從 Bing 到 New Bing 的改造[12] [13]

① 早在去年 2 月,微軟便將 LLM 技術(shù)引入到了用Bing 和 Edge 搜索引擎中,基于 LLM 技術(shù),新的搜索引擎能夠處理復雜查詢(xún),提供精準的搜索結果,并進(jìn)行基本的交互對話(huà)。同時(shí),在多模態(tài)方面,微軟還引入了 OpenAI 的 Dell-E 模型,用戶(hù)可以通過(guò)視覺(jué)搜索并提出相關(guān)問(wèn)題。Bing Chat 可以理解圖像的背景,對其進(jìn)行解釋并回答相關(guān)問(wèn)題。微軟后將 Bing Chat 更名為 Microsoft Copilot。

② 上周,微軟 Bing 更新了其 AI 生成搜索功能,用戶(hù)可以輕松查找信息,同時(shí)用戶(hù)可以查看 AI 搜索結果以及瀏覽相關(guān)網(wǎng)站。據 Bing 的博客文章,對 Bing 搜索頁(yè)面的布局進(jìn)行了調整,頁(yè)面從左到右分別為:內容目錄、帶有網(wǎng)站資源鏈接的人工智能答案、傳統的搜索結果。同時(shí),在顯示初始問(wèn)題的答案的情況下,還會(huì )預測相關(guān)問(wèn)題。

③ 在技術(shù)方面,Bing 的博客文章中提到,微軟采用了將 Bing 搜索結果的基礎與大型和小型語(yǔ)言模型 (LLM 和 SLM) 的強大功能相結合的方式,讓語(yǔ)言模型理解搜索查詢(xún),審查數百萬(wàn)個(gè)信息源,動(dòng)態(tài)匹配內容,并以新的 AI 生成布局生成搜索結果,以更有效地滿(mǎn)足用戶(hù)查詢(xún)的意圖。

2、谷歌:基于Gemini 模型推出 AI 搜索服務(wù)[14] [15]

① 今年 5 月,谷歌推出了 AI 搜索服務(wù) AI Overview,允許用戶(hù)通過(guò)簡(jiǎn)化語(yǔ)言或更詳細地調整搜索結果概述。根據谷歌的博客文章介紹,AI Overview 功能背后是基于專(zhuān)為 Google 搜索定制的 Gemini 模型,利用 Gemini 模型的多步推理能力,AI 搜索實(shí)現處理復雜的多步查詢(xún)。除了解決復雜多步問(wèn)題外,谷歌提到 AI Overview 的另一優(yōu)勢是規劃功能,幫助用戶(hù)制定計劃。

② 在技術(shù)方面,據谷歌的 SGE 文檔,AI Overview 通過(guò)使用定制的 Gemini 模型,與谷歌現有的搜索系統協(xié)同工作,包括質(zhì)量和排名系統以及 Google 知識圖譜。AI Overview 旨在執行傳統的「搜索」任務(wù),比如從索引中識別相關(guān)且高質(zhì)量的結果來(lái)證實(shí)概述中呈現的信息。同時(shí),為了保證 AI Overview 的高質(zhì)量,谷歌將其核心網(wǎng)絡(luò )排名系統也整合進(jìn)來(lái),因此,AI Overview 僅呈現由排位靠前且質(zhì)量高的網(wǎng)絡(luò )結果信息。

③ 盡管,谷歌在 SGE 文檔中詳細地介紹了其團隊在質(zhì)量、安全方面所做的措施和相關(guān)工作,但 AI Overview 呈現的內容仍被網(wǎng)友吐槽存在錯誤、過(guò)于離譜。

3、OpenAI:推出全新搜索產(chǎn)品 SearchGPT

① OpenAI 近期對外展示了其大模型搜索產(chǎn)品 SearchGPT 的演示 demo,但目前僅向一小部分用戶(hù)和發(fā)布者提供試用。據官方展示的 demo,SearchGPT 可以迅速且直接地用網(wǎng)絡(luò )上的最新信息回答用戶(hù)的問(wèn)題,同時(shí)提供相關(guān)來(lái)源的清晰鏈接。同時(shí),還展示了一項名為「視覺(jué)答案」的功能。

② 技術(shù)方面,OpenAI 并未對外透露 SearchGPT 背后詳細的技術(shù)與工作原理。OpenAI 的發(fā)言人 Kayla Wood 對媒體 The Verge 表示,SearchGPT 服務(wù)由 GPT-4 系列模型提供支持,最終將搜索功能直接集成到 ChatGPT 中。此外,OpenAI 表示,SearchGPT 是搜索,與訓練 OpenAI 生成式 AI 基礎模型是分開(kāi)的。即使網(wǎng)站選擇退出生成式 AI 訓練,其也可以出現在搜索結果中。

③ 關(guān)于技術(shù)和背后實(shí)現的細節,媒體、業(yè)內人士有許多相關(guān)的推測。外媒 wired 認為,OpenAI 的 SearchGPT 可能會(huì )使用一種生成 AI 的方法,即檢索增強生成,旨在降低聊天機器人回答中的幻覺(jué)率。通過(guò) RAG 方法,AI 工具在生成輸出并鏈接回數據來(lái)源時(shí)會(huì )引用可信信息;寶玉推測,「OpenAI 即將推出的 SearchGPT 仍會(huì )依賴(lài) Bing 索引,但它也會(huì )使用自己的爬蟲(chóng)實(shí)時(shí)獲取數據。SearchGPT 背后應該是一個(gè)多模態(tài)的模型,支持圖片的識別,用戶(hù)可以上傳圖片進(jìn)行搜索或者問(wèn)答。」[17]

④ 此外,早在去年 9 月,OpenAI 也發(fā)布了一項名為「Browse with Bing」的類(lèi)似功能,讓 ChatGPT 能夠瀏覽互聯(lián)網(wǎng)內容。

4、Perplexity:從產(chǎn)品出發(fā),基于開(kāi)源大模型推出生成式 AI 搜索引擎

① Perplexity 是一個(gè)生成式 AI 搜索引擎,旨在改進(jìn)傳統的搜索體驗。Perplexity AI 的 CEO Aravind Srinivas 在一次訪(fǎng)談中表示,Perplexity 最適合被描述為「答案引擎」,用戶(hù)提出一個(gè)問(wèn)題,它會(huì )給出一個(gè)答案,但與其他引擎有所不同的是,所有答案都有來(lái)源支持。這就像寫(xiě)學(xué)術(shù)論文一樣,引用部分即來(lái)源部分,就是搜索引擎的作用所在。[18]

② Perplexity 因其獨特的產(chǎn)品定位和設計獲得了大部分知識工作者的心智,但 Perplexity 也被質(zhì)疑過(guò)是「套殼應用」,即沒(méi)有自研的基礎模型,依賴(lài)于市面上主流的諸如 GPT、Gemini、Claude 等模型。Perplexity CEO 表示,Perplexity AI 的思路是先做產(chǎn)品,后做模型。

③ Perplexity 是基于 Mistral-7B 模型進(jìn)行了微調,其 CEO 曾解釋其背后的工作原理:其 Perplexity 系統結合傳統搜索,提取與用戶(hù)查詢(xún)相關(guān)的結果,讀取這些鏈接中的相關(guān)段落,并將其輸入大語(yǔ)言模型(LLM)。然后,LLM 會(huì )根據這些段落和查詢(xún)生成一個(gè)格式良好的答案,并附上適當的腳注。LLM 在這其中的任務(wù)是在給定一堆鏈接和段落的情況下,為用戶(hù)寫(xiě)一個(gè)簡(jiǎn)明的答案,并附上適當的引用。[19] [18]

④ 與 Perplexity 較為相似的,還有賈揚清團隊在今年年初開(kāi)源的項目 Lepton Search,使用了 MistralAI 開(kāi)源的 Mixtral-8x7b 作為支撐模型,運行在 LeptonAI 的 playground 托管平臺上,吞吐量高達 200 tokens / 秒。Lepton Search 搜索引擎使用了必應搜索 API,Lepton KV 作為無(wú)服務(wù)器存儲。賈揚清在推特中曾表示,相比于 Perplexity,Lepton AI 更側重讓創(chuàng )作者更輕松構建 AI 應用程序的現代云解決方案。[20]

5、月之暗面、字節跳動(dòng)等:基于自研的大模型技術(shù)推出瀏覽器插件

① 月之暗面推出的 Kimi 瀏覽器插件,包含「點(diǎn)問(wèn)筆 」和「總結器 」兩項功能。插件的「點(diǎn)問(wèn)筆 」功能允許用戶(hù)通過(guò)框選網(wǎng)頁(yè)上的文字,自動(dòng)觸發(fā)上下文理解,提供文字的解釋和相關(guān)信息。「總結器 」功能能夠對長(cháng)篇文章進(jìn)行全文總結,提煉關(guān)鍵信息,幫助用戶(hù)迅速把握文章主旨,節省閱讀時(shí)間。同時(shí),Kimi 插件繼承了智能助手的長(cháng)文本處理能力,能夠處理大量文本數據。[21]

② 字節跳動(dòng)的 AI 助手豆包推出的瀏覽器插件版本,則提供一鍵總結網(wǎng)頁(yè)與視頻、寫(xiě)作和文本修改等功能。

③ 除了基于自有大模型的瀏覽器插件外,還包括「套殼」的,例如 AI 瀏覽器插件 Monica,基于 GPT-4o、Claude 3.5 等大模型,支持 Google、Bing 等搜索引擎。同樣,大部分 AI 瀏覽器插件都包含類(lèi)似搜索、寫(xiě)作、總結、翻譯等功能。

④ 值得關(guān)注的是,賈揚清的 Lepton AI 團隊近期推出了一款名為 Elmo 的 Chrome 插件,支持端側模型,即使在斷網(wǎng)情況下也能使用。Elmo 插件內置了名為 Gemini nano 的本地模型,大小僅為 12MB,使得插件在本地即可完成復雜的文本處理任務(wù),無(wú)需依賴(lài)網(wǎng)絡(luò )服務(wù)。Elmo 插件同樣具備多種功能,包括快速生成文本總結、摘要,精讀學(xué)術(shù)論文,劃線(xiàn)提問(wèn),以及對網(wǎng)頁(yè)內容進(jìn)行索引和對照查看。[29]

AI 搜索想要顛覆傳統搜索,必須邁過(guò)的關(guān)鍵坎兒有哪些?

訂閱機器之心Pro會(huì )員通訊??,查看完整解讀

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全