數據就緒:生成式AI發(fā)揮作用的關(guān)鍵前提
隨著(zhù)生成式人工智能(Generative AI)的興起,企業(yè)正站在全新的技術(shù)前沿。AI不僅改變了我們處理數據的方式,也為業(yè)務(wù)創(chuàng )新提供了無(wú)限可能。但在擁抱未來(lái)之前,我們首先需要回答一個(gè)關(guān)鍵問(wèn)題:我的數據準備好了嗎?
數據準備是解鎖AI潛力的鑰匙,但也是堵點(diǎn)所在,有近一半(47%)的CXO將其定義為企業(yè)應用生成式AI的最大障礙。隨著(zhù)AI技術(shù)的飛速發(fā)展,對數據量和種類(lèi)的需求正在發(fā)生變化。在這條日趨復雜的數據準備之路上,我們需要找到正確的方向,以在這場(chǎng)數據革命中取得領(lǐng)先。
根據埃森哲1000多個(gè)生成式AI的項目經(jīng)驗,我們識別出生成式AI時(shí)代企業(yè)必需掌握的六大關(guān)鍵事項。
01、專(zhuān)有數據奠定企業(yè)競爭優(yōu)勢
公司內部生成的專(zhuān)有數據(如客戶(hù)信息、產(chǎn)品細節、運營(yíng)流程)是企業(yè)競爭優(yōu)勢的核心。這些數據不同于公開(kāi)數據集,能提供獨特視角和深入洞察。
盡管現有的預訓練模型功能強大,但它們通常缺少具體企業(yè)的內部信息,導致在特定企業(yè)場(chǎng)景應用時(shí),準確率僅約30%。埃森哲與各大企業(yè)合作,將專(zhuān)有數據整合進(jìn)大語(yǔ)言模型中,可使模型性能和效率提升高達85%。
通過(guò)整合歷史數據和實(shí)時(shí)信息,企業(yè)能夠基于更豐富、更精準的知識資源優(yōu)化決策流程,降低風(fēng)險,識別效率提升點(diǎn),并探索新的收入機會(huì ),創(chuàng )造額外經(jīng)濟價(jià)值。
關(guān)鍵考慮因素
價(jià)值導向的數據資產(chǎn)管理。數據資產(chǎn)管理已不再是企業(yè)的純支出,而是對于一種全新生產(chǎn)資料的開(kāi)發(fā)和維護。企業(yè)需要像開(kāi)發(fā)產(chǎn)品那樣,采取積極措施保證數據質(zhì)量(如準確性與相關(guān)性),確保其能有效支撐關(guān)鍵的投資決策;通過(guò)投資于數據的收集、清洗、分析及應用等過(guò)程來(lái)增值。
多元化數據源的整合與利用。企業(yè)應當識別在不同業(yè)務(wù)流程階段生成的獨特數據,無(wú)論它們是源自于自身、合作伙伴還是其他第三方機構。在對其進(jìn)行區分、篩選的基礎上,這些多維度的數據來(lái)源將共同構建一個(gè)全面而立體的信息網(wǎng)絡(luò ),為企業(yè)帶來(lái)更廣闊的戰略視野和更深入的市場(chǎng)洞察。
02、非結構化數據蘊藏巨大潛力
非結構化數據包括文本、圖像、音頻和視頻等多種形式,通常包含豐富的上下文信息。盡管這些數據不容易被傳統的數據庫處理,但它們卻蘊含著(zhù)大量關(guān)于用戶(hù)行為、情感和環(huán)境的細節。
生成式AI特別擅長(cháng)處理這類(lèi)數據,能夠將其轉化為對業(yè)務(wù)有實(shí)際價(jià)值的洞察和應用。例如,它可以將一個(gè)教學(xué)視頻轉換成產(chǎn)品功能列表,總結電話(huà)會(huì )議的內容,或者生成營(yíng)銷(xiāo)文案。
當非結構化數據與結構化數據(如表格、數字等)結合使用時(shí),可以提供更加人性化和情境化的溝通體驗。非結構化數據中的語(yǔ)調、個(gè)性、外觀(guān)和感覺(jué)等信號,能豐富人機交互的層次,使交流更加自然和深入。
關(guān)鍵考慮因素
數據可訪(fǎng)問(wèn)性。企業(yè)可以通過(guò)擴展數據架構、加強安全性并完善治理策略,使其更易于訪(fǎng)問(wèn)和使用。
03、合成數據填補數據空白
AI的系統性能和準確度往往取決于其訓練數據的數量和多樣性。隨著(zhù)任務(wù)的復雜度增加,對數據量的要求也隨之上升。合成數據能解決現實(shí)世界中數據不足的問(wèn)題,又避免了直接使用大規模真實(shí)數據所帶來(lái)的高成本和潛在的法律、商業(yè)、道德等風(fēng)險。
合成數據還可以用于風(fēng)險管理,設計假設情景,以及消除模型中的偏見(jiàn)。這對于確保AI系統公平性和可靠性至關(guān)重要。此外,它還能在不侵犯隱私的情況下訓練AI模型,避免了真實(shí)數據可能帶來(lái)的隱私泄露風(fēng)險。
關(guān)鍵考慮因素
成本效益。生成式AI本身就能用于創(chuàng )造合成數據,通過(guò)使用大語(yǔ)言模型(LLM)來(lái)生成小模型所需的訓練數據,是一種成本效益高、不影響準確性的方法。
04、生成式AI解鎖數據新關(guān)聯(lián)
許多數據都被困在信息孤島和各自的功能領(lǐng)域中,這限制了其潛力的發(fā)揮和跨部門(mén)協(xié)作。生成式AI通過(guò)促進(jìn)跨功能數據的使用,使企業(yè)能夠重新設計貫穿各個(gè)部門(mén)和價(jià)值鏈的端到端業(yè)務(wù)流程,從而打破壁壘。
生成式AI的一個(gè)重要功能是在正確的時(shí)間將正確的信息呈現給正確的用戶(hù)。試想一下,如果客戶(hù)服務(wù)部門(mén)能夠“看到”產(chǎn)品研發(fā)部門(mén)提供的精確規格的必要更新,或者營(yíng)銷(xiāo)部門(mén)能夠立即了解到供應鏈能否跟上他們的促銷(xiāo)活動(dòng),工作將會(huì )變得更為高效和順暢。
案例
過(guò)去,寶馬銷(xiāo)售人員必須查閱實(shí)物手冊才能了解可能的汽車(chē)配置,但在埃森哲所開(kāi)發(fā)的新一代人工智能平臺EKHO的幫助下,這一過(guò)程只需要幾分鐘就能完成。EKHO還適用于客戶(hù)的各項業(yè)務(wù),比如在制造環(huán)節,它可以通過(guò)回答庫存和物流問(wèn)題來(lái)優(yōu)化供應鏈流程。它甚至能夠通過(guò)從過(guò)去的場(chǎng)景中學(xué)習來(lái)解決全新的挑戰。目前,這一平臺已幫助寶馬在北美市場(chǎng)將效率提升了30%至40%。
05、生成式AI加速數據風(fēng)險
大多數新機遇都伴隨著(zhù)新風(fēng)險,生成式AI也不例外,它帶來(lái)了一系列與數據治理和安全相關(guān)的挑戰。企業(yè)必須識別并應對以下常見(jiàn)的盲點(diǎn),以減輕這些風(fēng)險:
新型數據類(lèi)型:企業(yè)通常使用適用于結構化數據的處理流程,但生成式AI帶來(lái)了新的數據類(lèi)型和更動(dòng)態(tài)的數據流,這增加了數據的脆弱性。
更廣泛的數據訪(fǎng)問(wèn):生成式AI使數據和AI工具更易獲取,但缺乏防止人為錯誤的安全措施。培訓和建立集體責任文化的重要性日益凸顯。
攻擊增多:生成式AI帶來(lái)了新型攻擊,包括制造深度偽造(Deep Fakes)、數據投毒(Data Poisoning),甚至使匿名數據更容易被識別。
保持數據質(zhì)量:在生成式AI背景下,數據質(zhì)量不是一次性任務(wù),而是持續性的要求。持續的數據質(zhì)量控制和血緣追蹤對于確保模型的可擴展性和準確性至關(guān)重要。
關(guān)鍵考慮因素
公眾信任。透明、公開(kāi)地承諾采取強有力的治理和安全措施,將為企業(yè)贏(yíng)得信任并提升品牌價(jià)值。
有效溝通。通過(guò)良好的溝通策略、員工培訓以及新興的隱私保護技術(shù),企業(yè)能夠增強抵御潛在威脅的能力,同時(shí)贏(yíng)得利益相關(guān)者的信心。
06、生成式AI與數據雙向賦能
數據服務(wù)于生成式AI,同時(shí)生成式AI又將反哺數據。當將生成式AI應用到現有的數據處理流程中時(shí),它可以改善整條數據供應鏈,提升數據價(jià)值。
生成式AI可以為企業(yè)總結和分類(lèi)業(yè)務(wù)數據需求,自動(dòng)生成設計文檔、測試案例和數據,并生成運行手冊和部署腳本。它還可以用來(lái)幫助用戶(hù)查找、理解并使用數據。
生成式AI不僅僅是一種工具,也是一種推動(dòng)企業(yè)擁抱現代技術(shù)棧的戰略資源。例如,它支持在遷移和迭代之前對現有系統進(jìn)行逆向工程,分析其結構和功能,以便于更好地規劃升級路徑,避免可能的兼容性問(wèn)題和數據丟失。
關(guān)鍵考慮因素
投資于數據知識庫的維護。在整個(gè)數據供應鏈中廣泛應用生成式AI,企業(yè)需要投資維護有關(guān)數據(元數據、描述、服務(wù)票證等)的數據知識庫。
數據治理更新和質(zhì)量控制。在數據生命周期轉型的過(guò)程中,數據治理和質(zhì)量等流程也需要更新以跟上步伐,從而支持AI技術(shù)的集成和擴展。
正如我們所探討的,數據不僅僅是數字和事實(shí)的集合,它是生成式AI時(shí)代的金礦。從數據準備度的提升,到數據成熟度的持續發(fā)展,每一步都是向數據驅動(dòng)未來(lái)邁進(jìn)的關(guān)鍵。