<tr id="b1kyw"></tr>

<style id="b1kyw"></style>

當前位置：首頁(yè) > 設計 > 正文內容

騰訊云智能打造AI+數智人生產(chǎn)工廠(chǎng)，3分鐘樣本訓練即可定制數字分身

大連廣告公司1年前 (2023-06-03)設計26

印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà)：138-1621-1622（微信同號）

“大家好，我是劉興亮，這是我的首個(gè)數智人分身?！?/p>

4月25日，在騰訊云智能“數智人媒體溝通會(huì )”上，數字經(jīng)濟學(xué)者劉興亮現場(chǎng)展示了他的專(zhuān)屬“數智人”，以及由這個(gè)“數智分身”輸出的短視頻“亮三點(diǎn)”。劉興亮分享稱(chēng)：“這個(gè)形象近似真人，表情、唇型匹配自然，包括我的特色口音也模擬得惟妙惟俏的數智人，正是騰訊云智能小樣本數智人。未來(lái)，不需要搭建拍攝場(chǎng)地，也不用提前化妝彩排，不受空間、時(shí)間限制，數智人可以隨時(shí)隨地幫我生成口播視頻，解放我的生產(chǎn)力?！?/p>

（圖：數字經(jīng)濟學(xué)者劉興亮用小樣本數智人生產(chǎn)視頻）

越來(lái)越多的數字人走入各行各業(yè)，投入實(shí)際應用，但高昂的制作和運營(yíng)成本讓不少企業(yè)望而卻步。如何讓數字人從大企業(yè)走向小商戶(hù)，成為小微企業(yè)經(jīng)營(yíng)的“可選項”，甚至成為個(gè)人創(chuàng )作者的創(chuàng )作工具？過(guò)往復雜的訓練樣本數據采集，導致數字人定制過(guò)程長(cháng)、成本高，一定程度上限制了數字人的快速應用落地。

溝通會(huì )上，騰訊云智能小樣本數智人生產(chǎn)平臺首次對外發(fā)布，平臺具有訓練樣本小、生產(chǎn)效率高、自動(dòng)化生產(chǎn)等特性，可以輕松實(shí)現“自助式”數智人生產(chǎn)制作。依托騰訊自研AI能力和技術(shù)經(jīng)驗，只需要3分鐘真人口播視頻、100句語(yǔ)音素材，平臺便可通過(guò)音頻、文本多模態(tài)數據輸入，實(shí)時(shí)建模并生成高清人像，在24小時(shí)內制作出與真人近似的“數智人”。千元級別的成本，小時(shí)級的制作時(shí)長(cháng)，大幅降低數字人使用門(mén)檻，騰訊云智能小樣本數智人為短視頻創(chuàng )作、知識分享、帶貨直播等場(chǎng)景應用提供了更多可能性。

騰訊云智能數智人產(chǎn)品總經(jīng)理陳磊表示，騰訊云智能正致力打造自動(dòng)化的“AI+數智人工廠(chǎng)”，以“產(chǎn)、銷(xiāo)、服”一站式平臺，實(shí)現“自助式”購買(mǎi)、生產(chǎn)和應用數智人。通過(guò)開(kāi)箱即用的數智人服務(wù)，騰訊云智能還將廣泛開(kāi)展生態(tài)被集成合作，攜手合作伙伴將更逼真、更智慧、更高效的數智人應用落地千行百業(yè)。

自研小樣本數智人驅動(dòng)技術(shù)框架，24小時(shí)實(shí)現數字分身復刻

騰訊云智能依托自研小樣本數智人驅動(dòng)前沿技術(shù)框架，以及基于自監督機制的通用多模態(tài)模型，讓用戶(hù)實(shí)現提交少數樣本數據進(jìn)行AI訓練，例如3分鐘真人口播視頻、100句語(yǔ)音素材，即可獲得與真人形象、語(yǔ)音近似的數智人，生產(chǎn)周期縮短至天級別。千元級的價(jià)格，自助式的服務(wù)，讓數智人成為“用得起”的數字化服務(wù)。

陳磊表示，小樣本數智人支持半身、全身形象展示，手勢動(dòng)作會(huì )根據內容靈活調整，也支持錄制背景任意更換，適用于直播帶貨等更廣泛的商用場(chǎng)景。相較于2D真人精品數字人，小樣本數智人無(wú)需專(zhuān)業(yè)影棚錄制素材，成本更低；相較于照片生成、僅能呈現面部形態(tài)的數字人，小樣本數智人可根據文本設計手勢，唇動(dòng)、口型、表情復現真人風(fēng)格。

（小樣本數智人形象、音色接近真人，支持半身、全身形象展示，適用于更廣泛的商用場(chǎng)景）

以知識分享口播視頻生產(chǎn)為例，小樣本數智人可以代醫生、律師等專(zhuān)業(yè)人士出鏡，大大節省視頻錄制時(shí)間。在溝通會(huì )現場(chǎng)，浙江樹(shù)蘭醫院盛國平博士展示如何用“數字分身”輸出醫學(xué)知識科普視頻，在忙碌工作中緩解視頻錄制壓力。按日更計算，如果以“妝發(fā)+調試+錄制”平均兩小時(shí)/期來(lái)算，一周就可以省下14個(gè)小時(shí)，一年可節省近800-900小時(shí)，相當于省下30-40天的制作時(shí)間。

打造數智人aPaaS平臺提供“產(chǎn)、銷(xiāo)、服”一體化服務(wù)

為了加速數智人服務(wù)普及，騰訊云智能還提出自動(dòng)化“AI+數智人工廠(chǎng)”的方向。開(kāi)箱即用的數智人生產(chǎn)服務(wù)，依托騰訊云TI平臺，內置超過(guò)10項AI算法能力。未來(lái)，無(wú)需任何算法、研發(fā)經(jīng)驗，只要在平臺導入視頻、語(yǔ)音訓練素材，即可通過(guò)“自助式”服務(wù)，完成大批量數智人形象、音色定制。

針對數智人運營(yíng)，騰訊云智能提供播報數智人平臺、交互數智人平臺服務(wù)。播報數智人平臺支持通過(guò)文字、語(yǔ)音輸入快速生成數智人視頻；交互數智人平臺可打造“超長(cháng)待機”的數智員工，可定制專(zhuān)屬問(wèn)答庫，提供7*24小時(shí)人機雙向交互服務(wù)。同時(shí)，也可實(shí)現數智人直播服務(wù)，直播間7*24小時(shí)不斷檔，自由切換真人語(yǔ)音接管，與用戶(hù)問(wèn)答互動(dòng)。

陳磊表示，騰訊云智能專(zhuān)注做厚aPaaS數智人平臺，以API接口形式向合作伙伴開(kāi)放“產(chǎn)、銷(xiāo)、服”一體化服務(wù)，支持合作伙伴開(kāi)發(fā)更多適用于垂直行業(yè)、垂直場(chǎng)景的數智人SaaS服務(wù)。目前，已經(jīng)有數十家合作伙伴依托平臺，向行業(yè)提供數智人直播SaaS、知識口播SaaS應用，覆蓋醫療、傳媒、金融多個(gè)行業(yè)。

作為騰訊云智能的生態(tài)集成伙伴，醫微訊創(chuàng )始人、CEO潘耿表示，騰訊云智能數智人生產(chǎn)及運營(yíng)能力的開(kāi)放，助力我們?yōu)榭蛻?hù)打造了適用于醫療行業(yè)的數字人服務(wù)。微媒數字會(huì )議CEO天狐表示，微媒將全力和云智能共創(chuàng )數字分身解決方案，形成可持續發(fā)展的品牌營(yíng)銷(xiāo)生態(tài)，為企業(yè)與個(gè)人進(jìn)行IP打造。

“皺紋級”形象還原，“音素級”音色復刻

騰訊自2018年開(kāi)始投入數智人研發(fā)和服務(wù)，是國內最早投入數字人領(lǐng)域的企業(yè)之一，已發(fā)布數百篇相關(guān)技術(shù)頂會(huì )、期刊論文、專(zhuān)利近百份。

在技術(shù)解讀分享中，騰訊優(yōu)圖實(shí)驗室研究總監汪鋮杰表示，2D小樣本技術(shù)的背后是3D技術(shù)?！靶颖緮抵侨藦闹庇^(guān)上感受是2D視頻，背后其實(shí)是3D人像在做支撐。從‘文本/音頻’信息到‘3D人像驅動(dòng)’再到‘2D人像視頻’的模式，通3D人臉結構的先驗信息引入，使數智人口型、表情更到位，讓小樣本數智人形象實(shí)現‘皺紋級’還原?！?/p>

另一方面，“?。颖荆?的背后是"大”?；谧员O督機制的通用多模態(tài)模型經(jīng)過(guò)大規模數據訓練，可以將語(yǔ)音、文本與人像的表情、口型進(jìn)行關(guān)聯(lián)?！?分鐘”的訓練視頻正是基于這個(gè)模型，學(xué)習每個(gè)人個(gè)性化的發(fā)音和口型特征。

汪鋮杰表示，雖然小樣本數智人使用門(mén)檻、成本都大幅降低，但他們希望能“用跑車(chē)的性能，服務(wù)家用轎車(chē)的用戶(hù)”，通過(guò)綜合運用多項視覺(jué)AI技術(shù)，提升小樣本數智人品質(zhì)，其中就包括高精度人像分割、光照優(yōu)化、人像美化、視線(xiàn)矯正等。他舉例稱(chēng)，當錄制視頻出現較暗、較朦等情況，小樣本數智人可以通過(guò)光照優(yōu)化技術(shù)進(jìn)行亮度提升，也能通過(guò)高精度的人像美化提升皮膚質(zhì)感。

在聲音復刻方面，基于騰訊自研的新一代小樣本音色定制技術(shù)，依托深度學(xué)習的聲學(xué)模型及神經(jīng)網(wǎng)絡(luò )聲碼器，小樣本數智人改善了傳統聲學(xué)模型語(yǔ)音韻律單一，語(yǔ)調平淡的問(wèn)題，讓語(yǔ)音合成更加精細化。例如，一段文字中哪里該讀重音、哪里情緒有變化等因素，都會(huì )經(jīng)由AI訓練識別，復現個(gè)人音色以及表達風(fēng)格，最終實(shí)現接近本人的自然表達。

此外，通過(guò)構建大規模高質(zhì)量音色數據的預訓練基底模型，未來(lái)小樣本數智人還將支持用戶(hù)只錄制普通話(huà)，即可合成英文及方言語(yǔ)音。

目前，騰訊云智能數智人已經(jīng)覆蓋3D寫(xiě)實(shí)、3D半寫(xiě)實(shí)、3D卡通、2D真人、2D卡通五種形象風(fēng)格，可實(shí)現超細微面部情感表情以及數百種肢體動(dòng)作，支持形象資產(chǎn)管理、業(yè)務(wù)服務(wù)配置及內容生產(chǎn)相關(guān)服務(wù)，以滿(mǎn)足不同場(chǎng)景下的服務(wù)需求。作為數智員工，騰訊云智能數智人已成功“入職”傳媒、金融、出行、文旅、政務(wù)等多個(gè)行業(yè)，依托新一代的多模態(tài)人機交互系統，同時(shí)連接騰訊豐富的內容和服務(wù)生態(tài)，實(shí)現從“數字人”智能升級到“數智人”。

未來(lái)，面向數智人應用，騰訊云智能將不斷通過(guò)CV、TTS、NLP、ASR等多項自研AI技術(shù)，推動(dòng)數智人服務(wù)更廣泛落地，以“普惠化”服務(wù)走入千行百業(yè)。

021yin.com

☆收藏0

返回列表

上一篇：一圖讀懂︱六大精彩看點(diǎn)！帶你走進(jìn)全國首個(gè)人類(lèi)膽石博物館4.0版

下一篇：設計周觀(guān)察|設計賦能下的城市治理樣本與民生幸福標桿

發(fā)表評論

中文字幕在线永久91_国产一级AV不卡毛片_亚洲日本中文字幕在线四区_日韩黄片在线大全

<meter id="pcxnw"><optgroup id="pcxnw"></optgroup></meter>

<strong id="pcxnw"><dl id="pcxnw"></dl></strong>

<legend id="pcxnw"><form id="pcxnw"><progress id="pcxnw"></progress></form></legend>

<pre id="pcxnw"></pre>

<tbody id="pcxnw"><dl id="pcxnw"><progress id="pcxnw"></progress></dl></tbody>