吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)被譽(yù)為“中國智能科學(xué)技術(shù)最高獎(jiǎng)”,獎(jiǎng)勵(lì)在智能科學(xué)技術(shù)領(lǐng)域取得重大突破、作出卓越貢獻(xiàn)的科技工作者以及具有重大意義的高校和企業(yè)項(xiàng)目,是我國人工智能領(lǐng)域的最高技術(shù)榮譽(yù)。這是京東集團(tuán)繼2021年“商品智能匹配關(guān)鍵技術(shù)及在營銷中的應(yīng)用”和2022年“任務(wù)型智能對(duì)話交互關(guān)鍵技術(shù)及大規(guī)模產(chǎn)業(yè)應(yīng)用”之后的又一次獲獎(jiǎng),再次展現(xiàn)了京東在AI技術(shù)研發(fā)與產(chǎn)業(yè)應(yīng)用領(lǐng)域的持續(xù)領(lǐng)先性。
多模態(tài)交互式數(shù)字人技術(shù)集語音、語義、形象等多模態(tài)技術(shù)于一體,存在諸多的技術(shù)挑戰(zhàn),一直是國內(nèi)外研究的前沿技術(shù)領(lǐng)域。在本次獲獎(jiǎng)項(xiàng)目中,京東科技人工智能團(tuán)隊(duì)在以下三方面實(shí)現(xiàn)了技術(shù)突破:提出了低成本、高保真人體建模技術(shù),解決了人體建模成本高、觀感差難題;提出了語義一致多模態(tài)應(yīng)答技術(shù),解決了多模態(tài)語義難對(duì)齊、應(yīng)答弱難題;提出了多模態(tài)自然化行為生成技術(shù),解決了多樣化行為難協(xié)調(diào)、交互假難題。
京東多模態(tài)交互式數(shù)字人能力持續(xù)位居國際領(lǐng)先水平,并在2024年率先開啟行業(yè)最大規(guī)模的商業(yè)化應(yīng)用,截至目前,已服務(wù)9000+商家,累計(jì)為商家?guī)礓N售增量超140億。2024年4月,采銷東哥AI數(shù)字人實(shí)現(xiàn)了高逼真、高可靠、極低幻覺率的新水平。2024年京東618期間,包括格力總裁董明珠、潔麗雅總經(jīng)理“毛巾少爺”石展承、名創(chuàng)優(yōu)品CEO葉國富等21位總裁數(shù)字人空降京東直播間,與數(shù)千家品牌商,共同創(chuàng)造了史上一日并行規(guī)模最大的數(shù)字人直播事件。在京東11.11、年貨節(jié)等場(chǎng)景,數(shù)字人與個(gè)護(hù)美妝、家電家居、母嬰寵物等品牌產(chǎn)生化學(xué)反應(yīng),持續(xù)帶來千人千面的直播交互體驗(yàn)。
500)this.width=500 align=center hspace=10 vspace=10 alt=京東斬獲中國AI最高獎(jiǎng)項(xiàng)的唯一特等獎(jiǎng),數(shù)字人技術(shù)突破成本與效能邊界>
500)this.width=500 align=center hspace=10 vspace=10 alt=京東斬獲中國AI最高獎(jiǎng)項(xiàng)的唯一特等獎(jiǎng),數(shù)字人技術(shù)突破成本與效能邊界
近期,京東言犀數(shù)字人技術(shù)再度進(jìn)化。京東科技人工智能團(tuán)隊(duì)打造的數(shù)字人通用的基座大模型,通過語音合成大模型LiveTTS及通用數(shù)字人大模型LiveHuman,僅需輸入自然語言或1秒視頻/照片,即可生成4K超高清、100%口型匹配的數(shù)字人,徹底告別數(shù)字人制作對(duì)線下拍攝、建模與耗時(shí)訓(xùn)練的依賴。
LiveTTS語音合成基座模型:基于20萬小時(shí)數(shù)據(jù)訓(xùn)練的擴(kuò)散模型,實(shí)現(xiàn)“零樣本”聲音合成與多語種情感化輸出,音色相似度較其它頭部廠商高出1.3倍、字符錯(cuò)誤率(CER)降低最高5.12%;
LiveHuman數(shù)字人基座模型:創(chuàng)新性的人體過渡幀生成技術(shù),解決多片段銜接卡頓難題,在遮擋、大角度、動(dòng)態(tài)背景、多人直播等極端條件下仍有流暢表現(xiàn)。
這一系列突破將單個(gè)數(shù)字人生產(chǎn)成本從數(shù)萬元拉低至兩位數(shù),較線%,標(biāo)志九游娛樂文化 九游app官方入口著數(shù)字人從“專業(yè)工具”正式成為“普惠生產(chǎn)力”。這將為廣告素材批量生成、新媒體投放、個(gè)人IP打造等場(chǎng)景應(yīng)用拆掉技術(shù)藩籬,走向工業(yè)級(jí)應(yīng)用。
作為一家兼具實(shí)體企業(yè)基因和屬性、先進(jìn)數(shù)字技術(shù)和能力的新型實(shí)體企業(yè),京東20多年來持續(xù)深耕供應(yīng)鏈,用人工智能等數(shù)智化技術(shù)全面連接和優(yōu)化社會(huì)生產(chǎn)、流通、消費(fèi)、服務(wù)等各個(gè)環(huán)節(jié)。從零售效率提升到產(chǎn)業(yè)生態(tài)構(gòu)建,京東始終踐行“以實(shí)助實(shí)”的路徑。截至2024年底,京東體系在基礎(chǔ)科學(xué)和技術(shù)研發(fā)上已累計(jì)投入近1400億元,先后推動(dòng)大語言模型、語音識(shí)別及合成、數(shù)字人等一系列人工智能共性關(guān)鍵技術(shù)建設(shè),并廣泛應(yīng)用于零售、物流、工業(yè)、健康、政務(wù)等產(chǎn)業(yè)場(chǎng)景,助力千行百業(yè)實(shí)數(shù)融合,實(shí)現(xiàn)高質(zhì)量發(fā)展。