百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強和語音識別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號處理學(xué)科和語音識別學(xué)科的各種先驗假設(shè),消除學(xué)科間壁壘,直接端到端進行一體化建模。相較于傳統(tǒng)基于數(shù)字信號處理的麥克陣列算法,錯誤率降低超過30%。
據(jù)悉,這項技術(shù)無需任何數(shù)字信號處理和語音識別學(xué)科的先驗假設(shè),復(fù)數(shù)CNN網(wǎng)絡(luò)內(nèi)存占用少于200K,可以內(nèi)置到百度鴻鵠芯片內(nèi)部。利用進場數(shù)據(jù)和純粹依靠仿真數(shù)據(jù),就可以獲得足量的遠(yuǎn)場訓(xùn)練數(shù)據(jù),整個過程是icing原始多麥克信號到識別文字的一個端到端訓(xùn)練,整個優(yōu)化過程只有字錯誤率兩集一個優(yōu)化準(zhǔn)則。
百度從2012年起就開始把深度學(xué)習(xí)用于中文語音搜索,成為全世界最早把深度學(xué)習(xí)技術(shù)落地工業(yè)化產(chǎn)品的企業(yè)之一。百度大腦目前已開放了云、端、芯包含語音識別、語音合成等全棧語音引擎能力,并廣泛應(yīng)用于金融、政務(wù)、文娛等多種行業(yè)和場景。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語音能力引擎的應(yīng)用規(guī)模已達(dá)到業(yè)界第一,同時一直在積極拓展語音能力引擎生態(tài)鏈的建設(shè)。
隨著人們生活水平的提高及對家居環(huán)境要求的提升,智能家居產(chǎn)品正逐漸從奢侈品轉(zhuǎn)變?yōu)槿粘I钪械?..
工業(yè)和信息化部、交通運輸部、住房和城鄉(xiāng)建設(shè)部、公安部、自然資源部聯(lián)合發(fā)布了智能網(wǎng)聯(lián)汽車“車...
《互聯(lián)網(wǎng)周刊》、德本咨詢、eNet16聯(lián)合發(fā)布了“2025中國人工智能500強榜單”。榜單...
胡潤研究院發(fā)布了2024胡潤中國人工智能50強企業(yè)排行榜,榜單以企業(yè)價值進行排名,上榜門檻...
陳宗年,中國電子科技集團有限公司中電海康集團有限公司董事長、黨委書記。在他的帶領(lǐng)下, 海康...
2024福布斯中國科創(chuàng)人物評選結(jié)果重磅發(fā)布,本次榜單主要聚焦深耕于人工智能、高端制造等科創(chuàng)...