百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構(gòu)師賈磊正式提出基于復(fù)數(shù)CNN網(wǎng)絡(luò)的語音增強(qiáng)和語音識(shí)別一體化端到端建模技術(shù),該方法拋棄了數(shù)字信號(hào)處理學(xué)科和語音識(shí)別學(xué)科的各種先驗(yàn)假設(shè),消除學(xué)科間壁壘,直接端到端進(jìn)行一體化建模。相較于傳統(tǒng)基于數(shù)字信號(hào)處理的麥克陣列算法,錯(cuò)誤率降低超過30%。
據(jù)悉,這項(xiàng)技術(shù)無需任何數(shù)字信號(hào)處理和語音識(shí)別學(xué)科的先驗(yàn)假設(shè),復(fù)數(shù)CNN網(wǎng)絡(luò)內(nèi)存占用少于200K,可以內(nèi)置到百度鴻鵠芯片內(nèi)部。利用進(jìn)場(chǎng)數(shù)據(jù)和純粹依靠仿真數(shù)據(jù),就可以獲得足量的遠(yuǎn)場(chǎng)訓(xùn)練數(shù)據(jù),整個(gè)過程是icing原始多麥克信號(hào)到識(shí)別文字的一個(gè)端到端訓(xùn)練,整個(gè)優(yōu)化過程只有字錯(cuò)誤率兩集一個(gè)優(yōu)化準(zhǔn)則。
百度從2012年起就開始把深度學(xué)習(xí)用于中文語音搜索,成為全世界最早把深度學(xué)習(xí)技術(shù)落地工業(yè)化產(chǎn)品的企業(yè)之一。百度大腦目前已開放了云、端、芯包含語音識(shí)別、語音合成等全棧語音引擎能力,并廣泛應(yīng)用于金融、政務(wù)、文娛等多種行業(yè)和場(chǎng)景。
百度AI技術(shù)生態(tài)部總經(jīng)理喻友平表示,百度大腦語音能力引擎的應(yīng)用規(guī)模已達(dá)到業(yè)界第一,同時(shí)一直在積極拓展語音能力引擎生態(tài)鏈的建設(shè)。
隨著人們生活水平的提高及對(duì)家居環(huán)境要求的提升,智能家居產(chǎn)品正逐漸從奢侈品轉(zhuǎn)變?yōu)槿粘I钪械?..
工業(yè)和信息化部、交通運(yùn)輸部、住房和城鄉(xiāng)建設(shè)部、公安部、自然資源部聯(lián)合發(fā)布了智能網(wǎng)聯(lián)汽車“車...
AI大模型有哪些?據(jù)了解,我國(guó)已備案的大模型包括百度的“文心一言”、智譜AI的“GLM大模...
陳宗年,中國(guó)電子科技集團(tuán)有限公司中電??导瘓F(tuán)有限公司董事長(zhǎng)、黨委書記。在他的帶領(lǐng)下, 海康...
劉慶峰,科大訊飛董事長(zhǎng)。他是中國(guó)智能語音與人工智能產(chǎn)業(yè)化的先行者,帶領(lǐng)科大訊飛扭轉(zhuǎn)了中文語...
吳恩達(dá),Coursera在線教育平臺(tái)創(chuàng)始人,也是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域國(guó)際上最權(quán)威的學(xué)者之...