無論是欣賞電影大片,還是觀看賽事直播,你肯定遇到過這樣的情形:瞬間爆發(fā)的環(huán)境音“壓”過了對(duì)白,又或是球迷們意外的歡呼讓你根本來不及反應(yīng),剛剛主播說過什么?很顯然,DTS也意識(shí)到了這個(gè)問題,推出了新的設(shè)備端解決方案,即利用AI音頻處理技術(shù)來提升電視音頻中對(duì)白的清晰度……不久前的IFA上,DTS Clear Dialogue首度出現(xiàn)在了公眾面前。
聽不清電視對(duì)白是種怎樣的體驗(yàn)?
音頻技術(shù)持續(xù)得到進(jìn)化,從單聲道、立體聲到沉浸式環(huán)繞聲。我們熱衷于討論多聲道,但不要忘記一件事,即很多人依然在使用電視機(jī)內(nèi)置喇叭作為聲音還原的唯一渠道。因此不要對(duì)“怎么還會(huì)聽不清對(duì)白”這個(gè)話題表示莫名,它是真實(shí)存在的。
影響對(duì)白清晰度的原因很有多:電影制作時(shí),導(dǎo)演或混音工程師過于偏重音效處理,像是Christopher Nolan導(dǎo)演的《Tenet/信條》,過于抽象的重音或極其響亮的槍聲;環(huán)繞聲電影強(qiáng)制降頻到2.0時(shí),原有環(huán)繞效果或其他音效在某一刻也會(huì)影響對(duì)白的重播;直播賽事更甚,因?yàn)?ldquo;變幻莫測(cè)”的聲音太多了,瞬間“爆燃”的球迷歡呼聲就完全有可能壓制了主播的解說聲,萬一后者此刻同樣非常激動(dòng),說得過快或拖音、含糊不清時(shí),就更“雪上加霜”了(不巧的是,兩者共同出現(xiàn)的幾率非常高)。
聽不清對(duì)白,是觀眾經(jīng)常會(huì)遭遇到的情境
DTS母公司Xperi為此對(duì)1200名美國(guó)成年人進(jìn)行了一項(xiàng)調(diào)查:84%的受訪者在觀看電視節(jié)目和電影時(shí)遇到過難以理解對(duì)話的問題;超過79%的受訪者表示,他們會(huì)選擇使用字幕,這其中的30%(約占整體受訪者的24%)則進(jìn)一步表示,他們會(huì)經(jīng);蚴冀K打開字幕。
要進(jìn)一步論證這一點(diǎn),我們可以關(guān)注下幾乎所有的電視機(jī)品牌,宣傳時(shí)都會(huì)提到的概念——對(duì)白增強(qiáng)。無論它們“發(fā)明”了何種花貍狐哨的“稱謂”,真實(shí)目的都只有一個(gè),讓電視觀眾能夠聽清對(duì)白。
這一切都需要有一項(xiàng)技術(shù),來增強(qiáng)對(duì)白(主要是中頻)。過往的做法,是在EQ上提升中頻,附加其它一些算法。AI時(shí)代,如何動(dòng)態(tài)地實(shí)現(xiàn)對(duì)白清晰度,早晚都會(huì)被提到議事日程上來。
什么是DTS Clear Dialogue?
到截稿時(shí)為止,DTS沒有為這項(xiàng)技術(shù)發(fā)布中文譯名,我們暫且理解為“DTS清晰對(duì)話”技術(shù)。
基于AI的對(duì)白分離技術(shù)
DTS官網(wǎng)上,他們表示:DTS Clear Dialogue是基于AI的音頻處理解決方案,可提高電視觀眾對(duì)口語的理解。這是一項(xiàng)持續(xù)30多年音頻創(chuàng)新后開發(fā)的、設(shè)備端的解決方案,可以識(shí)別、分離和增強(qiáng)對(duì)話,以提高清晰度并提供可定制的音頻體驗(yàn)。DTS沒有公布具體技術(shù)細(xì)節(jié),只是強(qiáng)調(diào)它能非常容易地集成到現(xiàn)有電視系統(tǒng)中?紤]到這項(xiàng)技術(shù)從發(fā)布到本文截稿,不過才半個(gè)月的時(shí)間,因此有待未來持續(xù)的關(guān)注。
就我的個(gè)人觀點(diǎn)而言,本質(zhì)上來說,它就是使用AI和機(jī)器學(xué)習(xí)來識(shí)別音頻中呈現(xiàn)的不同元素,然后分離出對(duì)話部分,加以單獨(dú)處理,包括增強(qiáng)對(duì)話,使其與混音的其余部分分開。因此,從技術(shù)形態(tài)上來說,大膽推測(cè)會(huì)是以軟件方式,甚至是固件升級(jí)的形式,逐步植入到電視機(jī)中。
讓AI來解決如何“清晰對(duì)話”
每個(gè)人都能進(jìn)行個(gè)性化設(shè)置
與此同時(shí),DTS Clear Dialogue宣稱允許觀眾進(jìn)行更加個(gè)性化的設(shè)置。比如調(diào)整對(duì)白輸出的音量,來對(duì)應(yīng)自己的聆聽需求;又或者是靈活地控制對(duì)話相對(duì)于其他混音元素的突出度和清晰度。甚至說家庭中的每個(gè)人,都可以自定義DTS Clear Dialogue。畢竟,不同家庭成員的聽力水平是不一樣的,尤其是看電視這種涉及到全家老少的娛樂活動(dòng)。何況,你還無法排除家庭中聽力障礙觀眾的存在。這樣的個(gè)性化設(shè)置,顯然會(huì)特別方便。不過換句話來說,也有可能絕大多數(shù)觀眾未必需要這種個(gè)性化的處理,很多時(shí)候他們更期望是簡(jiǎn)單的Open/Close選擇。
個(gè)性化定制專屬的Clear Dialogue
所有語言和節(jié)目源皆適用
更有意思的是,DTS宣布這項(xiàng)技術(shù)是基于深度學(xué)習(xí)模型完成的,因此對(duì)語言,或者說語種有著很強(qiáng)的包容性。即AI的訓(xùn)練并非針對(duì)某一特定語言(這讓我想到iPhone 16對(duì)AI的支持仍然存在著語言上的缺陷)。因此,所有節(jié)目源都適用于這項(xiàng)AI技術(shù),包括電影、電視節(jié)目、體育賽事,當(dāng)然也包括流媒體服務(wù)和網(wǎng)絡(luò)廣播提供的實(shí)況(Live)節(jié)目。
回到前面提到的話題,即大多數(shù)電視機(jī)品牌也有對(duì)白增強(qiáng)功能,那么這兩者間會(huì)有什么區(qū)別?Xperi首席產(chǎn)品和服務(wù)官Geir Skaaden在IFA上回答記者提問時(shí)就表示:“迄今為止,僅僅通過緩解音頻后處理方案的局限性并未解決跨語言、內(nèi)容和環(huán)境之間復(fù)雜的潛在問題,也無法顧及每位觀眾的個(gè)性化需求。”在他看來,DTS Clear Dialogue為此更進(jìn)了一步,而且可以適用到不同品牌和性能的電視機(jī)上。相對(duì)電視品牌將相關(guān)功能主要投注到高端型號(hào)上的做法,DTS的舉措顯然想要觸及普羅大眾。
不過到目前為止,DTS沒有確認(rèn)哪些電視品牌或具體機(jī)型獲得了DTS Clear Dialogue認(rèn)證,還需假以時(shí)日來做進(jìn)一步的了解。
適用所有語言和節(jié)目源
效果到底如何,讓聽過的人現(xiàn)身說法
由于DTS只在IFA上做過演示,因此我們?cè)谶@里就分享兩位外媒作者的評(píng)論。
《What HiFi?》作者Lewis Empson表示,他對(duì)這些功能本身抱持懷疑態(tài)度,因?yàn)楦P(guān)心該如何保留“導(dǎo)演意圖”。他嘗試調(diào)整遙控器音量鍵,以便讓更多背景噪音加入,來影響對(duì)白和其它環(huán)境音的平衡。在他看來,如果將效果調(diào)至極致時(shí),會(huì)覺得DTS Clear Dialogue“過于霸道”了,反之有助于重新引入所需的環(huán)境效果。至于“忠實(shí)于導(dǎo)演意圖”,他的說法有一定的可比照性:相對(duì)使用OLED電視和環(huán)繞聲系統(tǒng)的發(fā)燒友,使用老式液晶電視內(nèi)置(低質(zhì)量)音響的觀眾,基數(shù)要大得多,他們更關(guān)心的,是如何享受內(nèi)容,即使為此犧牲真實(shí)性來提高清晰度。而且,由于它對(duì)老年人和聽力障礙人士更友善,因此Lewis Empson認(rèn)為這仍是個(gè)受歡迎的功能,至少“個(gè)性化設(shè)置”是如此。
網(wǎng)媒Techradar的作者Hamish Hector分享了自己試聽的兩個(gè)片段:《The Martian/火星救援》中Matt Damon被風(fēng)暴吹走的場(chǎng)景,啟動(dòng)DTS Clear Dialogue后,他可以聽清宇航員們通過宇航服中的通訊設(shè)備互相交談的內(nèi)容,即使是在混亂嘈雜的環(huán)境中;環(huán)法自行車賽事片段里,DTS Clear Dialogue巧妙將主播的評(píng)論與觀眾的閑聊和歡呼聲區(qū)分開來,令前者的講話更容易聽清,同時(shí)又保留了觀眾喧鬧給賽事營(yíng)造的氛圍。
至于確切效果會(huì)如何?我們期待DTS Clear Dialogue能快速進(jìn)入電視機(jī)市場(chǎng),并且有機(jī)會(huì)實(shí)際試聽。