《紙牌屋》有一句話我挺喜歡:“每個人都無法拒絕自己真實的快樂。你會情不自禁地在自己喜歡的事情上花時間,不知不覺地放一萬個小時在那里。時間久了,你就會與眾不同。”
當我腦中浮現(xiàn)這句話的時候,我正在聽一場VR(虛擬現(xiàn)實)音樂會。
今天下午,在華為VR音樂媒體溝通會上,郎朗首部VR音樂作品正式上線華為視頻VR專區(qū)和華為VR視頻。在現(xiàn)場的體驗區(qū),坐上座艙,戴上VR眼鏡,就開始了個人專屬的音樂會,仿佛郎朗在面前彈奏,不知不覺放松下來聽了一會。
說到底,感官所帶來的體驗雖然短暫,然而我們依然愿意花時間聽一首歌,看一場演唱會,看一部電影,或許是因為這些體驗真實且豐富。而在華為看來,通過VR音樂,把傳統(tǒng)音樂會變成具備3D空間的音樂效果和VR視覺體驗,同樣也是想用技術營造出一種「現(xiàn)場感」和「沉浸感」。
VR音樂:一場讓更多人沉浸的潮流狂歡
借助5G、云計算與AI技術,VR產業(yè)正進入快速發(fā)展期。隨著硬件設備的不斷完善,豐富的內容和應用場景,成了推動VR更廣泛落地的關鍵要素。而在數(shù)字化時代,人們對文娛生活方式的體驗要求不斷升級。這兩者結合產生的「VR音樂」成為音樂產業(yè)的一個潮流走向。
華為消費者云服務副總裁譚東暉在溝通會上指出:“VR會成為5G時代第一波創(chuàng)新應用。”一方面,VR技術走向成熟期、VR硬件設備出貨量猛增,2020年全球VR頭戴設備的出貨量達到670萬臺,相比2019年增長了72%,基本翻翻。
另一方面去年的特殊情況改變了人們的生活習慣,2020年對在線視頻的需求大幅增長,觀看時長同比增長40%。消費者需要更多形式、更高品質的優(yōu)秀內容。
圖:華為消費者云服務副總裁譚東暉
華為去年在開發(fā)者大會正式發(fā)布「VR音視頻平臺」,經過一年時間,該平臺已經取得商用成果,即本次與郎朗發(fā)布的VR音樂作品以及其他藝人的共24首曲目。華為VR音視頻產品總監(jiān)Xinxin現(xiàn)場介紹,「華為VR音視頻平臺」是華為終端云服務推出的全新內容平臺,在全球各地,華為的用戶都可以借助該平臺隨時隨地進入表演現(xiàn)場,體驗到最領先的音視聽內容。
與VR音樂的立意相似,有一種職業(yè),也是“一直在更具有臨場感的聲音之路不斷探索”,那就是錄音師。中國古典錄音師制作人馮漢英在溝通會上談到:“錄音師最愿意做的事,就是把現(xiàn)場的沉浸感,無縫讓大家在各種各樣音箱設備中重放。”
聲音的重放主要通過「音箱」和「耳機」實現(xiàn)。在音箱的重放部分,隨著音頻技術的不斷發(fā)展,重放格式發(fā)生了巨大迭代,由單聲道、立體聲、平面環(huán)繞聲,直到最近才逐漸興起的沉浸式環(huán)繞聲以及更加創(chuàng)新的VR音視頻;而耳機的重放部分一直很不理想,因為只是通過音箱的信號來實現(xiàn)。
“華為VR音樂很大程度解決了傳統(tǒng)音樂制作的痛點。”馮漢英說,比如與古典音樂結合,讓更多人能感受到現(xiàn)場演奏的能量和生命力,這讓音樂宮殿中的明珠再次綻放光彩。面對這一新的領域,音樂制作人也在探索新的音樂表現(xiàn)形式。
VR音視頻平臺:一個讓更多人參與創(chuàng)作的連接平臺
除了讓更多人感受音樂現(xiàn)場,華為VR音樂還能為音樂公司、獨立音樂人提供技術平臺,包括高清VR視頻采集與輸出方案、VR攝影機、后期視頻編解碼及播放,為提升VR音樂創(chuàng)作的便利性、降低門檻。為了讓更多人參與到VR音樂的創(chuàng)作生態(tài)中,華為計劃未來把這種技術能力開放給內容開發(fā)者,共同推進VR行業(yè)的繁榮發(fā)展。
Xinxin介紹,VR音樂最獨特優(yōu)勢即是沉浸感,還原現(xiàn)場的聲音和物理特性,這對于建立沉浸感是極其重要的。華為在音頻視頻方面擁有自己的核心能力,除了還原現(xiàn)場的各種參數(shù)外;還通過13K*9K業(yè)界最高分辨率的3D VR視頻,能同時保留高光細節(jié)和暗部色彩。
本次與嚴雯君等多位藝人的合作,都基于華為VR音視頻平臺,該平臺為音樂產業(yè)人士提供了技術平臺和一站式端到端的制作發(fā)行解決方案,包括前端播放能力、視頻點播VOD服務、音樂開發(fā)工具及VR內容的制作與發(fā)行等?;谶@樣一個便捷高效、充滿激勵和創(chuàng)作活力的開放平臺,內容創(chuàng)作者解決了從創(chuàng)作到制作輸出的技術難題,能輸出低成本、高質量、規(guī)?;膬?yōu)質VR音樂內容,制作好的內容還可以直接登錄華為云服務來發(fā)行,提供給全球用戶來體驗。
華為VR音視頻平臺的背后,源于華為很早提出的“以消費者為中心”、“軟硬件雙輪驅動”的全場景智慧生態(tài)戰(zhàn)略。所謂“軟硬件雙輪驅動”,即一邊不斷落地“1+8+N”的硬件生態(tài);另一邊不斷打磨操作系統(tǒng)、應用和服務生態(tài)。據悉,華為終端云服務(HMS-Huawei Mobils Services)已經為全球170多個國家和地區(qū)的7億多用戶提供數(shù)字服務。
2022年國內VR/AR市場規(guī)模將超千億元,VR之勢不可阻擋,華為VR音視頻平臺之勢同樣不容小覷。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。