近年來,在互聯網、大數據、超級計算、傳感網、腦科學等新理論、新技術以及經濟社會發展強烈需求的共同驅動下,人工智能呈現出飛躍式的進步,進入新的發展階段。無論是企業還是政府在人工智能方面的關注和投入,都在不同層面推動著人工智能技術和應用的蓬勃發展。各種創新的AI應用逐步開始進入社會生活的各個場景。
同時,我們也看到,新興科技正在推動新一輪全球產業變革,而人工智能毫無疑問成為了釋放產業變革潛能的重要力量。作為人工智能技術的重要分支,計算機視覺技術在算法、數據及算力的加持下,更是得到了飛速的發展,已經具備大規模應用的可行性。特別是在文娛產業得到了廣泛應用的智能影像技術已經成為行業變革的核心驅動力,將進一步催生新應用、新產品、新產業、新業態、新模式的出現,推動智能影像產業生態的繁榮。
人工智能為影像分析技術帶來變革。人工智能在影像行業的綜合應用, 特別是通過對動態視覺內容的理解和重構,是計算機視覺技術及計算機動畫技術的交叉和融合,給智能影像產業帶來了充滿想象力的廣闊舞臺和空間。
智能影像技術為產業變革帶來強勁動力。過去幾年文娛產業經歷了快速的發展,以內容制作方、視頻平臺方為代表行業參與者正面臨著諸多的挑戰,各方仍在行業變局中摸索前行,期望不斷通過運用新興技術和應用的創新提升自身的核心競爭力。智能影像技術在行業的應用日漸深入,成為新一輪行業變革的核心驅動力。
把握數字化轉型新契機,智能影像技術加速業務變革。智能影像技術不僅成為文娛產業商業價值變現的核心引擎,也在逐漸進入更多的內容原創領域,通過自動化影像加工、生產技術為產業升級提供動力。而且, 智能影像技術也通過全面賦能推動應用在教育、零售等更多領域落地, 成為行業價值創新的基石。
2006年以來,隨著深度學習技術的進展,人工智能再次獲得了廣泛關注。特別在圖像領域,深度學習帶來的突破性效果在很多領域已經超過人類水平,各種類型的神經網絡不斷涌現,伴隨著計算力的提升以及海量數據的積累,人工智能為廣闊的圖像分析領域帶來深刻變革。資本市場對與計算機視覺的熱度空前高漲。
影像生產技術以計算機視覺 (Computer Vision) 與計算機圖形學為基礎。計算機視覺誕生于上世紀六十年代,是指能夠賦予機器自然視覺能力的學科,關注圖像的識別和分割。在初步興起的二十年時間里,“識別”領域進展有限,而分割領域取得了一定的進展。進入本世紀,隨著互聯網的不斷發展,圖片的來源日趨豐富,各類圖像數據庫開始出現,標注數據進一步促進計算機視覺的發展。
Forrester對人工智能技術進行分類研究時采用了Sense、Act、Think 的框架。類比來看,在感知(Sense)層面,人工智能技術為靜態圖片識別乃至多模態影像識別帶來了突破;在思考(Think)層面,基于多模態識別結合商業需求可以形成深入的影像智能化理解。以感知、思考為基礎,在行動(Act)層面,人工智能技術為自動化影像生產帶來了強勁動力。為此,我們將智能影像生產技術分為兩部分:影像智能化理解(Sense和Think) 和影像自動化生成(Act)。
傳統的計算機視覺技術大量聚焦在特征生成和選擇。端到端深度學習帶來了自動特征學習能力,從而極大促進了計算機視覺的發展。深度學習所需的大量訓練數據以及運算能力在當下也得到了良好的供應。對于“識別”這種人類無需思考即可在極短時間內作出判斷的任務目前是人工智能最擅長的領域。從包括圖像、語音、文字的多模態識別,人工智能對于影 像感知和理解能力不斷提升,推動了智能影像產業的快速發展。
影像語義理解增加了商業模式的可能性。通過視頻結構化分析、目標檢測跟蹤、動作態勢感知、人物識別以及情感分析等多模態感知技術,人類已經可以從動態影像中獲取淺層信息。但是要做到商業模式變現,仍需進一步從語義的層面深入理解影像內容。
在這一領域,需要有大量的行業積累,例如對綜藝類視頻節目中人物、物體等的識別標注,需要專業的經驗,基于編劇、布景、拍攝等角度,對視頻進行結構化建模進行分析和學習,把特征空間提升到語義空間。在此基礎上對影像數據生成語義標簽、業務分類乃至文字描述以供后續業務場景使用。常識的建立可以極大提升機器性能,既有經驗與多種深度網絡的融合將會形成企業差異化的競爭優勢。