www.flickr.com

星期四, 6月 08, 2006

[知識] 淺談光學式動態擷取系統

A Brief Introduction of Optical Motion Capture System

現今電腦動畫的角色動畫運用可分為兩大方向: 擬真角色動畫(Virtual Idol)與卡通角色動畫( Cartoon Character Animation )。針對角色動畫的動作設定上可分為兩大種類:

第一種是關鍵畫格(Keyframing卡通類型的角色動畫除了參考真實動作外為求誇張效果與體態,需要重新調整動作的節奏,因此會大量運用Keyframe,以強調更大的肢體動作及更高的戲劇張力。

第二種是動態擷取(Motion Capture以下簡稱MoCap)。以擬真角色動畫而言,為求動作合乎真人行動及姿態,因此會大量運用MoCap擷取人體動作。所謂動作擷取的技術就是將人體的動作轉換成數位資料,供進一步的應用分析。主要是在演員身上裝置感應器,透過不同的感應方式,對應到電腦虛擬空間中的相對應角度或座標軸,加以記錄。除了擷取人體全身的動作外, 也可擷取局部的動作諸如臉部,手部等細部動作,以至於其他動物的動作擷取等。

動作擷取顧名思義就是就是準確捕捉動作的細微變化。在發展初期應用於以往常被使用在醫學、運動研究等特定領域,由於當時並非以廣泛應用為目的,所以操作困難而且必須在特定環境作業。近年來隨著數位內容產業的發展,而廣泛應用於高階影視動畫的範疇,更多新的技術紛紛投入,各廠商開發的目標已朝向提高資料穩定性、提高操作效率、提高應用彈性以及降低系統成本等方向發展。雖然目標相同,但在市場上仍存在著幾項不同的技術,每項技術也有各自的特長與需要突破的瓶頸。

目前技術上最為先進的動態擷取系統系統即為光學式系統,光學式的系統是由高解析度攝影機的位置打出肉眼不可見、高頻的紅外線閃光,並紀錄下由裝置在演員身上的光球(稱為MarkerOptical)所反射的光點,將多台攝影機得到的影像資料經過影像辨識對比的運算,獲得光球的XYZ位移動作,因光點被動反射光線,所以稱為「被動式」光學系統。

被動式光學系統最大的優點是精確度高,所裝置的光球構造簡單最不影響活動,擷取動作範圍大、無運動方式限制、也可因應不同的擷取需求變化(如道具、臉部表情等),並可以同時取得多組的數據,雖然建置成本最高,但目前已經成為主流的擷取技術,廣泛的應用於數位內容製作上。

被動式系統的一大問題是在動作時易產生光球遮蔽問題,攝影機無法正確接收反射造成判斷錯誤,所以另外一種稱為「主動式」光學系統,將光球改為主動發射光線的LED,循序發射光線,以避免上述的問題,但是演員身上則必須背負電源模組,對動作限制較大,光球尺寸較大無法進行太細緻的動作,且光球數量越多,取樣會越不精準。

不管是主動或是被動的光學式系統,在取得光點位置後,必須再經過解算成骨架的旋轉量,以便後續應用,對於電腦運算的需求極大,但以目前工作站的效能來說,已經能做到即時(Realtime)的處理。

動作擷取(Motion Capture)系統技術應用在電腦角色動畫上是近年興起的一個新領域依「提升大學基礎教育計畫」,於民國九三年搭配虛擬攝影棚建置國內首次引進的數位式系統,由Motion Analysis Corporation(美國魔神公司)所研發的Eagles光學式數位動態擷取系統美國魔神公司為當今世界上最具規模的光學式動態擷取系統廠商,在數位內容相關產業市場占有率為百分之八十,目前有大約近千台產品服務於全世界,為目前使用最廣泛的擷取系統。本文即以本系統為例,說明光學式動態擷取系統的作業流程。

一、 系統建置

建置一套動態擷取系統基本上由三個層面組成,第一個是擷取資料的硬體設備,第二個是處理資料的應用程式,第三個是擷取的空間,必須要三個層面緊密的配合才能取得正確的擷取效果。

1、 硬體設備

硬體部分主要負責的是感應器的追蹤與定位,對於光學式的動態擷取系統則為是高解析度紅外線攝影機。本套系統即搭載了六台Motion Analysis所研發的Eagle Camera

與上一代類比式(Falcon Camera)的光學擷取系統相比,Eagles Camera採用數位方式記錄影像,大幅提高了影像解析度,可以記錄更細緻的動作,數位資料可以直接進行計算,有效提高了每秒擷取張數(FPS)。類比式擷取的影像資料必須經過後製處理才能進行辨識,相較之下速度較慢且精確性低。

Eagle Camera
為專業的數位3D動態影像擷取鏡頭,適用於3D人物動畫 ( 3D character animation ),應用範圍廣及電視、電影、電玩等市場。採用一百三十萬像素CMOS影像感應器,解析度達1280x1024 pixelCMOS影像感應器具備高階影像整合且用電少之特色二維擷取影像由Eagle數位攝影機內置晶片直接處理。

Eagle Camera主要透過乙太網路線連接到一個稱為EagleHub的中控集線器上,單一攝影機與集線器之間的有效距離到100英呎,EagleHub也控制所有攝影機的閃光同步,可以說是整套擷取系統的小腦,一台EagleHub可以連接八台攝影機,並可以堆疊使用,這樣的設計使得整套設備能夠輕易的擴充,以因應未來的需求。攝影機所擷取下來的資訊,同樣也是透過網路傳輸到所搭配的電腦工作站進行資料的分析處理。

2、 應用程式

資料處理工作是擷取作業中最需要大量運算的階段,可以由專用的硬體或軟體完成,扮演著動態擷取的大腦。以現階段處理器的運算能力以及效能進步的幅度來說,採用軟體運算的方式,較開發專用硬體來的有效率且合乎成本。對於光學式擷取系統的開發商來說,最大的資產並不僅止於有形的實體裝置,更重要是核心的影像追蹤擷取、編輯及資料分析的技術。

以本校的MotionAlalysis系統為例,在前端動作擷取階段搭配軟體為EvaRT,是Motion Analysis系統專用的作業軟體,在這一套軟體中進行系統的校正、控制、定義感應光點、擷取光點位置......等工作。

在完成前端光點位置資訊的擷取後,後端搭配的為Alias公司所出品的MoCap軟體,負責將光點的位移解算成骨架旋轉,成為我們視覺化可以辨識的角色動作,並且輸出到常用的動畫軟體,如3DS MAXMAYAXSI.......進行後續的應用。MoCap軟體除具有動態擷取資料的處理能力,本身即為高效能的角色動畫軟體,能夠有效率的整合擷取動作與統關鍵畫格的角色動畫。

3、 空間規劃

光學式動態擷取系統係使用一定數量的攝影機組成陣列,攝影機拍攝範圍互相交錯,以涵蓋擷取的空間,空間越大所需要的攝影機越多;反之若同樣的空間使用越多的攝影機則擷取的穩定性越高,能負荷的光點越多。

攝影機涵蓋範圍

其對擷取的需求有三個空間需求:

A. 裝置空間:架設攝影機之需求空間 ( Space of Installation )

B. 擷取空間:實際人物運動有效空間 ( Space of Capture Valume )

C. 安裝計算系統與操作人員空間 ( Space of Operator & Tracking System )

以本系統來說,搭載了六支Eagle Camera,以專用固定架安裝於天花板上,提供了長3公尺寬2公尺,垂直1.8公尺的有效擷取空間,足以應付單一角色的演出動作。

台灣藝術大學虛擬棚空間

二、 前置作業

表演設計的工作必須要動畫導演、動作指導、演員和技術指導互相討論而成,在擷取工作之前,就能就分鏡腳本或是表演內容作分析決定擷取工作的運作,並且進行排演並視需要準備道具、場景。尤其是營業用的動態擷取設備,多是以時計費的方式租用且金額昂貴,更是不容許時間上的浪費,前置作業越完整,實際進棚錄製的效率越高。

三、 環境校正

理論上來說攝影機若固定良好沒有移動,僅需於安裝的時候進行調整即可;但實際狀況下攝影機可能會受引力、地震、機件疲乏......等因素而造成偏移,進而在擷取時產生如大量雜訊等不預期狀況,所以在進行動作擷取工作前,必須對攝影機進行校正以求得理想的擷取環境。

校正工作必須透過專用的校正設備進行,通常是在擷取空間中安置固定尺寸的比例尺對系統進行初始化的校正,如圖所示的L-SYSTEM,即為一個安裝上光球的L形水平儀,光球之間的距離為等比級數,作用是放置在原點上以決定擷取空間的座標系統與單位。


校正設備

另一個器材稱為Wand,為一T字形的鐵架,上方安置光球,光球距離不對稱以辨別方向,持校正棒在擷取場地內上下前後掃動以求得有效的擷取空間。如果在校正過程中發現異常的狀況,則須立即排除。

透過校正的過程在電腦中建立一個和實體擷取場地相對應的虛擬空間。

相對應虛擬空間

四、 感應光設置

正式進棚後,第一步是在演員身上裝置反射用的光球。光球有不同的大小,需視擷取目標不同選擇適合的尺寸。但是在擷取中光點的大小並不影響紀錄的資料。

感應光球

演員通常穿著特製的緊身衣,避免衣料皺折晃動,緊身衣表面為魔鬼氈的材質,以便固定光點。如果無法穿著專用服裝,也可以打赤膊或使用黑色膠帶固定衣服,使用彈性繃帶、橡皮筋、護膝護腰......等將光球固定其上,基本的要求為不影響演員動作、光球不易脫落、不晃動,並且符合擷取的原理。


設置光球與固定裝置

光學式動態擷取紀錄的是光球在三度空間中的位置移動,至少要三個光點才能正確計算出物體六個自由度(DOF)的活動,以全身動作的擷取來說,視動作要求需在演員身上安置30~40顆反光點(不含手指),光點越多擷取的動作愈精細,但後續修整的工作量也更大,光點互相影響的機率也越大,一般動作擷取所採用的光點設置(Markerset)為標準41顆的設置。

Mocap Markset

標準動畫角色用41顆設置

光球安裝位置與數量影響擷取資料的正確性,通常是安裝在肢體不易拉扯滑動的位置,並避免設置於關節正上方最少需要三個光點才能正確判別關節旋轉,肢體末端(手掌腳掌)亦需要最少兩顆光點以辨別左右避免翻轉。光球之間的距離必須要不等長,切忌左右對稱,在資料處理時才能進行正確的外型對比。

五、 光球設置定義

開始動作表演之前,必須要進行光球設置的定義。由於光學式的原理是攝影機接受光球的反射加以分析對比出座標位置,所拍攝到的僅有光點而已,對於電腦來說都是一模一樣的,必須要手動將每一個光點指定編號,定義光點之間的聯結關係(Linkage),成為完整的光點結構。


定義光點結構

人體並不是剛性物體,即使光點固定的再牢靠,因為肌肉或骨骼活動影響多多少少會有滑動擠壓的狀況,必須要再定義一個容錯值。

設定完成後再進行的擷取工作,電腦會依定義的結構進行追蹤與偵測,給予每個光點正確的編號,以利後續應用。即使是相同的演員、相同的光球設置,每次安裝的位置都可能偏差,所以每次專案都必須重新定義一次。

六、 擷取動作

光學式動態擷取的流程可分為即時擷取(Realtime)及非即時擷取(No- realtime)

1、 即時擷取:

又稱串流(Streaming) 或在線擷取(Online),顧名思義,演員的動作即時套用在虛擬動畫角色上,以提供最直接的視覺回饋,通常運用在現場演出,如虛擬主播、運動分析等需求上。

即時演出,擷取資料必須立刻解算到動畫角色上,對於系統運算、資料傳輸能力的需求較非即時擷取來的更高。考量到即時運算的效能,必須盡量減少光球數量,僅能夠應用基礎的過濾器處理資料,所以對動作的限制較多,避免擷取難度高的演出。

2、 非即時擷取:

非即時擷取屬於離線式(Off-line) 的流程,擷取時先儲存所有光點的位移資料,待動作完成後再進行後續的處理分析,最後解算成動畫角色的動作。非即時擷取最大的缺點是不容易即時修正演員動作與動畫角色之間的配合,僅能由監視器上的的光點聯結作判斷。

優點是能後續進行自動或手動的修改,以修正有缺陷的擷取資料,是故對動作的限制小,精密度更高,通常應用於動畫電影、遊戲的角色動作擷取。

七、 整修資料

非即時擷取第一個階段得到的是所有光球的位置,受演出動作、環境等因素所影響,得到資料常有若干缺陷,必須要經過後續的修整才能運用在角色動畫上。

Eagle Camera為例,有效紀錄畫格為60/每秒,若採用41個光球的設置進行全身動作的擷取,每秒鐘需處理高達兩千四百六十筆的座標移動資料。藉助電腦的運算能力,從而對擷取數據進行處理,執行如清除雜訊等工作,但電腦是死的,只能根據數學運算式依設定條件對數據進行處理。高速的運動如揮拳踢腿,速度僅有零點幾秒,擷取光點的運動曲線和高頻雜訊其實並無二致,只能依靠人腦來做判斷。

動作資料修整

此外被動光學式常見的光點編號錯置的狀況,也必需依靠動畫師以經驗、對比動作前後關係來修正,故整修資料是動作擷取流程中最花費時間的專業工作。

八、 解算骨架

擷取資料修整完成後,檔案所記錄的資料為所有光點的座標移動,必須再進一步解算成階層式骨架的關節旋轉量以便後續的應用。

解算骨架在概念上是一個還原的手續,將擷取的光點指定回相對應的肢體位置上。如同人體結構一般,不同的關節有不同的自由度與運動型態,例如手肘只有一個軸向運動,旋轉角度在120度左右、手腕依擷取的細緻度而定,通常可以做三個軸向的旋轉......等,諸如此類的狀況,必須要適當的指定關節形式方能正確的解算,以免產生超出正常肢體結構的動作。

較先進的後端軟體(Alias Mocap),通常會提供一個預先定義好的標準骨架,僅需指定光點所對應的肢體即可進行即時解算,大幅縮短了繁瑣的設定工作,使得動態擷取的資料更容易量產使用。

九、 資料轉換

雖然不同的擷取系統與後端軟體,都有各自專屬的檔案格式,但基本上動態擷取最終產生的資料敘述皆為階層式記錄每個關節的旋轉量的順向關節結構。依照這樣的結構,輸入到3D軟體中後還原或對應到各種不同的骨架系統上,即可進行後續的應用。

結語

角色動畫,不管是傳統平面或是電腦動畫,角色的表演都是透過動畫師的雙手逐格製作而成,動畫師也被稱為「沒有聲音的演員」。動態擷取製作的角色動畫,動作來自真實演員的表演,不經過動畫師的詮釋而產生了這樣是否為角色動畫的爭議。但與其爭議說動態擷取是否算是角色動畫,不如果說動態擷取的應用,將角色動畫中「表演」的成分,由動畫師的手中交還到演員的身上,讓演員扮演動畫中表演者的角色。

2004年末上映的「北極特快車」一片,就由名演員湯姆漢克斯(Tom Hanks)一人分飾多角,透過動態擷取的技術化身為不同的角色,隨著技術的進步,動態擷取技術能更忠實傳遞演員的「演出」,而不僅止於「肢體動作」。角色演出的關鍵是怎樣塑造角色的個性形象,手段需服務於動作設計的需要,動態擷取技術能夠更完美實現對角色動作真實再現的要求,使用恰當準確的技術,不僅能使視覺效果接近完美,還能事半功倍。

而動態擷取得到的動作,就像是一種新的素材,透過如同非線性剪輯般的組合、調整,能更快速地創造出高品質的角色動畫,應用在接近寫實造型的角色上,便是適合的選擇,其優點如下:

1、 真實動作

快速實現複雜無規律的長時間動作是動態擷取的一大優勢。傳統關鍵畫格動畫裡,由於動作都是由動畫師逐格調整的,這樣的製作工作相當的繁瑣與複雜,需要大量的製作時間且不易修改。同樣的角色,由不同的動畫師來調整呈現出來的質感也不完全相同,可以說角色表演動作的好壞最重要取決於動畫師的能力,其次才是軟體工具的問題。

以動態擷取為基礎的動畫製作系統則改變了這個狀況,它對演員、運動員和舞者的動作進行捕捉,演員即時演出動作流暢自然,不需動畫師重新進行製作。這些動作都是非常微妙而具有特的。由於它記錄的是物體的實際運動,所以動作精確,效率極高,應用在動畫上的效果非常逼真,特別適合用於擬真造型的角色上。

2、 動作資料庫

動態擷取的資料,由於是三度空間中的動作,沒有傳統平面素材的角度限制,而數位化的格式,可以重複的使用而不會有失真的困擾。例如走路、跑步......等常見的基礎動作,只要收錄一次,下次有需要的時候就可以立即的套用在不同的角色上,這樣的特點在進行大規模的背景角色時特別的方便且省下許多的成本。

3、 易於量產

一部電腦動畫的產出,在製作期最耗費人力的工作即為調整動畫的階段,且人力素質的要求也是最高的,若是需要大量的動作,在有限的時間和預算內,投入大量動畫師以關鍵畫格製作,成本將居高不下,動作品質受限於動畫師的能力,容易出現品質不一,表演風格不連貫的問題。

若是製作期程短的電視影集,使用動態擷取技術取代手調動畫,一方面有效縮短動作製作的時間,二方面能減少對動畫師的需求以降低成本,動態擷取在產出效能上有確莫大的優勢。


動態擷取並不是一個完美的動畫工具,同樣具有很多技術條件與功能上的限制,甚至有許多的動作是不可能達成的,舉例來說,如超出人體限制的誇張動作,就不是動態擷取的強項所在。也因此動態擷取動畫也不是為了取代傳統關鍵畫格動畫而出現,而是提出了另一個選擇,具有快捷、準確、真實、等特色的解決方案,同樣的也是傳統動畫手段所難以達到的。對於一個動畫創作者來說,必需衡量得失,因應動畫效果選擇最適合的解決方案,而非拘泥於藝術或是科技之類的迷思之中。

(本文刊載於國立台灣藝術大學藝術欣賞月刊2006)

1 則留言:

Kenny 提到...

請問可以請教一下即時捕捉的大略設置步驟嗎?

本頁面及相關頁面所提及之公司名稱與商標,,其著作權皆屬原公司所有

本網站公開發表之文章若未經聲明,皆屬作者本人所有

如需引用節錄,歡迎來函告知