時論廣場》善用Sora 人人都可成為專業導演
(林建甫)19:52 2024/03/04 言
最近OpenAI又推出了一項新科技,使用者給出一段文字描述就能由旗下最新的AI影片產生器Sora直接生成一段60秒的逼真 影片,震撼全球。 9段Sora影片,包括走在熱鬧東京街頭的時尚女性、淘金時代的場景鳥瞰、老式休旅車高速行走在山路、踏著皚皚白雪奔跑 的猛獁象……。每段影片,看來都非常專業,運用鏡頭推移轉換,準確地表達角色情感與和視覺風格。外媒《Wired》聲 稱,這是沒有在其他影片生成AI模型中看見過的真實感,並且生成的影片長於其他模型。 現在AI的智慧實在是突飛猛進。
1980年代,我還在讀大學的時候,有朋友告訴我交大就是一個很大的電腦學校,各科系都是 在電腦裡面的零件去分工研究。但是當時大家覺得電腦根本稱不上一個腦,只是一部計算器而已。今天透過OpenAI的 ChatGPT,電腦已經可以跟你聊天對話,一點違和感都沒有。
根據OpenAI在官網上的介紹,Sora能夠生成包含多名角色、特定動作類型以及大量細節的複雜場景,而且AI不僅了解用戶 在提示詞所說的各種物體,還知道這些物體是如何存在於現實世界,進而營造出讓人驚豔的逼真感受。 看起來AI逐漸可以摸透人類的想法,然而這還是大量計算的結果,不是像人類直覺的反應。
不過令人擔心的是,AI已經侵入 人類的藝術工作層面。一般我們說科學的研究是邏輯推理,這種思考是「垂直思考」。電腦運算的速度很快,勝過人類,這 可以讓人類輸得心服口服。但是這種藝術類的範疇,屬於「水平思考」,不是直線邏輯的推理而是天外飛來一筆的想像。美 學的東西,現在電腦竟然可以做得這麼好,令人驚嘆。
然而仔細思量,藝術作品人類還是可以進行邏輯的解析,將其脈絡化,所以當電腦把訣竅寫入程式,也可以依樣畫葫蘆,做 出類似的作品,或甚至是創造出新鮮的東西,也令人不得不佩服。最近網路流傳一個故事,書法家孫大川寫了個對聯,右 聯:「酒二共識」,左聯:「一盅各表」,廣求橫批,一直沒人對得很好。沒想到上網詢問,ChatGPT居然回答對出了神橫 批:「合瓶共醇」,就像是神來之筆。
然而,這樣的發展,令人擔心的事就誠如我最近看到的一個段子,AI是不是發展錯方向?AI怎麼不是要幫我省卻工作上的辛 苦:倒垃圾、照顧小孩,反而是來搶走我的工作? 去年好萊塢的罷工,先是編劇抵制ChatGPT:抗議AI侵犯創作權益,後來又有編輯拒絕為ChatGPT產生的劇本草稿修改潤 飾,因為他們感覺這是為AI打工,雖傷害性不大,但侮辱性極強。
另外在日本, AI繪圖工具MIMIC也遭到繪師的集體抗 議,因為只要使用者上傳同一名繪師30幅以上的原創作品,給予 AI進行訓練後,接著MIMIC就能自動產出與該繪師藝術風 格相似的圖片。這不但衝擊到了繪師的商業利益,而且擔心有心人士透過MIMIC生成與他們繪圖風格相似的作品,接著在上 面加註偏激文字、濫用與散布,那麼網路上的人們又該如何分辨圖片和訊息的真假。
回過來說,目前Sora影片還是有些缺點,例如影片中的角色可能走過雪地,沒有腳印;可能咬了一口餅乾,之後餅乾卻沒有 咬痕。目前Sora對於光影的移動掌握還不夠精準,也還做不到準確描述一些物理作用的細節,比如人類手部的精巧動作,但 一般人可能不會注意到,相信未來這一定可以改進解決的。 我們應該要如何面對這樣的衝擊?由於晶片、程式、算力還在突飛猛進的發展,AI再來應該更是等比級數的進化。工作及智 財權的保障問題固然要解決,如何懂得駕馭新進的AI,善用它們來為人類工作,恐怕才是職場勝利者最該做的事。
「老高與小茉」這些YT(YouTuber)應該也很興奮,因為從此不用在素材庫裡找不太合適的影片,全部可以自主貼近主題 的生成。對於一般人,玩玩票,自己編個劇,就可以當導演,生成段影片,搞不好還可以找到自己被埋沒的天賦。至於我, 就等著Sora正式公布後,下個指令描述來生成影片,加入我的簡報,讓我的演講更加生動。(作者為中信金控首席經濟學 家、中信金融管理學院講座教授)