從文字工作者的觀點分享如何與生成式AI一起工作?

by 小奏

Those who can imagine anything, can create the impossible.

—— Alan Turing

文字生成式AI「ChatGPT」崛起,是近期非常火紅的話題焦點,甚至許多人在討論這會不會是人類文明的奇異點提早到來了。

我第一次接觸生成式AI是在去年使用Midjourney產出小說插畫要用的場景圖,不到1分鐘的產圖速度,實際應用性也很高,當時讓我和合作繪師都大感驚豔。

目前我也還在摸索如何使用AI工具輔助內容產出,不過從Midjourney到最近的ChatGPTNew Bing,網路上正反論點爭論不斷,我除了想分享這半年與AI的協作心得外,也想談談我對AI發展所抱持的態度與觀點。

因此,這篇的重點會聚焦在我使用生成式AI的心得,以及探討目前AI在內容創作上的應用可能性。下一篇也想聊聊AI生成物的版權問題,以及觀察AI可能會對文字工作者產生哪些影響,還有我預計如何調整自己的創作方式去迎接AI即將帶來的衝擊。


A smartphone screen displaying the OPEN AI LOGO.
Photo by Levart Photographer on Unsplash

生成式AI的發展到底會有多快速?

談到AI的歷史,最早可以追溯到遠古以前的神話,傳說中優秀的工匠可以製作出擁有高度智能的人造人,而這樣的觀念一路發展到現代,科學家以機械和數理邏輯推演出計算機科學,其實都在在顯示了人類對於製作人造大腦的渴望。

直到21世紀,AI的發展進入了深度學習與大數據的階段,推動圖像及文本分析等研究,也滲透到各種領域。

目前AI比較常見的原理技術

深度學習(Deep Learning, DL)

使用類似於人腦神經元之間連接的數學模型,叫做類神經網路。

透過大量的數據訓練,讓AI自行學習和找出規律,做出正確的決策,能讓人工智慧自我學習並提高準確性。

強化學習(Reinforcement Learning, RL)

透過給予AI獎勵和懲罰來引導其學習,讓AI能夠自主探索並優化行為,廣泛應用於遊戲AI、機器人、自動駕駛等領域。

自然語言處理(Natural Language Processing, NLP)

透過機器學習等技術來解讀和理解自然語言的結構和語義,可以處理文本分類、機器翻譯等多種任務。

大型語言模型(Large Language Models, LLM)

利用大量文本數據訓練出來的模型,能夠自動學習自然語言的結構和語法規則,並且能夠生成與原始文本相似的新文本。這種模型可以更廣泛地應用於語言翻譯、文本摘要、問答系統等,也是自然語言處理技術的其中一種應用。

綜觀上述生成式AI的運作原理及使用的技術,我們可以得知AI擁有不斷進步的能力,而且內容生成的速度比人類還快,即使現在你會覺得AI生成的東西應用度不高,但或許幾年後就不會這麼想了。

生成式AI的高度發展不僅可能取代現有重複性質比較高的作業流程,還很可能會像工業革命和網路誕生時一樣,逐步改變人類的生活與工作型態。


Photo by DeepMind on Unsplash

現階段如何使用生成式AI輔助產出?生成式AI的應用性有多高?

目前生成式AI除了包含上面提到的技術之外,其實還有更多技術組合,例如:

生成對抗網路(Generative Adversarial Network, GAN)

屬於深度學習技術的一種,用於生成逼真的圖像,及語言生成模型。

GPT-3(Generative Pre-trained Transformer 3)

利用深度學習技術訓練出來的自然語言處理模型,透過大量的訓練數據,自動學習語言之間的關聯性和概念,可以根據輸入的提示生成相應的文本。


Photo by Jonathan Kemper on Unsplash

我使用生成式AI的心得,主要可以分成三大類:

繪圖生成式AI|Midjourney

首先來聊聊我去年第一個接觸的繪圖AI,一公開就造成轟動,同時也爭議不斷的Midjourney,只要輸入文字指令,就能讓AI依照描述計算出圖像。

回想當時我正逢撰寫小說比賽稿的時期,除了專注寫出有趣並引人入勝的故事之外,我也很在乎小說封面及插圖是不是足夠吸引人。

委託繪師繪製小說封面及插圖,不論是對作者還是繪師來說都是需要耗費大量時間與精力的過程。

但是使用Midjourney不到5分鐘就能生成堪用的圖像,且還能進行微調(例如合成)或是進一步計算,讓生成出來的圖像更符合創作者的想像與期待。

由於Midjourney在於版權方面,以及是否影響繪師發展的議題上充滿爭議,考量到繪師的觀點以及商業用途,當時我的做法是先和合作繪師討論,確認繪師本身並不排斥在作業上使用AI輔助,我才訂閱可商用的方案,計算多張小說場景圖提供合作繪師參考及應用。

我與合作的繪師都是業餘創作者,平日有其他工作需處理,能撥出來創作的時間有限,也可能是因為如此,讓我們對於AI繪圖都抱持著樂觀的態度。

不過我們和AI的合作方式,目前主要還是以計算「場景圖」為主,因為Midjourney對人物的生成成果還不太能拿來應用(例如常常算出來的圖會五官微妙或是手指數量有誤等等)。

Midjourney計算出的人物圖

此外,更重要的是一張小說封面及插畫的誕生,需要作者與繪師之間進行無數次的溝通,才能協調出彼此理想中的畫面,加上人類有主客觀的想法,即使不斷溝通都還是有可能漏接,讓不具備人性與意圖性的AI達成心目中的要求其實是很困難的事。

因此,在創作方面,我認為AI能做的只是讓這個過程更有效率,例如可以「快速激發靈感」、「提供構圖參考」或是生成一些「輔助圖」等。

這也是我不認為AI繪圖會那麼輕易地取代繪師的原因,我與合作繪師聊過,他目前也沒有這個擔憂,反而也很樂見AI能為美術工作帶來什麼樣的發展。

↑ Midjourney計算出的場景圖

↑ 繪師使用AI場景圖所繪製的插畫


文字生成式AI|ChatGPT

使用Midjourney不到半年,就看到ChatGPT橫空出世,席捲人類社會,各大社群都在討論,如果說前幾年是元宇宙元年,那現在要說是進入生成式AI元年也不為過吧?

身為文字工作者,我已經開始使用ChatGPT輔助工作了,以我目前的使用經驗來說,ChatGPT現階段能生成的文字內容並無法直接使用。

我通常會請ChatGPT給予文章架構、內容改善的建議,或是請他抓錯字,畢竟創作者對於自己產製的內容多少會有盲點,一般小說需要編輯建議,譯文需要校稿及潤稿,因此AI對我來說是能夠幫忙揪錯,和幫助我從其他角度進行思考的協作夥伴。

除了上述工作比較常應用到的方式之外,因為最近和朋友們組成了遊戲開發群組,作為一個人數不多的小團隊,我也開始尋求能減輕工作量並提升效率的各種可能性,其中之一就是測試ChatGPT生成角色對話,結合自動回覆的技術或許能做出有趣的遊玩方式,不過結果⋯⋯還不是太理想。

可能傲嬌屬性太難了

在調整指令的過程讓我發現如果要發揮AI的功能,理解AI的運作原理大概就是最重要的前提了,目前還不能以太直覺的指令去訓練AI,有點類似寫一道程式讓AI去跑,需要給予發言規則、行為目的與獎勵,並時刻提醒AI融入角色設定。


最後,因為聽說ChatGPT能生成可用的外文書信內容,因此我也實測了一下,先說結論,成果很不錯!

雖然依照過往我與日本人的書信往來經驗,其實通信雙方是能從書信中感受到情緒的(不過這也是因人而異),加上日文又是語意曖昧,可以藏匿許多心思的語言,在商場上尤其難以捉摸,往往必須站在對方的立場去猜測想法才能讓彼此合作更順利,這點我真的也滿難想像不具備人類複雜心理的AI能夠辦到,當然未來AI會有什麼樣的進展一切都很難說。

但是,現階段AI能夠透過指令快速產出可參考的信件模板,對忙碌的獨立工作者來說,我覺得是一大福音,大多數時候可以參考模板再依據場合去修改內容,少了從零開始的時間,也多了雙重檢查的機會,減少錯字及誤用文法的情形,可以讓寫信效率提升不少。

黃色劃線處為AI誤用法規的情形
使用日文指令的生成更精確

音樂生成式AI|ecrett music

前面有提到因為遊戲團隊的開發需求,我開始尋找及測試能夠減輕工作負擔的各種工具。

一款遊戲除了需要程式、美術及故事之外,音樂及音效也是十分重要的一環,我們的團隊中目前並沒有音樂工作者,因此原本預想在開發時會有兩條路,一是尋求外包,二是學習自製。

有充分資金及時間的話,外包會是最優先的選擇,畢竟能夠透過充分溝通去協調出最適合的音樂及音效作品。但是,外包的花費相對高,要找到合適的接案者可能也需要不少時間去磨合。

再來是自製,可以從學習編曲軟體開始,但是自學可能也需要花費不少時間與金錢,而且更難預測實際成本及成果。

最近因為AI的話題不斷,於是我也開始將作曲工具鎖定在AI身上,一查資料才發現,AI作曲早在前年就有討論熱度了,到了現在已經出現不少厲害的音樂生成式AI。

我先選擇了和ChatGPT一樣入門門檻比較低的ecrett music,不須登入,就可以直接在網頁上製作,試用下來讓我開始忍不住懷疑平常自己在串流平台收聽的Lo-Fi歌單,該不會有很多曲子都是AI製作的吧⋯⋯

ecrett music可以選擇曲風,並簡易調整樂器,不到1分鐘就能產製一首符合風格需求的音樂,雖然如果要實際應用的話,需要更多調整空間和指令需求,但這些或許在付費版或是結合其他作曲工具就可以辦到,除此之外,其他也還有很多功能更豐富的音樂生成式AI可以選擇。

ecrett music的操作介面

以前替小說製作宣傳影片,或是拍簡單的Vlog,常常會在找免費音樂資源的時候碰壁⋯⋯但是現在使用AI生成音樂,只要查明商用範圍就可以比較不用擔心版權問題了。


Photo from Canva

小結

AI的生成成果在版權方面還有很多問題值得探討,而且也需要更多時間去觀察對人類社會的影響以及將來法律規範會如何應對,這部分我預計會在下篇文章繼續討論。

新觀念或新技術的誕生往往伴隨著許多爭議與焦慮,不過我一直都是抱持著樂觀與開放的態度在看待,甚至對於能夠探索未知事物,或見證人類歷史與文明的新篇章感到期待。

人心是複雜的,再好的技術都有可能被濫用,例如利用AI讓假消息變得更猖獗更難以防範,所以認識與學習AI除了不讓自己被時代的洪流給淹沒之外,更是一種自我保護的方式,當人們願意花心思去理解及思考,掌握越多的時候,就越不容易陷入無能為力的困境,也能盡量避免讓AI被有心人士帶往不好的方向發展。

之後我也會針對更多不同類型的AI去分享使用心得和實際應用經驗,如果大家對AI的議題有興趣,也歡迎讓我知道,我會撰寫更多這個主題的文章。


Photo from Canva

留言

You may also like