天地自然人

 找回密碼
 立即註冊
查看: 1979|回復: 22

Strable Diffusion AI繪圖創作

[複製鏈接]
發表於 2023-2-27 11:12:09 | 顯示全部樓層 |閱讀模式
本帖最後由 觀心取慧 於 2023-2-27 11:13 編輯

最近「AI」一詞再度席捲全球,尤其是「ChatGPT」更是最為火熱的話題,無論是寫文章、小說、撰寫程式和一般生活瑣事都可以問「ChatGPT」雖然我沒有使用過,但根據媒體報導該功能似乎能夠接近滿足使用者的需求,而比較吸引我的是這套使用「Python」
開發且免費開源的「Strable Diffusion」AI繪圖程式,我使用的是本地安裝版本,有些是包裝好的懶人程式包安裝在Ggoole雲端硬碟。

預設版本是英文版,之後下載安裝中文化語言包,還是看中文比較能理解,這套開源程式的特色是利用「Python」大數據合成所需的圖畫,其實創作者本身並不需要實際作畫,使用方式是以「文生圖」或「圖生圖」功能輸入「正向關鍵字」和「反向關鍵字」再做一些設定上的調整既可自動生成圖畫,在此之前需要安裝各種採樣方法的「模型」這類模型各有特色例如模擬真人、二次元動漫、或其他類型的模型,由於我本身還摸不太熟這套程式,所以質量與功能設定方面在此就不多做討論了,以免造成誤導。

也許是歐美國人士開發的程式,自然是以該地文化和作者的思維開發,因此若以我而言對英文不熟,在輸入關鍵字的時候會產生很大的誤差,在想表達的語意方面對我而言是相當困擾的,還好也因這是套開源軟體,因此有大量的愛好者參與使用,所以網路上也就有許多可參考的高手資料,這些愛好者在發表自己的作品時也會附上關鍵字以及質量的設定等,那麼我們就可以參考這些高手的關鍵字再進行修改既可產生自己覺得理想的圖畫,這就是開源軟體的好處,不會被某開發商綁死。

但在著作權方面,我想若是在創作作品的時候使用的圖案或關鍵字是某藝人、或非開源下有版權保護的作品,就有可能侵犯著作權,所以我認為使用上還是需要注意這部份。

因為我本身喜愛動漫,包括二次元以及三次元3D等,所以也就被這套「Strable Diffusion AI繪圖程式」深深吸引了,果然美女還是最強的動力...XD,話不多說就來興賞最近的作品吧。

程式使用時的介面
上層.png

中.png

聲明: 以下都是「AI大數據」合成的圖像並非真人,若有雷同純屬巧合。

作品集

00082-549003033.jpg

00084-3442540830.jpg

00051-3961278222.jpg

00015-320007632.jpg

00078-4057693510.jpg


















00015-320007632.jpg
發表於 2023-2-27 12:41:33 | 顯示全部樓層
铺天盖地的 chatGpt
不要迷信AI,要迷信,就迷信chatGpt  背后那些将语法模块化的人,不是电脑。


 樓主| 發表於 2023-2-27 12:50:24 | 顯示全部樓層
ricejunshen 發表於 2023-2-27 12:41
铺天盖地的 chatGpt
不要迷信AI,要迷信,就迷信chatGpt  背后那些将语法模块化的人,不是电脑。

認同,這些程式開發者真的厲害。

 樓主| 發表於 2023-2-27 13:38:53 | 顯示全部樓層
續-「正向關鍵字」與「反向關鍵字」。

上篇文中有提到由於地方區域文化語言表達有所差異,以及這幾天使用下來的感想覺得雖然這套程式功能強大,而「AI人工智能」其實只是使用起來讓人感到方便和好像更親近於人類的想法以及更人性化的人機互動,但AI終究是「程式碼」拼湊而成的功能,其實並是真的那麼聰明,所以在關鍵字的方面必須要準確地強調某些特效場景等等,可是通常AI是分析大數據海量資料來獲得結果,開發者若沒特別設定篩選過濾的話,在輸入關鍵字的時候有非常大的機率出現裸體的畫面,且若不使用特別的關鍵字標註人臉特徵,出現的則都是歐美人孔,嚴格說起來這套程式應該列為18禁,但由於是開源軟體任何人都能下載使用,所以若家中有小朋友使用這套程式的話,家長可能要多加注意。

現階段採用的「正向關鍵字」,取材於網路分享加上個人修改。

「symmetrical,High detail RAW color photo professional close photograph, [:(highly detail face: 1.2):0.1], (PureErosFace_V1:0.8), (Close Up;CS), hair accessories, a medium hairstyle of bangs straight hair, pore, real human skin, exposed half breasts, the portrait of a 14yo childlike girl, (shiny eyes:1.1), Glazed, pupils, lying silkworm, sweet grin,(watching you, facing viewer), Cami Top, [Lace-Trim Bow:Cropped Tank Top:0.5],outdoors, depth of field, natural light, photographed with a Nikon Z7 II full frame mirrorless camera Camera (ISO100) (Aperture f/2.8),(8k RAW),Ultra-high resolution,」

Google 翻譯:

對稱,高細節RAW彩色照片專業近距離照片,[:(高細節臉:1.2):0.1],(PureErosFace_V1:0.8),(Close Up;CS),髮飾,劉海直發的中等髮型,毛孔, 真人皮膚,裸露的半乳,14歲童顏少女像,(閃亮的眼睛:1.1),琉璃,瞳孔,臥蠶,甜美的笑容,(看著你,面對觀眾),吊帶背心,【蕾絲蝴蝶結: Cropped Tank Top:0.5], 戶外, 景深, 自然光, 使用尼康Z7 II全畫幅微單相機拍攝 (ISO100) (光圈f/2.8),(8k RAW),超高分辨率,

說明:

這些正向關鍵字主要是取材於網路上的高手所公開的關鍵字,如上述所言我覺得應該是在地域文化語言方面的差異,例如我想表達一位年輕美貌的東方女性,但成年亞州人在外觀上看起來普遍小於歐美人,且若不特別標註某種臉孔特質的話,只會出現歐美臉孔,因此這句關鍵字「(PureErosFace_V1:0.8)」是某位網路上的高手所想出來的,這個關鍵字可以表達東方女性臉孔,另外 「the portrait of a 14yo childlike girl,」這句是「14歲童顏少女像」,如同剛形容的亞州與歐美人,年齡在外觀上的差異,如果將14歲改成18或24歲,出現的結果則會比理想的年齡層更為年長,在這種年齡設定也經常呈現小朋友的臉孔,因此這套程式是隨機呈現結果的,也必須要不斷的修改關鍵字以及質量的設定,所以AI確實可以做到功能強大,但並不是真正聰明具有真人的智慧。

在這關鍵字有趣的地方是,這幾天使用下來發現無論想繪製什麼,還是得具備美術、藝術、攝影、繪畫等觀念技巧才能得心應手,例如「(Close Up;CS) 特寫」、「 景深」、「 自然光」、「 使用尼康Z7 II全畫幅微單相機拍攝 (ISO100) (光圈f/2.8)、(8k RAW)」、「超高分辨」率等等的關鍵字,也是這幾天爬文才發現可以這樣設定的,在繪製人物特寫時,簡直像是位專業的攝影師拿著相機設定拍一位模特兒。

「反向關鍵字」直接取材於網路分享。

nsfw,nude,nipples,plant,full_body,bad_prompt_version2,day,sunlight,long hair,(disabled body:1.1),(closed eyes:1.2), missing hand, missing arms,back to viewer, extra limbs, extra arms, extra hands, extra fingers, extra legs, extra digit, deformed limbs, deformed arms, deformed hands, deformed fingers, deformed legs, deformed digit, malformed limbs, malformed arms, malformed hands, malformed fingers, malformed legs, malformed digit, fused limbs, fused arms, fused hands, fused fingers, fused legs, fused digit, mutated limbs, mutated arms, mutated hands, mutated fingers, mutated legs, mutated digit, mutilated limbs, mutilated arms, mutilated hands, mutilated fingers, mutilated legs, mutilated digit, fewer limbs, fewer arms, fewer hands, fewer fingers, fewer legs, fewer digit, disconnected limbs, disconnected arms, disconnected hands, disconnected fingers, disconnected legs, disconnected digit, missing limbs, missing arms, missing hands, missing fingers, missing legs, missing digit, poorly drawn limbs, poorly drawn arms, poorly drawn hands, poorly drawn fingers, poorly drawn legs, poorly drawn digit,child, child like,

Google 翻譯:

裸體,乳頭,植物,全身,白天,陽光,長發,(身體殘疾:1.1),(閉眼:1.2),缺手,缺胳膊,背對著觀眾,多出的肢體,多出的胳膊,多餘的手,多餘的手指,多餘的腿,多餘的手指,畸形的肢體,畸形的手臂,畸形的手,畸形的手指,畸形的腿,畸形的手指,畸形的肢體,畸形的手臂,畸形的手,畸形的手指,畸形的腿,畸形的手指,畸形的肢體 , 融合的手臂, 融合的手, 融合的手指, 融合的腿, 融合的手指, 變異的肢體, 變異的手臂, 變異的手, 變異的手指, 變異的腿, 變異的手指, 殘缺的肢體, 殘缺的手臂, 殘缺的手, 殘缺的手指, 殘缺的腿, 殘缺的 數字,肢體減少,手臂減少,手減少,手指減少,腿減少,手指減少,四肢斷開,手臂斷開,手斷開,手指斷開,腿斷開,手指斷開,四肢斷開,手臂斷開,手斷開,手指斷開, 缺少腿,缺少數字,四肢畫得不好,手臂畫得不好,手畫得不好,手指畫得不好,腿畫得不好,數字畫得不好,孩子,孩子喜歡,

可以發現「反向關鍵字」顧名思義就是與原本正「向關鍵字」提出相反的句子來過濾排除差異,也可以看到排除了裸體、乳頭以及小孩等等的反向關鍵字,但如同方才所言,AI並不是真的那麼聰明,雖然具體的寫了那麼多的反向關鍵字想排除不想出現的結果,但圖像產生是隨機的,還是有非常大的機率出現裸體、肢體變形、多手多腳等等的畸形圖像。

 樓主| 發表於 2023-2-27 14:18:43 | 顯示全部樓層
續-Strable Diffusion 二次元系列。

Stable Diffusion 在二次元繪圖方面表現也相當亮眼。

00225-4189165683.jpg

00228-4189165686.jpg

00230-1707222633.jpg

00049-1663866656.jpg

00043-445190492.jpg




發表於 2023-2-27 18:21:31 | 顯示全部樓層
哇哩!畫得超棒-----我英文不好,真是不知道如何下手,只能從最簡單的軟體來應用。

發表於 2023-2-27 19:18:39 | 顯示全部樓層
張開基 發表於 2023-2-27 18:21
哇哩!畫得超棒-----我英文不好,真是不知道如何下手,只能從最簡單的軟體來應用。 ...

AI繪畫真的太強悍了! Stable diffusion 配合 ControlNet 骨架分析,輸出的高清大圖讓我大吃一驚! !附安裝使用教程 | 零度解說



剛好看到這篇,我有空也來玩玩看

 樓主| 發表於 2023-2-27 20:10:02 | 顯示全部樓層
本帖最後由 觀心取慧 於 2023-2-27 20:30 編輯
張開基 發表於 2023-2-27 18:21
哇哩!畫得超棒-----我英文不好,真是不知道如何下手,只能從最簡單的軟體來應用。 ...


哈哈!謝謝張大誇讚,只是「AI大數據」的合成圖啦,並沒有真正作畫的技術,這套程式在創作者本身只需要提出想法就可以完成一副畫像,是很輕易能夠上手的,我本身英文也相當差,只能參考網路創作高手的關鍵字再透過Google翻譯來修改關鍵字,看是否能呈現自己理想的模樣而已,要是自己摸索恐怕不知道要摸到甚麼時候...

原本想說這套開源的「Strable Diffusion AI繪圖程式」很容易產出18禁的內容,因此原本不打算將安裝方式寫出來,讓有興趣的朋友自行到網路搜尋,但考慮之後覺得還是分享給大家一些安裝與設定的教學網站好了。

若想使用這套AI繪圖程式繪製精緻的圖像,相對的電腦硬體的需求也需要一定的水準,恰巧去年購買了一台「ASUS ROG Strax G17」電競比電,因此才能繪製出這些圖像。

Ivon的部落格
https://ivonblog.com/posts/windows-stable-diffusion-webui/

萌芽綜合天地論壇
https://mnya.tw/cc/word/1886.html

中文化程序

萌芽綜合天地論壇
https://mnya.tw/cc/word/1887.html





 樓主| 發表於 2023-2-27 20:13:28 | 顯示全部樓層
ppp0600 發表於 2023-2-27 19:18
AI繪畫真的太強悍了! Stable diffusion 配合 ControlNet 骨架分析,輸出的高清大圖讓我大吃一驚! !附 ...

真的...

要能夠做到視頻裡頭的水準需要更專業的攝影、人體繪圖、等等的藝術專業技能與知識,網路上有許多令人歎為觀止的作品,在人物各項細節的精細設定中已經無法分辨是否為真人了,由於自己本身的相關專業知識不足,頂多也只能如本文所分享的圖片成果了,持續的來探索。

 樓主| 發表於 2023-2-27 21:08:24 | 顯示全部樓層
續-瑕疵的作品與硬體需求建議。

在產生的圖像後也很常出現瑕疵作品,如現在所呈現的是一張女孩臉部特寫,要將女孩特寫照片呈現臉部精緻需要使用更精確具體的關鍵字,在關鍵字方面我覺得似乎越少越簡單具體越好,好像這樣「AI」在統計資料的誤差也相對的會減少而降低計算機的負荷,減少出現瑕疵作品的機率,我現在才意識到我前面發表的關鍵字並非我所分享的圖案所需的關鍵字,那些關鍵字是現在這張圖使用的上半身近距離特寫像的關鍵字,由於這幾天畫了許多圖,修改了許多關鍵字,自己都已經昏了想呈現怎樣的圖像要用哪種關鍵字了。

原始圖像眉毛成了有些像一眉道長了...。

00087-3829084157.jpg

使用「局部重繪」的功能進行第一階段修飾。

00047-2227646594.jpg

經過多次修改與多種眉型關鍵字的增減之後。

00072-789124554.jpg

其實我覺得第二張已經不錯了,第三張只是想呈現採用不同眉型的效果。


最後若想要使用「Strable Diffusion AI繪圖」繪製精緻圖像,在硬體要求方面極高,否則無法繪製高品質精緻圖像外還會經常「閃退」,本身是用電競比電作為平台,諸元如下,若桌機的話在紅字的部份也可參考這些等級之上的硬體設備,這套程式相當吃重顯卡,也因為高解析4K或8K圖像的檔案也頗大,在傳輸速率與容量也需要較高的需求,處理器也是很重要的部份,要開line、多開Google查資料,同時要AI電繪又要聽音樂看是頻的多工需求,我會建議使用AMD Ryzen 4 / 8核16緒以上或更高階的CPU。

電競筆電

ROG Strix G17 (2022) G713

作業系統

Windows 11 Home

處理器

AMD Ryzen™ 9 6900HX Mobile Processor (8-core/16-thread, 20MB cache, up to 4.9 GHz max boost)

顯示卡

NVIDIA® GeForce RTX™ 3070 Ti Laptop GPU
ROG Boost: 1460MHz* at 150W (1410MHz Boost Clock+50MHz OC, 125W+25W Dynamic Boost)
8GB GDDR6

記憶體

原本標配16G 購買時加到 32GB DDR5-4800 SO-DIMM

硬碟

1TB PCIe® 4.0 NVMe™ M.2 SSD

自行另加一條 512G 4.0 PCIe® 4.0 NVMe™ M.2 SSD






您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

快速回復 返回頂部 返回列表