→ gtfour: 能用色圖生圖 去pixai就很簡單好用了 我畫好一堆圖都還沒05/15 00:00
→ gtfour: 空一一下載整理分類 是說pixai的生成圖片有什麼快速跳到以05/15 00:02
→ gtfour: 前畫好的圖的方法嗎?還是只能慢慢往下拉等它讀取 搜尋功能05/15 00:03
→ gtfour: 我也搞不懂要怎麼使用才會直接跳到我要找的日期05/15 00:04
推 Armour13: 只跑翻譯5070ti就夠了,翻譯沒有那麼吃資源。 生圖的話05/15 00:20
→ Armour13: 沒有要很高清的,5070TI 一分鐘也能跑一張吧05/15 00:20
→ Armour13: 你主要的問題是音檔轉文字,音聲很難轉的精準....05/15 00:21
→ Armour13: 跑日文作品翻譯的話,本地部屬Sakura模型,去機翻輕小說05/15 00:22
→ Armour13: ,把文本扔上去跑本地最簡單05/15 00:22
推 h0103661: 音聲很簡單,語音辨識whisper模型就能對八成了,而且線05/15 00:22
→ h0103661: 上服務沒擋這個,本地有張1060就能跑個tiny吧,新顯卡05/15 00:22
→ h0103661: 直接跑large turbo版本,轉出srt之後丟個google翻譯。05/15 00:22
推 h0103661: 生圖可以爬aI_art板,種類太多了很難一次講清楚05/15 00:24
推 a71245969: 現在Deepseek基本無甲,whisper後直接api翻譯就好05/15 02:32
→ a71245969: 本地翻譯Gemma 4 31b效果好,但q8要48gb vram05/15 02:33
推 a71245969: Whisperjav 可以試試看,github 本地用whisper加上qwen05/15 02:38
→ a71245969: 兩段式音轉文提高識別率後用deepseek理解上下文並翻05/15 02:38
→ a71245969: 譯05/15 02:38
推 a71245969: 澀圖二次元的話16gb vram夠用,目前主流是anima跟IL。05/15 02:44
→ a71245969: 你要三次元還有klein 9b,但最好是24gb vram以上才能爽05/15 02:44
→ a71245969: 用全部模型例如qwen image。要影片則24gb vram外最好05/15 02:44
→ a71245969: 至少64GB ram05/15 02:44
推 Tosca: 三次元其實IL和qwen image edit就夠了05/15 09:07
推 cmi5288: anime-whisper有針對喘息等微調,18+感覺有比較準05/15 11:03
→ cmi5288: 現在8G左右LLM翻譯已經很不錯了,轉譯有誤也會修正後翻譯05/15 11:04
推 Srwx: 純翻譯不太會擋 甚至直接丟R18音源要生出文本也可以05/15 13:27
感恩各位大神指點
大概總結就是
16gb vram 純文本翻譯 堪用沒問題
當然越高越好
音聲轉文字較難 且現有難以做到精準
但也有依靠線上服務的路 不見得要靠本地
我還有一個不懂的
好的模型越來越大?還是有機會越做越小?
圖片的部分
我忘記說明了
我喜歡的二次元圖片性癖
剛好是細節要求很高
美感需求也沒那麼油 那麼大眾的部位
例如頭髮髮質
斷面圖透視 私處
嘴唇 臉頰
非常重視眼角角度呈現不同性格差異
胸型則是要活生生的感覺
從貧到巨都很喜歡
就討厭標準化水球硬奶
大肢體 整體姿勢也是我的性癖
手指手形 足型也是我的主力性癖
不過 肢體動作 手形 足部的ai圖水準
在2025年底開始
我有感感受到整體品質大幅上升
不論是號稱真手繪還是一眼ai圖
就覺得我受到的推薦作品
足部 手部姿勢不帶基本錯誤很少
還符合我這種很挑惕的人的審美
以二次元戀足癖來說
2025上半年以前我還是苦於找不到夠格的好圖
26年今年年初就是好圖收到手軟
但我也不意外啦
因為足部動態再怎麼複雜
活動度就那個樣子
肢體 骨頭骨架加肉
三次元素材這麼多 ai要學會並不難吧?
現在我觀察很難克服的
就是形狀 型態最為複雜
嘴唇 臉 陰部
形狀 大致上就那個形狀
不同人細節差異卻極大
人類先天對面部長相敏感
陰部則是軟組織
因為三次元就算有素材 好看也不多
會不會間接影響到二次元的表現?
二次元打聖光的素材又佔了很大一部份
陰部的部分二次元畫得好的也很稀少
只是其中頂端的 ai遠遠比不上
我玩繪圖ai的可能性不高
真的玩的話會直衝冷門細節性癖
腋下明明是很簡單的性癖
不知為什麼現在腋下ai圖的上色還是普遍很油
※ 編輯: unlucky (89.187.187.77 美國), 05/15/2026 14:06:59
※ 編輯: unlucky (89.187.187.77 美國), 05/15/2026 14:09:13
推 vandervaal: 本地LLM能不能跑要看模型大小05/15 14:24
→ vandervaal: 我的4060 8GB可以順跑的等級在7b左右,但模型要量化05/15 14:24
→ vandervaal: 12b雖然還是能跑,但就算量化還是很勉強05/15 14:24
→ vandervaal: 生圖用的SDXL模型也是要量化過的才不會out of memory05/15 14:24
推 vandervaal: 文字生成的品質我就不太清楚了,以前只試過翻譯05/15 14:27
→ necrophagist: Sdxl bf16才6gb多而已 除非你是做upscaling沒開til05/15 14:34
→ necrophagist: ed decode 在建議解析度(1-1.5mp)下文生圖8g vram05/15 14:34
→ necrophagist: 是足夠的05/15 14:34
→ harryron9: LLM本質看顯存跟模型 有多大用多大 效果也遞增05/15 14:48
→ harryron9: 真的要用本地的話 最簡單的方案真的是mac05/15 14:48
推 guogu: 翻譯還是越大越好 雖然很多人說單機的也夠用05/15 15:43
→ guogu: 但是我用openrouter試各家的大模型翻譯亦有好壞05/15 15:44
→ guogu: 那種7B 1xB之類的還是翻得不太好 就是能看懂那樣05/15 15:45
推 Porops: 身為長期深度使用機翻看輕小說和玩遊戲的人提供一些建議05/15 22:41
→ Porops: 你的需求大概可以拆成幾個步驟,一是把ASMR拆成文本05/15 22:42
→ Porops: 這部份我不太有相關經驗,如上述推文你可以用Whisper試試05/15 22:42
→ Porops: 拆成文本後,就是把文本日翻中,你可以借用一些工具05/15 22:43
→ Porops: 這兩個都是讓你方便的把文本用AI日翻中的工具05/15 22:44
→ Porops: 可以試用一下選一個順手的05/15 22:44
→ Porops: 工具選擇好,就是選擇AI,我個人推薦三種方向05/15 22:45
→ Porops: 如果你想要最頂的翻譯效果,那沒什麼好說就是台上三大家05/15 22:45
→ Porops: 封閉的線上AI,你要想辦法越獄去翻譯,這有相當多的技術05/15 22:45
→ Porops: 門檻05/15 22:45
→ Porops: 第二是DeepSeekV4,我個人推薦的方案,你找不是中國架的05/15 22:46
→ Porops: DeepSeek AI幾乎都等同沒有限制,不用特別越獄就可以翻譯05/15 22:46
→ Porops: 你想要本地的話,VRAM不用多,12G夠了,找專門給日翻中ACG05/15 22:48
→ Porops: 特化過的AI,像是這些05/15 22:48
→ Porops: 我個人更推薦前兩個05/15 22:52
→ Porops: 如果想要加強翻譯效果,記得翻譯前要設定好術語表,這樣就05/15 22:52
→ Porops: 可以讓一些角色名詞統一,也能註釋給AI比方說角色的性別05/15 22:53
→ Porops: 只要不是甚麼奇怪的文本(像是輕小說會有揭示板那種文本)05/15 22:54
→ Porops: 基本上都可以翻譯的完全能懂,偶有人稱問題05/15 22:55
推 Porops: 台本是PDF的狀況,你找OCR AI解應該比較快05/15 22:57
→ Porops: 如果不是太複雜的PDF,直接找純OCR的程式應該也能解決05/15 22:58
→ Porops: 然後色圖生圖基本上就是花時間或花VRAM,沒時間的前提下05/15 22:59
→ Porops: 建議還是玩玩線上生圖AI就好'05/15 22:59
→ Porops: 需要花的心力很大05/15 22:59
推 promaster: 5070ti能讓你做到的還是很有限 不論llm/生圖/lora等05/16 00:04
都這程度了還是……
我捏到5070ti就是極限了
為了休閒用途上到5090 高vram
我不是富哥也沒工作用途更沒調教技術
問題很簡單了
就上面留言
音聲翻譯
可以藉由拆步驟 繞路 在線上可以解
色圖的部分我放棄了
因為我檢視自己的性癖和審美
對細節很刁鑽
我平常已經看很多手繪優質健全圖片
都運用不少美術技法呈現
不是商業油圖
吃慣了單圖的細糧
回頭看R18本子
我都只剩再看大分鏡和骨架 劇情氣氛
以我的個性 在提示詞和生成抽圖
會試很多次才會滿意
這時間
拿來搜集現成的頂尖ai圖 手繪圖有效多了
說到這裡
唉 現在是不是生圖的量快追過看圖的人了
每個人潛在產量變大
那麼繪師得到注意 和使用者搜尋的成本大增
你們有沒有覺得色色本的討論風氣沒那麼熱絡?
我們更容易滿足性癖
但也越不需要靠社群交流性癖
推 yeeouo: vram越大越好 沒有夠用一說 消費級顯卡離資料中心遇到sca05/16 01:08
→ yeeouo: ling law出現邊際效應超級遠 導致開源小模型參數規模變大05/16 01:08
→ yeeouo: 品質都是大幅提升05/16 01:08
推 Tosca: 5070ti生圖應該是綽綽有餘了啦 我mac mini都很夠用了05/16 09:11
※ 編輯: unlucky (138.199.35.8 美國), 05/16/2026 09:12:06
→ unlucky: Mac有什麼優缺?或者說你們是本來有Mac 05/16 09:12
→ unlucky: 發現順便能玩ai就試試看片 05/16 09:12
→ unlucky: 知道Mac的架構似乎是同樣容量cp值最高 05/16 09:14
→ unlucky: 但生態有沒windows+N卡主流還豐富 05/16 09:14
→ unlucky: 我以前幫人轉資料過 Mac外接硬碟格式不太一樣? 05/16 09:15
→ unlucky: 自身容量又很小 不接nas的話很頭痛? 05/16 09:15
→ unlucky: 我是很賭爛win11了 但收藏整理工具和大量資料和win綁定 05/16 09:16
→ unlucky: Mac mini比5070ti便宜 05/16 09:17
→ unlucky: Pro 也不錯了 24gb統一記憶體 05/16 09:18
推 Porops: 實際用過本地AI翻譯就知道了,之所以規模越大品質提升是 05/16 13:00
→ Porops: 因為大部分的通用模型都要支援多模態,要能夠應對你所有 05/16 13:00
→ Porops: 問題 05/16 13:00
→ Porops: 翻譯AI不用考慮這些,上面都是專精日翻中ACG,可以和你保 05/16 13:00
→ Porops: 證你找30B的本地模型絕對比不上這些14B甚至7B的效果 05/16 13:00
→ Porops: 個人都在自己拿來持續翻譯上千萬文字的網路小說,差距實 05/16 13:00
→ Porops: 在很明顯 05/16 13:00
推 a71245969: 欸樓上我有不一樣的觀點,現在Gemma 31b 這種多模態看 05/16 21:54
→ a71245969: 圖再翻譯會比純文字模型好 05/16 21:54
→ a71245969: 所以要看應用場景,漫畫類的用多模態模型翻譯質量已經 05/16 21:55
→ a71245969: 可以很通順又符合畫面劇情了 05/16 21:55
推 Porops: 我的應用場景自然是翻譯AI阿,你要整個多模態AI自然又不 05/17 01:19
→ Porops: 一樣比較了,那當然和我講的是完全兩回事 05/17 01:19
推 bor1771: 其實這些問題也可以問AI 05/17 14:32
→ unlucky: 我圖片類的全放掉了 真要玩就專心台本翻譯和聲音轉文字 05/17 20:13