ComfyUI Tutorial Series
Вивчаю ComfyUI по цим туторіалам ComfyUI Tutorial Series
Ep01 - Introduction and Installation
Ep02 - Nodes and Workflow Basics
Ep03 - TXT2IMG Basics
Ep04 - IMG2IMG and LoRA Basics
Ep05 - Stable Diffusion 3 Medium
Ep06 - Get 300 Free Art Styles
Ep07 - Working With Text - Art Styles Update
Ep08 - Flux 1: Schnell and Dev Installation Guide
Ep09 - How to Use SDXL ControlNet Union
Ep10 - Flux GGUF and Custom Nodes
Ep11 - LLM, Prompt Generation, img2txt, txt2txt Overview
Ep12 - How to Upscale Your AI Images
Ep13 - Exploring Ollama, LLaVA, Gemma Models
Ep14 - How to Use Flux ControlNet Union Pro
Ep15 - Styles Update, Prompts from File & Batch Images
Ep16 - How to Create Seamless Patterns & Tileable Textures
Ep17 - Flux LoRA Explained! Best Settings & New UI
Ep18 - Easy Photo to Cartoon Transformation!
Ep19 - SDXL & Flux Inpainting Tips with ComfyUI
Ep20 - Sketch to Image Workflow with SDXL or Flux!
Ep21 - How to Use OmniGen in ComfyUI
Ep22 - Remove Image Backgrounds with ComfyUI or Photoshop
Ep23 - How to Install & Use Flux Tools, Fill, Redux, Depth, Canny
Ep24 - Unlock Flux Redux & Inpainting with LoRA
Ep25 - LTX Video – Fast AI Video Generator Model
Ep26 - Live Portrait & Face Expressions
Ep27 - Photo to Watercolor, Oil & Digital Paintings – Workflow
Ep28 - Create Flux Consistent Characters + Train Loras Online
Ep29 - How to Replace Backgrounds with AI
Ep30 - Game Design with AI and Photoshop
Ep31 - ComfyUI Tips & Tricks You Need to Know
Ep32 - How to Create Vector SVG Files with AI
Ep33 - How to Use Free, Local Text-to-Speech for AI Voiceovers
Ep34 - Turn Images into Prompts Using DeepSeek Janus Pro
Ep35 - How to Run ComfyUI in the Cloud
Ep36 - WAN 2.1 Installation – Turn Text & Images into Video!
Ep37 - LTX 0.9.5 Installation, Images to Video Faster Than Ever!
Ep38 - Bring Portraits to Life! Talking Avatar with Sonic
Ep39 - Using WAN 2.1 with LoRAs for Wild Effects: Squish, more
Ep40 - TeaCache: Speed Up Your Workflows with Smart Caching
ComfyUI Tutorial Series Ep 31: ComfyUI Tips & Tricks You Need to Know
ComfyUI Tutorial Series Ep 32: How to Create Vector SVG Files with AI
ComfyUI Tutorial Series Ep 33: How to Use Free & Local Text-to-Speech for AI Voiceovers
001.flac
002.flac
003.flac
004.flac
005.flac
006.flac
007.flac
008.flac
009.flac
010.flac
011.flac
012.flac
Ці звуки я створював у ComfyUI, за допомогою ComfyUI Kokoro. В цих звуках поки немає емоцій.
ElevenLabs: British Radio Host Storyteller: David.mp3
ElevenLabs: British Radio Host Storyteller: Alice.mp3
ElevenLabs: British Radio Host Storyteller: Grandpa.mp3
ElevenLabs: British Radio Host Storyteller: Callum.mp3
Ці звуки я створював на сайті https://elevenlabs.io
Вони мають людські емоції в голосі.
На сайті добре генерується текст, але для вибору певних голосів потрібна платна підписка.
Я бачу до десяти безкоштовних голосів, інші платні. Є різні налаштування для голосу.
На сайті голос може розуміти зміст тексту і передавати інтонації в голосі.
Наприклад, говорити зі сміхом, кричати, передавати злість, спілкуватися романтично,
спеціально заїкатися та передавати інші емоції.
Голоси на сайті дуже природні та передають емоції в порівнянні з голосами у ComfyUI.
ComfyUI Tutorial Series Ep 34: Turn Images into Prompts Using DeepSeek Janus Pro
ComfyUI Tutorial Series Ep 35: How to Run ComfyUI in the Cloud
ComfyUI Tutorial Series Ep 36: WAN 2.1 Installation – Turn Text & Images into Video!
Я генерував цю дівчинку в епізоді 28.
Генерував відео з цією дівчинкою по промпту:
A cute cartoon girl with purple hair walks slowly along a sunlit wooden path surrounded by sunflowers. She smiles warmly, her gait graceful and natural. The scene is bright, colorful, and cheerful, with gentle camera movement following her steps.
Дівчинка замість руху вперед рухається назад, намагається зробити місячну ходу. Можна зробити інверсію анімації.
Але рух фігури, міміка обличчя добре проанімовані, є об'ємні рухи рук, голови та інших частин тіла. Тіні на дівчинці та від неї також є, є невелика анімація листя. Анімація виходить живою, природною.
Я генерував це відео 960x960 16fps 3 секунди на wan2.1-i2v-14b-720p-Q4_0.gguf, на локальному сервері ComfyUI.
Генерація тривала 2 години 33 хвилини. Дуже довго.
Я знаю що можна генерувати у хмарі, це буде набагато швидше, я тестував як генерує це у мене на комп'ютері у ComfyUI.
Можна використовувати інші платні сайти для генерації графіки, буде швидко генеруватись.
Коли я виконував цей урок, були інші чекпоїнти wan2.1, з'явився wan2.2, а також я не дійшов до ноди TeaCache, яка набагато прискорює генерацію у ComfyUI, про це автор розповість у наступних епізодах.
У цій анімації під час руху дівчинки не рухається сцена, крок дівчинки ковзає на місці. Камера не супроводжує дівчинку.
В уроці 40 я генерував різні відео з цією дівчинкою та іншою жінкою і враховував це у промпті.
ComfyUI Tutorial Series Ep 37: LTX 0.9.5 Installation – Images to Video Faster Than Ever!
LTX V0.9.5 відео можна створювати коли немає складної анімації, коли анімація середнього рівня за якістю в механіці рухів.
Така анімація генерується набагато швидше ніж Wan, але гірша якість анімації.
Ці LTX V0.9.5 відео 768x512 4 секунди у мене у ComfyUI на комп'ютері генерувалися за 3 хвилини 33 секунди.
У хмарі буде швидше, про це автор розповідає в епізоді 35.
Ці відео згенеровані за текстовим промптом без зображень.
Тут використовується вхідне зображення дівчини та текстовий опис до анімації:
"A cinematic close-up shot of a cyberpunk-style woman with vibrant purple hair styled in loose braids. She looks directly at the camera and slowly smiles, her expressive eyes reflecting the glow of neon lights. The soft, atmospheric lighting highlights her smooth skin, while the blurred cyberpunk cityscape in the background glows with blue and pink hues. Her brass steampunk goggles rest on her head, complementing her black leather jacket adorned with metallic details. The shot is slow and cinematic, capturing subtle facial movements—her eyes slightly narrowing, lips gently curving into a warm, confident smile, and a soft blink adding realism to the moment."
У LTX V0.9.5 відео на розмірі 768×512 є дефекти, наприклад, погано промальовані очі, вії, зуби.
Є задані розміри відео, які можна використовувати у генерації. Є квадратні, 16:9, 3:2, 2:3. Краще не використовувати більше 720x1280=921600. Тобто максимальне рекомендоване значення 960x960 для квадратних відео. На відео з іншими пропорціями сторін можуть бути збої.
Відео з цією анімацією повороту голови дівчини розміром 768×512 5 секунд генерувалося близько 2 хвилин.
Хоча в рекомендації не вказано великих розмірів, я вирішив протестувати і збільшити вдвічі розмір.
Згенерував 1536×1024 5 секунд за 24 хвилини 25 секунд на комп'ютері.
Вийшло вдале відео без збоїв: очі, вії, зуби чітко промальовані, немає таких дефектів, які були на 768×512. Такому відео можна зробити ресайз вдвічі зменшити до 768×512 і не буде дефектів.
Але волосся не деталізоване, відео виглядає трохи розмитим.
На момент проходження цього епізоду я не знав про TeaCashe, автор розповідає про це у 40 епізоді.
Вже після 40 епізоду коли я додавав цей матеріал на сайт, я тестував LTX V0.9.5 на розмірах більше рекомендованих, генерував на 1536×1024 і також робив генерацію з нодою TeaCashe.
Нода TeaCache, яку автор показує в епізоді 40 для LTX V0.9.5, не дала позитивного результату, відео з дефектами, розмитими ефектами. Швидкість генерації відео 1536:1024 14:20, порівняно з 24:45 без ноди TeaCache, але відео не підходить.
Я генерував цю дівчинку в епізоді 28.
Тестував на LTX V0.9.5 як буде виглядати анімація ходи цієї дівчинки.
Анімація не якісна, є збої, дівчинка рухається, але ноги ледве рухаються, у тілі немає динаміки, трохи зрушуються руки, але саме тіло не анімується. При цьому камера рухається разом із дівчинкою, домальовується місток та нове оточення правильно.
Швидкість генерації відео на LTX V0.9.5 набагато вища ніж на Wan, 1024x1024 5 секунд вийшло за 7 хвилин, 20 секунд.
В LTX V0.9.5 є можливість задати початковий і кінцевий карди. Можна зробити багато кадрів, роблячи складні сценарії.
У LTX можна задавати по кадрах послідовність анімації, таким чином генеруватиметься вся анімація по цих кадрах і опису. Ідея гарна, але на прикладі кролика, який виходить з будиночка-гриба видно, що двері відчиняються з дефектами і кролик промальовується також розмито.
На прикладі падіння каменю в авто видно також дефекти, коли камінь довго лежить на машині, потім йде дим, а потім продавлюється машина. Можливо автор неправильно налаштував час або потрібно було зробити кадри з димом, коли камінь уже провалився в авто, оскільки момент продавлювання каменем в авто дуже короткий, порівняно з появою диму.
Це відео 1056x704 5 секунд на LTX 0.9.5 у мене згенерувалося за 10 хвилин 22 секунди.
Відносно непогана анімація, миготіння очима, інші анімації, правильний розворот голови робота в просторі.
ComfyUI Tutorial Series Ep 38: Bring Portraits to Life! Talking Avatar with Sonic
VoiceMan.mp3
VoiceWoman.mp3
VoiceCartoonMan.mp3
Для генерації таких відео з ліпсинком у ComfyUI потрібна відеокарта від 20 Gb.
Я тестував генерацію відео 576x1024 5 секунд на своїй відеокарті 12 Gb,
у мене вийшло згенерувати за 1 годину 15 хвилин.
Я тестував фотографії людей, брав по 30-40 секунд пісню іншою мовою, генерував відео у хмарі.
Можна різними мовами робити ліпсинг, генерував відео по одному зображенню і людина правильно співала.
ComfyUI Tutorial Series Ep 39: Using WAN 2.1 with LoRAs for Wild Effects! (Squish & More)
У цьому уроці я використав додаткові Lora на Wan2.1 14B 480p I2V для генерації відео з ефектами: здавлювання пальцями, надування, розрізання ножем торта, обертання, здавлювання пресом, показ м'язів.
Wan2.1 14B 480p I2V LoRAs
Але не всі відео генерувалися правильно з першого чи навіть багатьох спроб.
Наприклад, акуратно здавлювати пальцями зайчика щоб виходив комок, який декілька разів закручують і здавлюють, вдала генерація вийшла з другої спроби.
При надуванні зайця він з першої спроби не полетів нагору, нахилився і впав, друга спроба вийшла вдалою.
При розрізанні ножем були невдалі спроби, з'являлися неправильні частини торта, що розрізали, також ніж був дуже чорним, ніж міг відрізати по одному контуру, а потім коли ніж рухався, змінювався інакше розріз.
При здавлюванні пресом він міг не потрапляти чітко на предмет і криво його здавлювати.
З'являвся ефект води після стискання, який я не планував побачити.
При обертанні навколо своєї осі предмети вдало оберталися,
людину та машинку правильно обертало з першого разу, заєць один раз нахилився вперед, з другої спроби вийшло правильно обертання зайця, він не падав.
Відео, де людина показує м'язи вдало згенерувалося, щоразу різні ідеї.
Коли я робив відео стискання пальцями для козеня, руки постійно виконують неочікувані дії: хитають кролика, козеня, не так його тримають, погано здавлюють, закручують інакше, стискають двома руками, смикають пальцями за голову. Результати стискання дуже відрізняються від очікувань.
Я намагався згенерувати показ м'язів у кролика, як робив автор.
Але щоразу виходили збої. То дуже просто промальовувалися м'язи, як у стилі 2d графіки, то голова відлітала.
ComfyUI Tutorial Series Ep 40: TeaCache – Speed Up Your Workflows with Smart Caching
У цьому уроці автор розповів про ноду TeaCache, яка дозволяє на Wan2.1 значно прискорювати генерацію відео, цю ноду можна також застосовувати для генерації графіки, результати незначно відрізняються за однакових seed, але швидкість генерації вища.
На цих зображеннях з котом варіанти з двома однаковими seed без ноди TeaCashe та з нею.
Швидкість генерації без ноди TeaCashe 1024x1024 у мене за 82 секунди з нодою TeaCashe за 48 секунд.
Відмінності у зображенні несуттєві. Це генерація на комп'ютері, у хмарі буде швидше і також з нодою TeaCashe швидше.
В минулому епізоді автор розглядав 6 LoRa анімаційних ефектів, але по лінку Wan2.1 14B 480p I2V LoRAs є 49 моделей.
У цьому уроці я багато тестував з генерацією відео на Wan2.1 14B 480p I2V з цією нодою TeaCache та з іншими Lora.
Я вирішив протестувати як ще працюють LoRa з поцілунком і ефектом самурая.
Щоб правильно згенерувати у кролика показ м'язів, як зробив автор, я робив багато спроб. Часто голова кролика змінювалася на голову людини, вовна кролика на животі знімалася як майка. Довго не виходило, щоб голова залишалася від кролика і з'являлося красиве м'язове тіло, хоча в промпті це було прописано. Останній варіант вдалий.
Намагався згенерувати відео, щоб козеня закручували і стискали пальцями, але виходило багато невдалих спроб. З'являлися зайві пальці, козеня бовталося, розмивалося, були різні невідповідні дефекти. Для зайчика у минулому уроці вийшов вдалий варіант, для козлика не виходило.
Обертання козеня на 360° генерувалося зі збоями.
У промті було зазначено, що всього один розворот протягом усієї анімації.
Але обертання було на 180°, то 2-3 разу замість одного.
Були ситуації, коли камера починала підніматися вгору і знімати кролика з іншого ракурсу, хоча камера не повинна рухатися в промті.
Були варіанти, коли замість обертання козеня крутилася камера навколо нього багато разів.
Були варіанти, коли козеня починало само крутитися, піднімалося на задні лапи, були випадки, коли у козеня під час обертання з'являлися додаткові розмиті частини тіла, більше лап, потім пропадали.
Були випадки коли козеня обертається в один бік правильно, а потім раптом починається зворотне обертання і відбуваються різні збої. Буває, що анімація майже вдала і якийсь невеликий збій або анімація розмита.
Генеруєш нову версію, а там козеня починає сильно стрибати, камера крутиться, відбувається щось неконтрольоване.
Останні варіанти вийшли вдалі. При однаковому промпті може вийде вдалий варіант чи багато невдалих.
Можливо, це залежить від зображення.
Генерував обертання дівчинки на 360° за допомогою Lora зі списку:
Wan2.1 14B 480p I2V LoRAs
360 Degree Rotation Effect LoRA for Wan2.1 14B I2V 480p та
360 Orbit LoRA for Wan2.1 14B I2V 480p, тестував обидві.
Незрозуміло чому, але замість розвороту дівчинки на 360° на ноді 360 Orbit LoRA for Wan2.1 14B I2V 480p по промпту:
A cheerful anime-style girl with short purple hair and a bright smile stands still on a wooden bridge lined with sunflowers, surrounded by lush green trees under warm sunlight. The camera performs an 0rb4it 360 degree orbit, circling smoothly around her from the front to the side, then behind, revealing the lake and summer scenery as it moves. The girl does not walk — she remains in place and gracefully rotates her body in a full 360-degree turn on the spot, her yellow shirt and rolled-up jeans shifting slightly with her motion, maintaining consistent style and detail.
ComfyUI постійно генерує танець або якийсь екшн. Це красиво і для цієї дівчинки підходить танець, але у промпті не було танцю, всі анімації виходять не просто обертання, а багато анімацій, то дівчинка руками махає і крутиться, то біжить кудись, то робить 3-5 обертів замість одного, то починає нахилятися і падати.
Вдалий варіант
обертання дівчинки,
але дівчинка обертається багато разів не просто на місці, а робить багато рухів.
Видно, що під час її обертання вона ще рухається у бік камери та камера видаляється, фокусуючи її у кадрі.
Інший варіант
обертання дівчинки, як на диску, що обертається, але дівчинка робить два обертання.
Генерувались невдалі варіанту руху дівчинки. Дівчинка може довільно бігати, робити плавні рухи, схожі на ковзання, а йти рівно за промптом не хоче.
Генерував ходу дівчинки, було багато невдалих спроб, редагував промпт, уточнював різні недоліки:
"A cute cartoon girl with purple hair walks slowly along a sunlit wooden path surrounded by sunflowers. She smiles warmly, her gait graceful and natural. The scene is bright, colorful, and cheerful.
The camera gradually moves away and shows the girl, the girl always remains the same size in the frame.
The girl walks forward towards camera, camera moves back.
The girl's steps are correct, the girl does not slip, the girl does not limp, she walks a distance equal to her step size."
На Wan2.1 14B 480p I2V LoRAs без Lora з використанням TeaCache і промптом вище вдалося згенерувати майже
вірну анімацію руху дівчинки.
Але у русі дівчинки помітна скромність у кроках, вона йде майже не піднімаючи ноги, хода не реалістична, вона схожа на механічні рухи робота, так люди не ходять.
Трохи ноги одна об одну стукаються, рух не повністю правильний. Знадобилося 6 генерацій у ComfyUI, щоб отримати потрібний результат.
У наступній спробі дівчина вже не йде, а починає прискорюватися і намагатися переходити до бігу і накульгує. Щоб отримати анімацію правильної ходи, потрібно багато тестувати.
Все інше добре виходить, є анімація хитання соняшників, якесь листя може обсипатися, правильно додає нове оточення, збігаються кроки з відстанню, яку проходить дівчинка, правильно рухається камера і тримає дівчинку в потрібному розмірі.
Добре рухаються руки, розвивається волосся на голові, є об'ємність дівчинки та анімація дуже якісна. Виникають дефекти у фазах ходьби.
Тестував як згенерує сайт https://openart.ai/video/i2v таку анімацію по промпту. Вище приклади. Анімація руху чіткіша ніж на Wan2.1 на ComfyUI. Немає руху дефектів, дублюючих, спотворених, розмитих частин тіла.
Після багатьох спроб я редагував промпт (вище), уточнював недоліки, і отримав вірну анімацію руху дівчинки.
Усі моменти потрібно уточнювати в промпті для анімації. Не просто плавно рухається камера, а фіксує у кадрі дівчинку. Дівчинка не просто йде, а йде у бік камери, що дівчинка не кульгає, що вона не ковзає, що її кроки збігаються з відстанню, яку вона проходить.
Після вдалої генерації промпту наступні генерації можуть бути невдалі.
Наприклад, в результатах є приклади, де дівчинки рухає в сторони ноги, високо згибає ноги у колінах.
Дівчинка може почати робити фінти ногами, виставляти їх в сторони. Хода кожен раз має свій стиль. Наприклад, ця хода з простим опусканням ноги, ця
хода як у моделі, ця хода, в якій дівчинка трохи розставляє руки, але вона ковзає на місці.
Незрозуміло чому у дівчинки раптом така
дивна ходьба зі зсувами ступнів наприкінці кроку, хоча дівчинка правильно зміщується і рух камери вірний.
В цій версії рух дівчини чомусь відбувається назад. Можливо це відбувається із-за невірного руху камери. AI не зрозумів, куди має рухатись дівчинка. Але сама анімація руху вдала. Я вирішив потестувати як згенерується місячна хода дівчинки.
Тестував промпт для місячної ходи:
A cheerful girl with short purple hair, yellow shirt, rolled-up jeans, and purple sneakers gracefully moonwalks backward for 6 seconds. The girl moves backwards. She glides smoothly, sliding one foot back while the other pushes off, alternating naturally and moving quickly but fluidly, like Michael Jackson’s moonwalk. Her expression is joyful and confident. The camera follows her with a smooth tracking movement, always keeping her centered and clearly in frame, moving backward in sync with her. The wooden bridge, tall sunflowers, and shimmering water pass by, with warm summer sunlight creating a soft, cinematic glow. The girl's steps are correct, the girl does not limp, she walks a distance equal to her step size.
Тестував на сайті https://openart.ai/video/i2v.
Перші генерації робить неправильно, дівчинка йде вперед до камери, хоча написано йти назад.
До цього коли була просто анімація ходи були випадки, коли дівчинка навпаки йшла вперед, тут зазначено в промпті, що дівчинка йде назад. На місячну ходу рух не схожі, ноги рухаються убік. Можливо, місячній ході модель не навчалася.
Ще спроби - дівчина не йде назад місячною ходою, а пританцьовує, йде вперед і в різні боки робить ногами різні танцювальні трюки.
Тестував інший промпт для місячної ходи:
A cheerful girl with short purple hair, yellow shirt, rolled-up jeans, and purple sneakers gracefully moonwalks backward for 6 seconds. The girl moves backwards. She glides smoothly, sliding one foot back while the other pushes off, alternating naturally and moving quickly but fluidly, like Michael Jackson’s moonwalk. Her expression is joyful and confident. The camera follows her with a smooth tracking movement, always keeping her centered and clearly in frame, moving backward in sync with her. The wooden bridge, tall sunflowers, and shimmering water pass by, with warm summer sunlight creating a soft, cinematic glow. The girl's steps are correct, the girl does not limp, she walks a distance equal to her step size.
У ComfyUI на Wan2.1 14B I2V 480p дівчинка також не робить місячну ходу, робить хаотичні дуже енергійні рухи, стрибки, підтанцьовує, радіє, махає руками, обертається навколо своєї осі, хоча Lora обертання не використовується. Цей промпт руху назад місячною ходою призводить до таких незрозумілих дій у русі дівчинки. Напевно, модель не навчалася такому руху, але багато є рухів із танців, хоча у промті є тільки місячна хода назад.
Анімація руху дівчинки як місячна хода Майкла Джексона – дівчинка почала бігати у різні сторони, стрибати, розвертатися та бігти хаотично, стрибати і танцювати, махаючи руками і швидко обертаючись, стрибати як кенгуру.
Тестував анімаційні ефекти LoRa із самураєм на Wan2.1 14B 480p I2V LoRAs
Samurai Effect LoRA for Wan2.1 14B I2V 480p
Промпт:
The video begins with a girl. She begins the 54mur41 samurai transformation, and becomes a samurai. He is wearing a traditional samurai outfit, and is holding a katana.
The girl doesn't walk, she stands still. Around the girl is a wooden bridge lined with sunflowers, surrounded by lush green trees under the warm sunlight."
Анімації мені подобаються, тільки рух тулуба і голови іноді мало не збігається з ногами, дівчинка вже стоїть знизу, а зверху вона ще обертається.
У першому відео ноги дівчини не обертаються, але дівчинка обертається на 360°.
Одяг самурая, поза самурая добре підходять дівчинці, навіть міміка обличчя дівчини змінилася. Також довкілля не зникло.
У цьому відео в кінці невірна анімація обертання дівчинки на 180°, ноги не рухаються, а дівчинка розгорнулася назад.
Є певні збої, наприклад, може невірно розмістити меч, додати зайві мечі, триматися рукою за гострий меч, з'явився самурай, а дівчинка ще не зникла.
Але загалом є вдалі варіанти і можна далі тестувати.
Тестував анімаційні ефекти LoRa із поцілунком на Wan2.1 14B 480p I2V LoRAs
Kissing LoRA for Wan2.1 14B I2V 480p
Цю дівчинку я генерував у 28 уроці.
Промпт:
A girl is smiling.
A one guy appears and gives this girl beautiful flowers.
Girl and guy are k144ing kissing, while still embracing each other.
The guy and girl are the same age. The guy is a little taller than the girl.
The camera pulls back very slowly to show the girl and boy well.
Спочатку я не вказував якого зросту і віку хлопчик, і з'явився в одному відео високий чоловік.
Потім я вказував у промпті, що саме хлопчик, трохи вищий за дівчинку, такого ж віку.
За промптом дівчинка йде, посміхається, до неї підходить хлопчик, дарує їй квіти, вони цілуються і обіймаються.
Відео триває 4 секунди.
Я зробив 27 генерацій, з них 12 підійшли, але не повністю, є варіанти, де хлопчик кульгав.
На великих зображеннях вдалі відео, поменше з помилками.
Часто генеруються дві інші людини, які зустрічаються перед дівчинкою, дарують квіти, цілуються.
Майже вдала анімація,
але хлопчик нижче дівчинки, ця анімація була згенерована до того, як я уточнював у промпті, що хлопчик вищий за дівчинку.
Також хлопчик трохи настає ногою на ступню дівчини. У хлопчика дуже великі кросівки, порівняно з розміром ноги у дівчинки. Хлопчик тримає квіти - соняшники, які ростуть навколо навколишнього фону. В основному букет кольорів генерується яскравим.
Іноді друга дівчинка дарує хлопчику квіти. Іноді з'являються два хлопчики і цілуються, а дівчинки дивиться, посміхається.
Іноді ця дівчинка підходить до двух і обіймає їх.
Один і той же промпт може згенерувати гарне відео, а потім помилки.
У цьому відео у промпті я прописував одяг хлопцю: синя футболка, червоні джинси. З'явилися дві дівчини у цьому одязі.
Були помилки в зрості хлопчика, вказуєш що хлопчик трохи вищий за дівчинку, а з'являється хлопчик нижче за дівчинку і дівчинка присідає коли цілується з хлопчиком, у хлопця немає квітів. У дівчинки джинси перетворилися на шорти.
Написав у промпті, що одяг хлопчика схожий на одяг дівчинки, згенерувало чітко такий самий одяг у хлопця.
Усі моменти потрібно уточнювати, який одяг, який колір, інакше будуть непередбачувані результати.
У цьому відео збої у промпті. Хлопчик не помічає дівчинку і стикається з нею вперше під час генерацій і продовжує йти і штовхає її. З'являється інша дівчинка з квітами, вона йде до хлопчика. Перша дівчинка виявляється між ними.
У цьому відео
з'являється хлопчик та нова дівчинка. Анімація вірна, але перша дівчинка відходить від них.
У цьому відео хлопець з квітами, одягнений у шорти і футболку зустрічається з дівчинкой,
спочатку все правильно, потім з'являється другий хлопчик вище, який починає обійматися і цілуватися із ними.
У цьому відео багато збоїв у промпті.
З'являється один хлопчик та нова дівчинка. Потім хлопчик роздвоюється і з його тіла з'являється друга голова.
Потім одна голова хлопчика трансформується в голову дівчинки, а голова першої дівчинки знаходиться збоку від другої дівчинки і є збої в промальовуванні контурів фігури другої дівчинки. Також немає квітів.
У цьому відео багато помилок у промпті. Хлопчик приїжджає на якомусь сидінні, яке схоже на частину мопеда. Хлопчик має квіти, але він не дарує їх, а відразу дівчинка сідає на його ноги і вони цілуються.
Це відео більш-менш відповідає промпту. Одяг у хлопчика не яскравий, хоча в промпті вказаний яскравий, але в цілому підходить, і букет красивий, не соняшник. Далі вже йдуть особисті переваги в якому одязі хлопчик, яка в нього раса тощо.
Можна звернути увагу, що коли я хотів згенерувати просто ходу дівчинки, були різні збої, дівчинка іноді шкутильгала, іноді ноги розходилися в сторони або зачіпали одна одну. Тут же у дівчинки не було вказано в промпті хода, але у всіх генераціях дівчинка та інші люди ходять і рухаються без збоїв, у русі тіла, рук, голови немає збоїв, навіть є міміка і різна реакція дівчинки. Наприклад, стистіння коли цілувалися хлопчики, дівчинка нахилялася під ріст хлопчика і зберігала свої розміри, не зливалася у просторі з іншою людиною.
У цьому відео також є збої.
З'являється нова дівчинка, яка приходить із квітами. Але хлопчик обіймає та цілує першу дівчинку.
Перша дівчинка підходить і різко повертається до хлопчика, який її сильно нахиляє.
Потім друга дівчинка цілує хлопчика. Одягнені хлопчик і друга дівчинка добре, яскраво, їх рухи правильні.
У цьому відео є також є збої.
З'являються дівчинка та хлопчик, які однаково одягнені. Друга дівчинка чомусь дуже маленька. Вони мають квіти в кожного, вони дарують їх першій дівчинці, починають цілувати першу дівчинку, потім голова першої дівчинки пропадає, з'являється голова хлопчика.
У цьому відео збої в анімації.
З'являється нова дівчинка та хлопчик. Квіти соняшники як на мосту, і у дівчинки, і у хлопчика.
Друга дівчинка дарує частину квітів першій дівчинці, другу частину соняшників спрямовує до хлопчика.
Перша дівчинка дивиться на їх поцілунок. Друга дівчина клон першої.
Це відео також підходить. Хлопчик трохи вищий за дівчинку, її вік. Але коли він підходить, він набагато вищий за дівчинку, а потім його зріст зменшується. У них однаковий колір шкіри, яскравий одяг.
Наприкінці є дефект – ліва рука хлопчика роздвоїлася. Також наприкінці з'явилося освітлення фону, щоб чіткіше показати дівчинку та хлопчика. Це зробив сам AI, у промпті таке не було прописано.
У цьому відео взагалі на мій погляд все підходить за промптом, тільки одяг у хлопчика і дівчинки однаковий.
Тут вже потрібно уточнювати детальніше у що одягнений хлопчик.
Це відео
підходить за промптом, але різко смикаються під час поцілунку.
Це відео
підходить за промптом, але дівчинка кульгає.
Якісна генерація, немає збоїв. Все вийшло правильно. Якісна генерація, теж немає збоїв. Все вийшло правильно.
У цьому відео
гарна анімація, єдине, хлопчик не подарував квіти дівчинці, вони самі з'явилися в руках дівчинки.
Ліва рука, в якій мають бути квіти у хлопчика звисала і не рухалася, і тільки під кінець анімації рука ожила.
Якісна генерація, немає збоїв.
Хлопчик трохи різко рухав рукою, коли підходив.
У промпті був вільний одяг, тому у хлопчика худі. Іноді хлопчик у костюмі, іноді у футболці.
Тестував анімаційні ефекти LoRa із обертанням на Wan2.1 14B 480p I2V LoRAs
360 Degree Rotation Effect LoRA for Wan2.1 14B I2V 480p
Цю жінку я генерував у 28 уроці.
Це промпт, по якому я згенерував велике відео на 2 секунди:
A young woman smiles and stands still. A young woman rotates around yourself, a r0t4tion 360 degrees rotation just once, spinning slowly and smoothly in place. The young woman makes one rotation throughout the entire animation in 2 seconds.
The camera gradually pulls away to show the woman in full height.
Коли я генерував відео на 4 секунди, дівчина завжди крутилася кілька обертів довкола себе.
Коли я згенерував відео на 2 секунди, дівчина правильно зробила один оберт на 360°.
У промпті вказано обертання один раз, дівчина обертається тричі за 4 секунди.
Обличчя дівчини змінилося після обертання. В анімації немає явних дефектів, камера не віддаляється.
Змінив промпт:
A young woman smiles and stands still. A young woman rotates around yourself, a r0t4tion 360 degrees rotation just once, spinning slowly and smoothly in place. In four seconds the girl makes one rotation.
The camera gradually pulls away to show the girl in full height.
Але у відео дівчина робить майже 2 обороти за 4 секунди.
Під час обертання з'явилися збої синхронізації тулуба, рук та голови.
Голова намагається робити один оберт, тим часом інші частини тіла роблять обертання власними силами.
Камера віддаляється правильно, показуючи в кінці на повний зріст дівчину.
Волосся у дівчини та сукня обертаються вдало і у дівчини з'являється яскраве взуття.
Але є збій обертання голови та волосся.
Постійно відбуваються збої із обертанням.
Дівчина не робить одне обертання на 360°, вона обертається швидко, потім відбуваються збої, різні частини тіла обертаються окремо та можуть змінювати напрямки обертання.
Я спробував згенерувати більшого розміру відео, хоча у вимогах стояло 640x640 для wan2.1_i2v_480p_14B_fp8_scale:
A young woman smiles and stands still. A young woman rotates around yourself, a r0t4tion 360 degrees rotation just once, spinning slowly and smoothly in place. The young woman makes one rotation throughout the entire animation in 2 seconds.
The camera gradually pulls away to show the girl in full height.
Генерувало відео 1024x1024 у мене на комп'ютері 50 хвилин 2 секунди,
але відео вишло вдалим.
Жінка посміхається, робить рівно 1 оберт на 360°, все реалістично і немає збою.
Обличчя дівчини не змінюється.
Єдине, камера не встигла за 2 секунди показати на весь зріст дівчину. Згенеруване відео на 1024×1024 відповідає промту, немає збоїв, хоча й довго генерувалося.
Тестував анімаційні ефекти LoRa із поцілунком на Wan2.1 14B 480p I2V LoRAs
Kissing LoRA for Wan2.1 14B I2V 480p
Цю жінку я генерував у 28 уроці.
Промпт:
A woman is smiling.
A one man appears and gives this woman beautiful flowers.
Woman and man are k144ing kissing, while still embracing each other.
The man and woman are the same age. The man is a little taller than the woman.
The camera pulls back very slowly to show the man and woman well.
Я не прописував у промті одяг чоловіків.
Усі чоловіки мають вдалий одяг, блакитну сорочку, костюм, одяг підходить під зовнішній вигляд жінки.
Ця анімація вдала.
Можливо, варто віддалити камеру, але камера прямує за рухом пари і тримає їх у близькому ракурсі.
Але у промпті вказано, що камера віддаляється повільно назад.
Вдала анімація.
У відео майже немає збою крім того що чоловік поділив букет на дві частини. І потім букет, який він поклав на руку дівчини, дівчина зрушувала неправильно. Зріст чоловіка, вік, його одяг, все підходить за промптом. Краще щоб камера трохи віддалилася, оскільки не захоплює частково голову чоловіка.
В цьому відео з'являються два чоловіка.
У відео спочатку все вірно, з'явився один чоловік, який подарував квіти жінці, вони цілуються та обіймаються. Але раптом виходить другий чоловік, який також з квітами і цілує першого чоловіка. Коли другий чоловік дарує квіти, жінка простягає руку, але не бере букет і букет левітує у повітрі. Перший чоловік рукою обіймає другого чоловіка і видно, що у нього на пальцях жіночий манікюр.
Вдала анімація.
Чоловік одягнений у таку ж блакитну сорочку як раніше, хоча це не було вказано у промпті, але обличчя відрізняється. За промптом чоловік дарує квіти, а вони починають відразу цілуватися, а потім за спиною чоловіка трохи видно букет. Можна звернути увагу, що в анімації навіть рухалася краватка у чоловіка, якої не було видно, коли він підходив. Також візерунок на сукні жінки ніколи не пропадав.
Ця анімація відповідає промпту.
Вдала анімація, через швидкий рух чоловіка є невеликий дефект із квітами, вони нечітко помітні і змінюють форму.
В анімації чоловік з однієї сторони переходить на іншу, рух не природний, схожий на кружляння в танці.
Вдала анімація, відповідає промпту.
Можна змінювати розташування камери.
Вдала анімація.
Анімація відповідає промпту і букет красиво видно. Але права рука чоловіка неправильно тримає букет,
вона сильно висуває його у бік камери, а ліва рука чоловіка висить всю анімацію.
Можна міняти розташування камери, віддаляти їх щоб показати людей на весь зріст. Камера майже завжди правильно фокусує людей у кадрі як вказано у промпті.
Вдала анімація, відповідає промпту і букет красивий.
Можна помітити, що чоловік схожий на чоловіка у попередньому відео і одягнений однаково.
Одяг можна змінити у промпті, зовнішність чоловіка теж можна описувати у промпті.
Вдала анімація, відповідає промпту.
Сгенерував відео 4 секунди 1024х1024 з дівчиною та чоловіком, які цілуються.
Це одне відео з цією жінкою і чоловіком, які цілуються такого розміру.
До цього генерував на комп'ютері 612x612.
На Wan2.1 14B 480p I2V цей розмір 1024x1024 не є рекомендований, але анімація в ньому виходить якісна.
Я не можу на комп'ютері такого розміру 1024x1024 4 секунди згенерувати відео на Wan2.1 14B 480p I2V, з'являється помилка навантаження GPU, в такому розмірі 1024x1024 вдавалося згенерувати відео тільки на 2 секунди. Відео у хмарі генерувалося 19 хвилин 28 секунд.
Обличчя у відео реалістичні, з'являються деталізовані вії у дівчини, краще видно волосся у людей, якісно деталізовані руки, добре видно манікюр у дівчини.
Обличчя у дівчини в анімації стає повнішим. Дівчина довго дивиться в камеру, а не на чоловіка.
Це можна уточнити у промпті.
У чоловіка в руках квіти, але є збоку ще квітка на костюмі.
Чоловік підходить за віком і зростанням, як зазначено в промпті, одягнений у яскравий, діловий одяг.
Анімація людей якісна.
Тестував анімаційні ефекти LoRa із самураєм Wan2.1 14B 480p I2V LoRAs
Samurai Effect LoRA for Wan2.1 14B I2V 480p
Цю жінку я генерував у 28 уроці.
Промпт:
A woman begins the 54mur41 samurai transformation, and becomes a samurai. She is wearing a traditional samurai outfit, and is holding a katana.
The woman's clothes are replaced by those of a samurai.
The colors of the girl's samurai robe are black or red or other colors, the robe has decorations like the samurai ones.
The woman doesn't walk, she stands still.
All parts of the girl's body move correctly, the girl's head and torso move synchronously.
The camera smoothly moves back and shows the girl in full height.
Анімація невдала.
Сукня дівчини не змінюється.
У неї з'являються бежеві джинси, в руках два мечі.
Дівчина згинає ногу у коліні, але потім цю позу не витримує.
Анімація схожа на репетицію дівчини перед тим, як вона вчиться перетворюватися на самурая.
Камера віддаляється правильно і фіксує на повний зріст дівчину наприкінці анімації.
У цьому варіанті дівчина виконує цікаві рухи самурая.
Але верхня частина тіла жінки після трюків з'являється з іншого боку від нижньої частини тіла, потім верхня частина розгортається в правильну позу.
Дівчина гарно рухає катаною, але її одяг не змінився в одяг самурая.
Камера рухається правильно.
На початку анімації є затримка дівчини на одному кадрі, можливо це через те, що спочатку в промпі я вказував, що дівчина посміхається, потім далі описував деталі анімації.
Дівчина не перетворюється на самурая.
Чомусь жовте плаття у жінки не змінюється в одяг самурая, хоча з дівчинкою в мультяшному стилі це спрацьовувало і дівчинка добре анімувалась у різні пози самурая.
У цій анімації за промптом дівчина повинна стояти на місці, але дівчина різко побігла, на її мечі видно кров. Останній кадр добре показує дівчину на весь зріст, але крім катани дівчина не має нічого схожого на самурая.
Частково вдала генерація.
У дівчини з'явилася анімація із перетворенням на одяг самурая.
Але дівчина заплуталася в одяганні халата і не змогла правильно його одягнути.
Це схоже на те, як дівчина тренується одягати самураєвий халат під час зйомки.
Мені подобається, як анімується дівчина і поява самурайського халата,
є збій в анімації з рукою, коли з'явився катана.
Самурайський халат чомусь завжди синій, додав потім до опису колір халата.
Мені подобається ідея цієї анімації з обертанням,
але анімація вірна з 2 секунди.
До середини анімації на початку вибігає людина, яка перетворюється на дівчину. У дівчини невірно анімується обертання голови.
Чорний халат з червоними вставками виглядає красиво. Наприкінці анімації у дівчини гарний жест самурая, ефектний рух катаною і добре посміхається.
Анімація у відео підходить промпту,
добре проанімована поява самурайського халата. Але халат не рівно покриває плечі дівчини і перекошений на один бік.
Є нечіткі рухи руками, коли дівчина бере катану, вони не виразні.
Майже вдала анімація перетворення жінки у самурая. Переніс воркфлоу у хмару, згенерував це відео на розмірі 1024x1024 3 секунди, згенерувало за 13:37.
Промпт розуміє добре. Є невеликий баг, коли дві руки замість однієї разом анімуються, одна рука не зникла, а з'явилася друга. На великому розмірі 1024x1024 одяг самурая додається і проанімовується, на розмірі 640x640 були варіанти без заміни одягу. На Wan2.1 14B 480p I2V цей розмір 1024x1024 не є рекомендований, але анімація в ньому виходить якісна, але довго генерувати і більше 2-3 секунд у мене не комп'ютері з таким розміром 1024x1024 на Wan2.1 14B 480p I2V не генерує.
Ця анімація вдала.
Мені подобається згенероване відео. Все чітко збігається за промптом: красиві ефекти появи самурайського халата, приголомшливі рухи дівчини руками з катанами, яскравий образ самурая з прикрасами на халаті, правильне взуття у дівчини та фінальний ракурс рухової камери добре завершив цю анімацію. І навіть є фокусування розмитих дерев у кінцевому кадрі.
Я пробував згенерувати відео 1024x1024 4 секунди на комп'ютері,
при рекомендованих вимогах на 640x640
виходить тільки на 2 секунди за 50 хвилин, 4 секунди дуже багато для моєї відеокарти на чекпоінті wan2.1_i2v_480p_14B_fp8_scale, генерація у мене не проходить, потрібно генерувати у хмарі.
У хмарі це відео згенерувалося за 19 хвилин 30 секунд.
І хоча у вимогах Wan2.1-T2V-14B-480P вказано що немає 720P, мені вдавалося генерувати на 1024x1024 вдалі анімації по 3-4 секунди на цьому чекпоінті у хмарі.
Чекпоінт Wan2.1-I2V-14B-720P я не тестував, він дуже вимогливий до відеокарти та оперативної пам'яті потрібно дуже багато, але у хмарі можна використовувати.