Ako iste viete nastáva doba umelá. Čas keď sa ťažšie rozpoznáva čo je realita. A tak nám neostáva nič iba spustiť veľký protest proti AI. Alebooo, sa s ňou môžeme naučiť pracovať a uľahčiť si pomocou nej život, to znie trochu lepšie nie ?

Už dlhšiu dobu som sa AI venoval len veľmi okrajovo, minulý rok keď som bol na akcií codecon v BA trochu ma prekvapilo že skoro všetky prednášky sa venovali práve téme umelej inteligencie. Na otázku či sa ľudia boja že prídu vďaka AI o prácu všetci jednohlasne odpovedali že nie, jedine ja som tam dvíhal  pac a cítil sa mierne ako idiot medzi toľkými developermi. Už teraz sa však ukazuje že smerujeme k čiastočnej automatizácií niektorých úloh na ktoré boli ľudia za posledné roky zvyknutý a že trh s IT je tak trochu presýtený a preto sa treba učiť nové schopnosti ktoré nám pomôžu aj do budúcnosti.

Asi pred rokom som narazil na možnosť generovania obrázkov na základe fotiek ktoré si nahráte do aplikácie. Bolo to približne vo februári, rozhodol som sa že to vyskúšam keďže som videl že kopec ľudí už má svoje AI avatary ktoré vyzerajú dosť dobre. Bola tam možnosť vybrať si z niekoľkých štýlov a zvoliť si počet vygenerovaných fotiek čo ovplyvňovalo aj výslednú cenu. Viem že toho dňa na túto činnosť padlo približne 30 a viac eur 😅 Prvý výstup ma totižto zaujal na toľko že som chcel vidieť ďalšie fotky. Následne som bol s tým čo vyšlo dosť spokojný a túto oblasť som nechal bokom. No pár dní dozadu som zistil že už pekne dlhú dobu funguje možnosť generovať veľmi kvalitné fotky a grafiku pomocou AI na vlastnom PC a to celkom zdarma!

Vedel som že stable diffusion a prostredie ktoré vyžadovalo nejakú tú python inštaláciu už existovalo dlhšiu dobu, ale keď som to naposledy skúšal kvalita sa mi zdala dosť biedna a bolo to aj dosť komplikované. Dostupné modely v minulom roku neboli až také preborné, alebo som sa len ja sám neorientoval v tom kde a čo zháňať dosť na to aby som získal výsledok ktorý by ma ohúril a ja som to tak nechal na pokoji. Teraz som však objavil prostredie ComfyUI ktoré vám pomôže pomocou workflows vytvárať si komplexné generované grafiky na základe textových promptov.

Návod na inštaláciu nájdete tu: https://youtu.be/z8efDtdBZn8?si=vB6rso1r_6SmfKrq

Musím uznať že comfyUI ma na niekoľko desiatok hodín úplne pohltilo, množstvo komentov, videí, modelov a obsahu celkovo okolo tohto rozhrania sa tak za posledný rok nafúklo že človek nevie čo vlastne chce robiť skôr. Chcem hľadať model ktorý vytvorí presne to čo sa mi páči tak aby som si mohol vytvoriť novú dokonalú pracovnú plochu presne podľa svojich predstáv namiesto toho aby som ju musel hodiny hľadať a aj tak nemal istotu či vôbec existuje ? Vyriešené. Chcem sa zamerať na miešanie rôznych druhov zvierat ? A vytvoriť tigriu pandu ? Tak si naštudujem váhy promptov a ich spájanie. Chcem zväčšovať staré fotky ktoré som mal v starom foťáku na mobile v roku 2009 ? Tak začnem pozerať na upscalovacie metódy ktoré dokážu posúvať rozlíŠenie fotiek na báze modelov ktoré na to sú trénované. Chcem si upraviť moju profilovú fotku tak aby som na nej mal rohy ? Naštudujem si možnosti kombinácie loadovaných obrázkov s promptovacími výstupmi a váhami „noise“ pri generovaní. Chcem si prehodiť tvár s niekým iným ? tak to sme už niekde videli ale aj to tu vieme spraviť. A to ani nehovorím o tom že som pri tom ako som sa začal zaoberať comfyUI zistil že existuje možnosť ako si lokálne spustit svojho chatbota so svojim vlastným modelom a vy tak už nemusíte riešiť platenie za chatGPT atď. (Aj keď úroveň je samozrejme ďaleko vyššia pri chatGPT zatiaľ).

Musím uznať že tento nástroj si vyžaduje aj trochu technickej zdatnosti a pochopenia pre nejaké tie chyby ktoré sa sem tam ukážu je lepšie keď na tom pracuje človek ktorý už má nejaké tie skúsenosti s počítačmi a ideálne aj s programovaním. Potom to vie ísť ako po masle. Máme tu však reddit ktorý nám pomôže a môžeme sa spýtať keď sme v niečom stratený odborníkov.

Teraz si dáme pár ukážok toho čo dokážeme s comfyUI. Pridávam snímky pracovného prostredia (workflow) a taktiež nejaké tie výstupy.

Generovanie nového pozadia pre pracovnú plochu relatívne jednoduchý flow
Výsledok
Alternovanie štýlu obrázkov (pozor vygenerované obrázky dodržujú predpísanú predlohu, moc kreatívne to nie je)

Výmena tvárí (táto už nieje viazaná veľkosťou vašej pôvodnej tváre a jedná sa čisto o tvár) Rozbehnúť tento workflow ma stálo asi 60GB miesta na disku + 2h práce

Ak by ste mali nejaké otázky môžete sa kľudne spýtať v koment sekcií a možno vám budem vedieť poradiť. Ale zatiaľ s nástrojom pracujem len pár dní.

Zdroje z ktorých som pri workflow a práci s comfyUI čerpal:

Kde zohnať comfyUI: https://github.com/comfyanonymous/ComfyUI

Kde zohnať modely (loras etc.): https://civitai.com/models

Kde zohnať prompty na inšpiráciu (filtrovanie podľa modelu): https://prompthero.com/

Výmena tvárí: Better Face Swap = FaceDetailer + InstantID + IP-Adapter (ComfyUI Tutorial) – YouTube

Kde som našiel comfy: Comfy UI: Stable Diffusion UI Better Than Automatic WebUI

Zlepšováky pre comfy: TIDY UP the COMFYUI Interface with this MAGICAL EXTENSION – Plus XY Comparisons – YouTube

IPAdapter: GitHub – cubiq/ComfyUI_IPAdapter_plus

SubReddit (otázky, diskusia): https://www.reddit.com/r/StableDiffusion/

ComfyUI Reddit: https://www.reddit.com/r/comfyui/

Tags:

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *