V poslednej dobe sa naozaj poriadne rozbehli modely umelej inteligencie. Program sa nám už programuje pomaly sám, len ho usmerňujeme, ktorou cestou sa má vybrať, a kontrolujeme to, čo produkuje. Problém však nastáva v bode, keď cena začína dramaticky stúpať, a to sa deje práve v týchto chvíľach. V apríli Claude dramaticky zvýšil cenu svojich tokenov a agentické workflows, ktoré bežali na počítačoch, sme museli vypnúť, lebo by sme sa nedoplatili. Model Opus 4.7, ktorý nám sľuboval viac ako 4.6, priniesol s novou, dosť nepríjemnou cenovkou aj otázne výsledky. Momentálne sa nachádzame v období pred júnom, keď sa chystá Microsoft prejsť na usage-based politiku pre svoj GitHub Copilot a trochu tak zmeniť experience pre všetkých programátorov, ktorí sa venujú .NET technológiám, a my tak spoločne hľadáme cestu, čo by sme mali robiť.

Naskytá sa nám riešenie v podobe lacnejších čínskych modelov. Napríklad Qwen práve vydal verziu 3.7 Max, ktorá sľubuje výsledky dobiehajúce GPT 5.5 a Opus, a to všetko za oveľa priaznivejšie ceny. Problém však možno je tak trochu v tom, že nám zároveň pomaličky hádžu klacky pod nohy. Zatiaľ čo doteraz bol Qwen super v tom, že sa dal rozbiehať lokálne na vlastnom PC alebo serveroch a vydávali sa rôzne verzie, začínajú autori trochu zvažovať, že by išli skôr cestou iných veľkých modelov. Blokuje ich len fakt, že v Číne sa subscription odberový model platieb až tak nepoužíva. Uvidíme teda, ako to dopadne s týmto čiernym koňom, ktorý nám zatiaľ zachraňoval chrbát pri malých projektoch. Aj keď musím uznať, že ak chcete používať tieto modely, je potrebné promptovať naozaj precízne, inak to nakódi aj to, čo netreba. Rýchlosť je tu tiež nižšia, aspoň zatiaľ.

Momentálne je veľmi zaujímavá možnosť opencode, ktorá sprístupňuje aj tieto čínske modely. Jednotné predplatné dovoľuje za relatívne priaznivú cenu zakryť tú nepriaznivú, podobne ako to doteraz robil GitHub Copilot pomocou svojich request politík, ktorých sa však, žiaľ, zbavuje. Uvidíme teda, ako dlho nám to vydrží. Ďalší na rade je OpenRouter, cez ktorý síce už platíme za priame používanie modelov podľa tokenov, ale máme tam veľmi silný výber z lacnejších aj drahších modelov a je to super na experimentovanie. Navyše máme perfektnú integráciu s VS Code.

Ďalšie na rade sú lokálne hostované modely. Na prekvapenie sa ukazuje, že Mac mašinky sú veľmi dobré na hostovanie modelov a ľudia si už testujú rôzne programovacie sessions počas letov lietadlom lokálne vďaka unifikovanej pamäti GPU/RAM, ktorá je dosť veľká na to, aby hostovala aj solídne modely. Predpokladám, že aj celkovo stolné PC budú smerovať k využitiu niečoho takého v dobe AI, ale necháme sa prekvapiť. Z mojich pokusov s Gemma 4 a Qwen 27B to vyzerá sľubne, ale chce to ešte nejaký čas.
Kde sa dajú dobre pozrieť aktuálne výsledky a porovnania modelov, ktoré sú v obehu? Páčia sa mi tieto odkazy.
Malý joke od GPT 5.5 na záver😅 : Pri súčasnom tempe zdražovania AI modelov čakám deň, keď si Claude vypýta „prémiový token“ už len za to, že sa naň človek pozrie cez Alt+Tab.


