OpenAI dnes potvrdila mou ... | Trissy OKX Feed

OpenAI dnes potvrdila mou severskou tezi o AI tím, že uvolnila svého agenta operátora. To byla nejen moje hlavní teze pro $CODEC, ale i pro všechny ostatní investice do umělé inteligence, které jsem provedl, včetně těch ze začátku roku během mánie umělé inteligence. S Codecem se hodně diskutovalo ohledně robotiky, zatímco tato vertikála bude mít velmi brzy svůj vlastní příběh, základním důvodem, proč jsem byl od prvního dne ohledně Codecu tak optimistický, je to, jak jeho architektura pohání operátory. Lidé stále podceňují, jak velký podíl na trhu je v sázce tím, že vytvářejí software, který běží autonomně a překonává lidské pracovníky bez potřeby neustálých výzev nebo dohledu. Viděl jsem spoustu srovnání s $NUIT. V první řadě chci říct, že jsem velkým fanouškem toho, co Nuit budují a nepřeji jim nic jiného než jejich úspěch. Pokud do mého telegramu napíšete "nuit", uvidíte, že v dubnu jsem řekl, že kdybych měl držet jednu minci několik měsíců, byla by to Nuit, a to kvůli mé operátorské diplomové práci. Nuit byl na papíře nejslibnějším projektem operátora, ale po rozsáhlém výzkumu jsem zjistil, že jejich architektura postrádá hloubku potřebnou k ospravedlnění velké investice nebo k tomu, abych za ní postavil svou pověst. S ohledem na tuto skutečnost jsem si již byl vědom architektonických mezer ve stávajících týmech operátorů a aktivně jsem hledal projekt, který by je řešil. Krátce poté se objevil Codec (díky @0xdetweiler naléhání, abych se na ně podíval hlouběji) a toto je rozdíl mezi těmito dvěma: $CODEC vs $NUIT Architektura kodeku je postavena ve třech vrstvách; Stroj, systém a inteligenci, které oddělují infrastrukturu, rozhraní prostředí a logiku umělé inteligence. Každý agent operátora v kodeku běží ve svém vlastním izolovaném virtuálním počítači nebo kontejneru, což umožňuje téměř nativní výkon a izolaci chyb. Tento vrstvený design znamená, že komponenty se mohou škálovat nebo vyvíjet nezávisle, aniž by došlo k narušení systému. Architektura Nuit se ubírá jinou cestou tím, že je více monolitická. Jejich zásobník se točí kolem specializovaného agenta webového prohlížeče, který kombinuje analýzu, uvažování pomocí umělé inteligence a akci. To znamená, že hluboce analyzují webové stránky do strukturovaných dat, která může umělá inteligence konzumovat, a spoléhají se na cloudové zpracování pro náročné úkoly umělé inteligence. Přístup kodeku, který do každého agenta zabuduje odlehčený model Vision-Language-Action (VLA), znamená, že může běžet plně lokálně. Což nevyžaduje neustálé pingování zpět do cloudu pro pokyny, snižuje latenci a vyhýbá se závislosti na provozuschopnosti a šířce pásma. Agent společnosti Nuit zpracovává úkoly tak, že nejprve převádí webové stránky do sémantického formátu a poté pomocí mozku LLM zjistí, co dělat, což se postupem času zlepšuje díky zpětnovazebnímu učení. I když je tento tok efektivní pro automatizaci webu, závisí na náročném zpracování umělé inteligence na straně cloudu a předdefinovaných strukturách stránek. Inteligence lokálního zařízení kodeku znamená, že rozhodnutí se dějí blíže k datům, snižuje režijní náklady a činí systém stabilnějším vůči neočekávaným změnám (žádné křehké skripty nebo předpoklady DOM). Operátoři kodeku se řídí nepřetržitou smyčkou vnímání-myšlení-jednání. Strojová vrstva streamuje prostředí (např. živou aplikaci nebo kanál robota) do vrstvy inteligence prostřednictvím optimalizovaných kanálů systémové vrstvy, což umělé inteligenci poskytuje "oči" o aktuálním stavu. VLA model agenta pak interpretuje vizuály a instrukce společně a rozhoduje o akci, kterou systémová vrstva provádí prostřednictvím událostí klávesnice/myši nebo ovládání robota. Tato integrovaná smyčka znamená, že se přizpůsobí živým událostem, a i když se uživatelské rozhraní posune, nepřerušíte tok. Abychom to vše uvedli do jednodušší analogie, představte si operátory Codecu jako soběstačného zaměstnance, který se přizpůsobuje překvapením v práci. Agent Nuit je jako zaměstnanec, který se potřebuje zastavit, popsat situaci nadřízenému po telefonu a počkat na pokyny. Aniž bychom se příliš pouštěli do technické králičí nory, mělo by vám to poskytnout představu o tom, proč jsem si vybral Codec jako svou primární sázku na operátory. Ano, Nuit má podporu od YC, naskládaného týmu a githubu úrovně S. I když byla architektura Codecu vytvořena s ohledem na horizontální škálování, znamená to, že můžete nasadit tisíce agentů paralelně s nulovou sdílenou pamětí nebo kontextem provádění mezi agenty. Tým Codecu také nejsou průměrní vývojáři. Jejich architektura VLA otevírá velké množství případů použití, které u předchozích modelů agentů nebylo možné kvůli vidění skrz pixely, nikoli snímky obrazovky. Mohl bych pokračovat, ale to si nechám na budoucí příspěvky.

Virtuální prostředí pro agenty operátorů: $CODEC Moje hlavní teze týkající se exploze umělé inteligence se vždy soustředila na vzestup operátorských agentů. Aby však tito agenti uspěli, vyžadují hluboký přístup k systému, který jim účinně poskytuje kontrolu nad vaším osobním počítačem a citlivými daty, což přináší vážné bezpečnostní problémy. Už jsme viděli, jak společnosti jako OpenAI a další technologičtí giganti zacházejí s uživatelskými daty. Zatímco většině lidí je to jedno, jednotlivci, kteří mají největší prospěch z agentů operátorů, horní 1 % rozhodně ano. Osobně je nulová šance, že společnosti jako OpenAI poskytnu plný přístup k mému počítači, i když to znamená 10× zvýšení produktivity. Tak proč kodek? Architektura Codecu je zaměřena na spouštění izolovaných "cloudových desktopů" na vyžádání pro agenty AI. Jeho jádrem je orchestrační služba založená na Kubernetes (kódové označení Captain), která poskytuje odlehčené virtuální stroje (VM) uvnitř podů Kubernetes. Každý agent získá vlastní izolované prostředí na úrovni operačního systému (úplnou instanci operačního systému Linux), kde může spouštět aplikace, prohlížeče nebo jakýkoli kód, zcela izolovaný od ostatních agentů a hostitele. Kubernetes se stará o plánování, automatické škálování a automatické opravy těchto podů agentů, což zajišťuje spolehlivost a schopnost spouštět / vypínat mnoho instancí agentů podle požadavků zatížení K zabezpečení těchto virtuálních počítačů se používají důvěryhodná spouštěcí prostředí (TEE), což znamená, že počítač agenta může být kryptograficky izolován, jeho paměť a spuštění mohou být chráněny před hostitelským operačním systémem nebo poskytovatelem cloudu. To je zásadní pro citlivé úlohy: například virtuální počítač běžící v enklávě by mohl bezpečně uchovávat klíče API nebo tajemství kryptopeněženky. Když agent AI ("mozek") potřebuje provést akce, odešle požadavky API službě Captain, která pak spustí nebo spravuje pod. Pracovní postup: agent si vyžádá počítač, Captain (prostřednictvím Kubernetes) přidělí pod a připojí trvalý svazek (pro disk virtuálního počítače). Agent se pak může připojit ke svému virtuálnímu počítači (prostřednictvím zabezpečeného kanálu nebo rozhraní streamování) a vydávat příkazy. Captain zpřístupňuje koncové body, aby agent mohl provádět příkazy prostředí, nahrávat/stahovat soubory, načítat protokoly a dokonce pořizovat snímky virtuálního počítače pro pozdější obnovení. Tento návrh poskytuje agentovi úplný operační systém, ve kterém může pracovat, ale s řízeným, auditovaným přístupem. Vzhledem k tomu, že je kodek postavený na Kubernetes, může se automaticky škálovat horizontálně, pokud 100 agentů potřebuje prostředí, může naplánovat 100 podů v celém clusteru a řešit selhání restartováním podů. Virtuální počítač agenta může být vybaven různými MCP servery (například "USB port" pro AI). Například modul Conductor kodeku je kontejner, který spouští prohlížeč Chrome spolu se serverem Microsoft Playwright MCP pro ovládání prohlížeče. To umožňuje agentovi umělé inteligence otevírat webové stránky, klikat na odkazy, vyplňovat formuláře a škrábat obsah prostřednictvím standardních volání MCP, jako by to byl člověk, který ovládá prohlížeč. Další integrace MCP mohou zahrnovat MCP souborového systému/terminálu (aby agent mohl bezpečně spouštět příkazy CLI) nebo MCP specifické pro aplikaci (pro cloudová rozhraní API, databáze atd.). Kodek v podstatě poskytuje infrastrukturní "obaly" (VM, enklávy, sítě), aby bylo možné bezpečně provádět plány agentů na vysoké úrovni na skutečném softwaru a sítích. Případy použití Automatizace peněženky: Kodek může vložit peněženky nebo klíče do virtuálního počítače chráněného TEE, což umožňuje agentovi AI komunikovat s blockchainovými sítěmi (obchodovat na DeFi, spravovat krypto aktiva) bez odhalení tajných klíčů. Tato architektura umožňuje onchain finančním agentům, kteří bezpečně provádějí skutečné transakce, což by v typickém nastavení agenta bylo velmi nebezpečné. Slogan platformy výslovně uvádí podporu pro "peněženky" jako klíčovou schopnost. Agent by například mohl spustit CLI pro peněženku Ethereum uvnitř své enklávy, podepisovat transakce a odesílat je s jistotou, že pokud se agent chová špatně, je omezen na jeho virtuální počítač a klíče nikdy neopustí TEE. Automatizace prohlížeče a webu: Agenti CodecFlow mohou ve svém virtuálním počítači ovládat úplné webové prohlížeče. Příklad Conductor ukazuje agenta, který spouští Chrome a v reálném čase streamuje jeho obrazovku do Twitche. Prostřednictvím Playwright MCP může agent procházet webové stránky, klikat na tlačítka a škrábat data stejně jako lidský uživatel. To je ideální pro úkoly, jako je škrábání webu za přihlášením, automatizované webové transakce nebo testování webových aplikací. Tradiční frameworky se obvykle spoléhají na volání API nebo jednoduché bezhlavé skripty prohlížeče; naproti tomu CodecFlow může spustit skutečný prohlížeč s viditelným uživatelským rozhraním, což usnadňuje manipulaci se složitými webovými aplikacemi (např. s velkými výzvami JavaScript nebo CAPTCHA) pod kontrolou AI. Automatizace GUI v reálném světě (starší systémy): Vzhledem k tomu, že každý agent má skutečný desktopový operační systém, může automatizovat starší aplikace s grafickým uživatelským rozhraním nebo relace vzdálené plochy, které v podstatě fungují jako robotická automatizace procesů (RPA), ale jsou řízeny umělou inteligencí. Agent může například otevřít excelovou tabulku na svém virtuálním počítači s Windows nebo rozhraní se starou terminálovou aplikací, která nemá žádné rozhraní API. Stránka Codecu výslovně zmiňuje povolení "starší automatizace". To otevírá cestu k ovládání softwaru, který není přístupný prostřednictvím moderních rozhraní API, což je úkol, který by byl bez uzavřeného prostředí velmi hacknutý nebo nebezpečný. Zahrnutá integrace noVNC naznačuje, že agenty lze pozorovat nebo ovládat prostřednictvím VNC, což je užitečné pro monitorování umělé inteligence, která řídí GUI. Simulace pracovních postupů SaaS: Společnosti mají často složité procesy, které zahrnují více aplikací SaaS nebo starších systémů. Zaměstnanec může například převzít data ze Salesforce, zkombinovat je s daty z interního ERP a poté odeslat souhrn e-mailem klientovi. Kodek může agentovi umělé inteligence umožnit provést celou tuto sekvenci tím, že se do těchto aplikací skutečně přihlásí prostřednictvím prohlížeče nebo klientského softwaru ve svém virtuálním počítači, podobně jako by to udělal člověk. Je to jako RPA, ale poháněné LLM, které dokáže rozhodovat a zvládat variabilitu. Důležité je, že přihlašovací údaje k těmto aplikacím je možné virtuálnímu počítači poskytnout bezpečně (a dokonce je uzavřít do TEE), takže je agent může používat, aniž by kdy "viděl" přihlašovací údaje ve formátu prostého textu nebo je vystavil externě. To by mohlo urychlit automatizaci rutinních úloh back office a zároveň uspokojit IT, že každý agent běží s nejmenšími oprávněními a plnou auditovatelností (protože každou akci ve virtuálním počítači lze zaznamenat nebo zaznamenat). Plán - Spustit veřejné demo na konci měsíce - Srovnání funkcí s jinými podobnými platformami (žádný konkurent web3) - Integrace TAO - Velké herní partnerství Pokud jde o originalitu, Codec je postaven na základech stávajících technologií, ale integruje je novým způsobem pro použití agentů AI. Myšlenka izolovaných prováděcích prostředí není nová (kontejnery, virtuální počítače a TEE jsou standardem v cloud computingu), ale jejich použití na autonomní agenty AI s bezproblémovou vrstvou API (MCP) je extrémně nové. Platforma využívá otevřené standardy a nástroje, kdykoli je to možné: používá servery MCP, jako je Playwright od Microsoftu, pro ovládání prohlížeče namísto vynalézání tohoto kola a plánuje podporovat mikro-VM Firecracker od AWS pro rychlejší virtualizaci. Také rozvětvil stávající řešení, jako je noVNC pro streamování desktopů. Demonstrace toho, že projekt stojí na základech osvědčené technologie (Kubernetes, enclave hardware, open-source knihovny) a zaměřuje se na původní vývoj na glue logic a orchestraci ("tajná omáčka" je způsob, jakým to všechno funguje dohromady). Kombinace open-source komponent a nadcházející cloudové služby (naznačená zmínkou o nástroji pro $CODEC token a veřejném přístupu k produktům) znamená, že Codec bude brzy přístupný v různých formách (jak jako služba, tak jako self-hosting). Tým Moyai: 15+ let zkušeností s vývojem, v současné době vede vývoj umělé inteligence ve společnosti Elixir Games. lil'km: 5+ let vývojáře AI, v současné době spolupracuje s HuggingFace na projektu LeRobot. HuggingFace je obrovská robotická společnost a Moyai pracuje jako šéf umělé inteligence ve společnosti elixir games (za kterou stojí Square Enix a solanafdn. Osobně jsem videohovor s celým týmem a opravdu se mi líbí energie, kterou přinášejí. Můj přítel, který je dal do mého radaru, se s nimi všemi setkal na Token2049 a měl jen dobré věci, které mohl říct. Závěrečné myšlenky Zbývá toho ještě hodně, co si nechám pro budoucí aktualizace a příspěvky na svém kanálu Telegram. Dlouho jsem věřil, že cloudová infrastruktura je budoucností agentů operátorů. Vždy jsem respektoval to, co Nuit buduje, ale Codec je první projekt, který mi ukázal plné přesvědčení, které jsem hledal. Tým jsou jednoznačně špičkoví inženýři. Otevřeně řekli, že marketing není jejich silnou stránkou, což je pravděpodobně důvod, proč to uniklo pozornosti. Budu s nimi úzce spolupracovat, abych jim pomohl utvářet strategii GTM, která skutečně odráží hloubku toho, co budují. S tržní kapitalizací 4 miliony dolarů a touto úrovní infrastruktury působí masivně podhodnoceně. Pokud dokážou dodat použitelný produkt, myslím, že by to mohlo snadno znamenat začátek dalšího cyklu infra AI. Jako vždy, je tu riziko, a i když jsem tým v posledních několika týdnech prověřil v tajnosti, žádný projekt není nikdy zcela odolný proti kobercům. Cílové ceny? Mnohem vyšší.

Tldr o tom, proč jsem si vybral Codec > Nuit pro operátory: Kodek používá třívrstvou architekturu (stroj, systém, inteligence), která umožňuje izolované, vysoce výkonné agenty s nativním řízením. Každý agent kodeku běží lokálně pomocí smyčky Vision-Language-Action (VLA), což snižuje latenci a zvyšuje spolehlivost. Model Nuit závisí na analýze prohlížeče + cloudových volání AI, což omezuje flexibilitu a přináší křehkost. Kodek se horizontálně škáluje napříč tisíci agenty, bez sdíleného stavu a modularitou odolnou proti chybám.

10,23 tis.

Obsah na této stránce poskytují třetí strany. Není-li uvedeno jinak, společnost OKX není autorem těchto informací a nenárokuje si u těchto materiálů žádná autorská práva. Obsah je poskytován pouze pro informativní účely a nevyjadřuje názory společnosti OKX. Nejedná se o doporučení jakéhokoli druhu a nemělo by být považováno za investiční poradenství ani nabádání k nákupu nebo prodeji digitálních aktiv. Tam, kde se k poskytování souhrnů a dalších informací používá generativní AI, může být vygenerovaný obsah nepřesný nebo nekonzistentní. Další podrobnosti a informace naleznete v připojeném článku. Společnost OKX neodpovídá za obsah, jehož hostitelem jsou externí weby. Držená digitální aktiva, včetně stablecoinů a tokenů NFT, zahrnují vysokou míru rizika a mohou značně kolísat. Měli byste pečlivě zvážit, zde je pro vás obchodování s digitálními aktivy nebo jejich držení vhodné z hlediska vaší finanční situace.