OpenAI tocmai mi-a confirmat ... | Trissy OKX Feed

OpenAI tocmai mi-a confirmat teza steaua nordică pentru AI astăzi prin lansarea agentului lor de operator. Nu numai că aceasta a fost teza mea călăuzitoare pentru $CODEC, ci și pentru toate celelalte investiții AI pe care le-am făcut, inclusiv cele de la începutul anului. Au existat multe discuții cu Codec în ceea ce privește robotica, în timp ce această verticală va avea propria narațiune foarte curând, motivul de bază pentru care am fost atât de optimist cu Codec din ziua 1 se datorează modului în care arhitectura sa alimentează agenții operatorilor. Oamenii încă subestimează cât de multă cotă de piață este în joc prin construirea de software care rulează autonom, depășind lucrătorii umani fără a fi nevoie de solicitări sau supraveghere constantă. Am văzut o mulțime de comparații cu $NUIT. În primul rând, vreau să spun că sunt un mare fan a ceea ce construiește Nuit și nu doresc nimic altceva decât succesul lor. Dacă tastați "nuit" în telegrama mea, veți vedea că în aprilie am spus că dacă ar fi trebuit să țin o monedă timp de mai multe luni, ar fi fost Nuit din cauza tezei mele de operator. Nuit a fost cel mai promițător proiect de operator pe hârtie, dar după cercetări ample, am descoperit că arhitectura lor nu avea profunzimea necesară pentru a justifica o investiție majoră sau pentru a-mi pune reputația în spatele ei. Având în vedere acest lucru, eram deja conștient de lacunele arhitecturale din echipele de agenți operatori existente și căutam în mod activ un proiect care să le rezolve. La scurt timp după ce a apărut Codec (datorită insistenței @0xdetweiler să mă uit mai adânc în ele) și aceasta este diferența dintre cele două: $CODEC vs $NUIT Arhitectura Codecului este construită pe trei straturi; Mașină, sistem și inteligență, care separă infrastructura, interfața de mediu și logica AI. Fiecare agent operator din Codec rulează în propria sa mașină virtuală sau container izolat, permițând performanțe aproape native și izolarea erorilor. Acest design stratificat înseamnă că componentele pot scala sau evolua independent fără a rupe sistemul. Arhitectura lui Nuit ia o cale diferită, fiind mai monolitică. Stiva lor se învârte în jurul unui agent specializat de browser web care combină analiza, raționamentul AI și acțiunea. Ceea ce înseamnă că analizează în profunzime paginile web în date structurate pentru a fi consumate de AI și se bazează pe procesarea în cloud pentru sarcini grele de inteligență artificială. Abordarea Codecului de a încorpora un model ușor Vision-Language-Action (VLA) în fiecare agent înseamnă că poate rula complet local. Ceea ce nu necesită un ping constant înapoi în cloud pentru instrucțiuni, eliminând latența și evitând dependența de timpul de funcționare și lățimea de bandă. Agentul lui Nuit procesează sarcinile prin conversia mai întâi a paginilor web într-un format semantic și apoi folosind un creier LLM pentru a-și da seama ce să facă, ceea ce se îmbunătățește în timp cu învățarea prin întărire. Deși este eficient pentru automatizarea web, acest flux depinde de procesarea AI grea și de structurile predefinite ale paginilor. Inteligența dispozitivului local a codecului înseamnă că deciziile se iau mai aproape de date, reducând cheltuielile generale și făcând sistemul mai stabil la modificări neașteptate (fără scripturi fragile sau ipoteze DOM). Operatorii codecului urmează o buclă continuă de percepere-gândire-acționare. Stratul de mașină transmite mediul (de exemplu, o aplicație live sau un flux robot) către stratul de inteligență prin canalele optimizate ale stratului de sistem, oferind AI "ochi" asupra stării curente. Modelul VLA al agentului interpretează apoi imaginile și instrucțiunile împreună pentru a decide asupra unei acțiuni, pe care stratul de sistem o execută prin evenimente de tastatură/mouse sau controlul robotului. Această buclă integrată înseamnă că se adaptează la evenimentele live, chiar dacă interfața de utilizare se schimbă, nu veți întrerupe fluxul. Pentru a pune toate acestea într-o analogie mai simplă, gândiți-vă la operatorii Codec ca la un angajat autosuficient care se adaptează la surprizele de la locul de muncă. Agentul lui Nuit este ca un angajat care trebuie să facă o pauză, să descrie situația unui supervizor la telefon și să aștepte instrucțiuni. Fără a intra prea mult într-o gaură de iepure tehnică, acest lucru ar trebui să vă ofere o idee de nivel înalt despre motivul pentru care am ales Codec ca pariu principal pe operatori. Yes Nuit are sprijin de la YC, o echipă stivuită și github de nivel S. Deși arhitectura Codec a fost construită având în vedere scalarea orizontală, ceea ce înseamnă că puteți implementa mii de agenți în paralel fără memorie partajată sau context de execuție între agenți. Nici echipa Codec nu este formată din dezvoltatorii obișnuiți. Arhitectura lor VLA deschide o multitudine de cazuri de utilizare care nu au fost posibile cu modelele anterioare de agenți din cauza vederii prin pixeli, nu prin capturi de ecran. Aș putea continua, dar voi păstra asta pentru postări viitoare.

Medii virtuale pentru agenții operatori: $CODEC Teza mea de bază în jurul exploziei AI s-a concentrat întotdeauna pe creșterea agenților operatori. Dar pentru ca acești agenți să reușească, au nevoie de acces profund la sistem, oferindu-le efectiv control asupra computerului personal și a datelor sensibile, ceea ce introduce probleme serioase de securitate. Am văzut deja cum companii precum OpenAI și alți giganți tehnologici gestionează datele utilizatorilor. În timp ce celor mai mulți oameni nu le pasă, persoanelor care beneficiază cel mai mult de agenții operatorilor, primii 1% absolut o fac. Personal, nu există nicio șansă să ofer unei companii precum OpenAI acces complet la mașina mea, chiar dacă asta înseamnă o creștere de 10× a productivității. Deci, de ce Codec? Arhitectura Codec este centrată pe lansarea de "desktop-uri cloud" izolate, la cerere, pentru agenții AI. În centrul său se află un serviciu de orchestrare bazat pe Kubernetes (nume de cod Captain) care furnizează mașini virtuale ușoare (VM) în podurile Kubernetes. Fiecare agent are propriul mediu izolat la nivel de sistem de operare (o instanță completă a sistemului de operare Linux) unde poate rula aplicații, browsere sau orice cod, complet sandbox de la alți agenți și gazdă. Kubernetes se ocupă de planificarea, scalarea automată și auto-vindecarea acestor poduri de agenți, asigurând fiabilitatea și capacitatea de a porni/coborî mai multe instanțe de agent în funcție de cerințele de încărcare Mediile de execuție de încredere (TEE) sunt utilizate pentru a securiza aceste mașini virtuale, ceea ce înseamnă că mașina agentului poate fi izolată criptografic, memoria și execuția acesteia pot fi protejate de sistemul de operare gazdă sau de furnizorul de cloud. Acest lucru este crucial pentru sarcinile sensibile: de exemplu, o mașină virtuală care rulează într-o enclavă ar putea deține în siguranță chei API sau secrete de portofel cripto. Când un agent AI (un "creier" bazat pe LLM) trebuie să efectueze acțiuni, acesta trimite cereri API către serviciul Captain, care apoi lansează sau gestionează podul VM al agentului. Fluxul de lucru: agentul solicită o mașină, Captain (prin Kubernetes) alocă un pod și atașează un volum persistent (pentru discul VM). Agentul se poate conecta apoi la VM (printr-un canal securizat sau o interfață de streaming) pentru a emite comenzi. Captain expune puncte finale pentru ca agentul să execute comenzi shell, să încarce/descarce fișiere, să preia jurnale și chiar să instantaneeze VM-ul pentru restaurare ulterioară. Acest design oferă agentului un sistem de operare complet în care să lucreze, dar cu acces controlat și auditat. Deoarece este construit pe Kubernetes, Codec se poate scala automat pe orizontală, dacă 100 de agenți au nevoie de medii, poate programa 100 de poduri în cluster și poate gestiona eșecurile prin repornirea podurilor. VM-ul agentului poate fi echipat cu diverse servere MCP (cum ar fi un "port USB" pentru AI). De exemplu, modulul Conductor al Codecului este un container care rulează un browser Chrome împreună cu un server Microsoft Playwright MCP pentru controlul browserului. Acest lucru permite unui agent AI să deschidă pagini web, să facă clic pe linkuri, să completeze formulare și să răzuiască conținut prin apeluri MCP standard, ca și cum ar fi un om care controlează browserul. Alte integrări MCP ar putea include un sistem de fișiere/terminal MCP (pentru a permite unui agent să ruleze comenzi CLI în siguranță) sau MCP-uri specifice aplicației (pentru API-uri cloud, baze de date etc.). În esență, Codec oferă "wrappers" de infrastructură (VM-uri, enclave, rețele), astfel încât planurile agenților de nivel înalt să poată fi executate în siguranță pe software și rețele reale. Cazuri de utilizare Automatizarea portofelului: Codecul poate încorpora portofele sau chei într-o mașină virtuală protejată TEE, permițând unui agent AI să interacționeze cu rețelele blockchain (tranzacționare pe DeFi, gestionarea activelor cripto) fără a expune chei secrete. Această arhitectură permite agenților financiari onchain să execute tranzacții reale în siguranță, ceea ce ar fi foarte periculos într-o configurație tipică de agent. Sloganul platformei enumeră în mod explicit suportul pentru "portofele" ca o capacitate cheie. Un agent ar putea, de exemplu, să ruleze un CLI pentru un portofel Ethereum în enclava sa, să semneze tranzacții și să le trimită, cu asigurarea că, dacă agentul se comportă greșit, este limitat la VM și cheile nu părăsesc niciodată TEE. Automatizarea browserului și web: Agenții CodecFlow pot controla browsere web complete în VM-ul lor. Exemplul Conductor demonstrează un agent care lansează Chrome și transmite ecranul său pe Twitch în timp real. Prin intermediul Playwright MCP, agentul poate naviga pe site-uri web, poate face clic pe butoane și poate răzui date la fel ca un utilizator uman. Acest lucru este ideal pentru sarcini precum web scraping în spatele autentificărilor, tranzacții web automate sau testarea aplicațiilor web. Cadrele tradiționale se bazează de obicei pe apeluri API sau scripturi simple de browser headless; în schimb, CodecFlow poate rula un browser real cu o interfață de utilizare vizibilă, facilitând gestionarea aplicațiilor web complexe (de exemplu, cu provocări JavaScript sau CAPTCHA grele) sub controlul AI. Automatizarea GUI în lumea reală (sisteme moștenite): Deoarece fiecare agent are un sistem de operare desktop real, acesta poate automatiza aplicațiile GUI vechi sau sesiunile desktop la distanță, funcționând în esență ca automatizarea proceselor robotice (RPA), dar condusă de AI. De exemplu, un agent ar putea deschide o foaie de calcul Excel în VM-ul său Windows sau ar putea interacționa cu o aplicație terminală veche care nu are API. Site-ul Codec menționează activarea explicită a "automatizării moștenite". Acest lucru deschide utilizarea AI pentru a opera software care nu este accesibil prin API-uri moderne, o sarcină care ar fi foarte hack sau nesigură fără un mediu izolat. Integrarea noVNC inclusă sugerează că agenții pot fi observați sau controlați prin VNC, ceea ce este util pentru monitorizarea unei inteligențe artificiale care conduce o interfață grafică. Simularea fluxurilor de lucru SaaS: Companiile au adesea procese complexe care implică mai multe aplicații SaaS sau sisteme moștenite. de exemplu, un angajat ar putea lua date de la Salesforce, le poate combina cu date de la un ERP intern, apoi ar putea trimite un rezumat prin e-mail unui client. Codecul poate permite unui agent AI să efectueze întreaga secvență conectându-se efectiv la aceste aplicații printr-un browser sau software client în VM, la fel ca un om. Acest lucru este ca RPA, dar alimentat de un LLM care poate lua decizii și gestiona variabilitatea. Important, acreditările acestor aplicații pot fi furnizate VM în siguranță (și chiar incluse într-un TEE), astfel încât agentul să le poată folosi fără a "vedea" vreodată acreditările în text simplu sau a le expune extern. Acest lucru ar putea accelera automatizarea sarcinilor de rutină de back-office, satisfacând în același timp IT-ul pe care fiecare agent îl rulează cu cel mai mic privilegiu și auditabilitate completă (deoarece fiecare acțiune din VM poate fi înregistrată sau înregistrată). Foaie de parcurs - Lansarea demonstrației publice la sfârșitul lunii - Compararea caracteristicilor cu alte platforme similare (fără concurență web3) - Integrarea TAO - Parteneriat mare pentru jocuri de noroc În ceea ce privește originalitatea, Codec este construit pe o bază de tehnologii existente, dar le integrează într-un mod nou pentru utilizarea agenților AI. Ideea de medii de execuție izolate nu este nouă (containerele, VM-urile și TEE-urile sunt standard în cloud computing), dar aplicarea lor la agenți AI autonomi cu un strat API fără întreruperi (MCP) este extrem de nouă. Platforma folosește standarde și instrumente deschise ori de câte ori este posibil: folosește servere MCP precum Playwright de la Microsoft pentru controlul browserului în loc să reinventeze acea roată și intenționează să suporte micro-VM-urile Firecracker de la AWS pentru o virtualizare mai rapidă. De asemenea, a bifurcat soluțiile existente, cum ar fi noVNC pentru desktop-uri de streaming. Demonstrarea proiectului stă pe bazele unei tehnologii dovedite (Kubernetes, hardware de enclavă, biblioteci open-source), concentrându-și dezvoltarea originală pe logica și orchestrarea lipiciului ("sosul secret" este modul în care funcționează toate împreună). Combinația de componente open-source și un viitor serviciu cloud (sugerat de menționarea unui utilitar $CODEC token și acces public la produse) înseamnă că Codec va fi în curând accesibil în mai multe forme (atât ca serviciu, cât și auto-găzduit). Echipă Moyai: 15+ ani de experiență în dezvoltare, în prezent conduc dezvoltarea AI la Elixir Games. lil'km: 5+ ani de dezvoltator AI, lucrând în prezent cu HuggingFace la proiectul LeRobot. HuggingFace este o companie uriașă de robotică, iar Moyai lucrează ca șef de inteligență artificială la elixir games (susținut de square enix și solanafdn. Am sunat personal prin video întreaga echipă și îmi place foarte mult energia pe care o aduc. Prietenul meu care le-a pus pe radarul meu i-a întâlnit și el pe toți la Token2049 și a avut doar lucruri bune de spus. Gânduri finale Mai sunt multe de acoperit, pe care le voi păstra pentru actualizări și postări viitoare pe canalul meu de Telegram. Am crezut de mult timp că infrastructura cloud este viitorul agenților operatori. Întotdeauna am respectat ceea ce construiește Nuit, dar Codec este primul proiect care mi-a arătat convingerea pe care o căutam. Echipa este în mod clar ingineri de top. Ei au spus deschis că marketingul nu este punctul lor forte, motiv pentru care acest lucru a trecut sub radar. Voi lucra îndeaproape cu ei pentru a ajuta la modelarea strategiei GTM care să reflecte de fapt profunzimea a ceea ce construiesc. Cu o capitalizare de piață de 4 milioane de dolari și acest nivel de infrastructură, se simte masiv subevaluat. Dacă pot livra un produs utilizabil, cred că ar putea marca cu ușurință începutul următorului infraciclu AI. Ca întotdeauna, există riscuri și, deși am verificat echipa pe ascuns în ultimele săptămâni, niciun proiect nu este vreodată complet rezistent la covor. Ținte de preț? Mult mai sus.

Tldr despre motivul pentru care am ales Codec > Nuit pentru operatori: Codecul folosește o arhitectură cu trei straturi (mașină, sistem, inteligență) care permite agenți izolați, de înaltă performanță, cu control nativ. Fiecare agent Codec rulează local folosind o buclă Vision-Language-Action (VLA), reducând latența și crescând fiabilitatea. Modelul Nuit depinde de analizarea browserului + apeluri AI în cloud, ceea ce limitează flexibilitatea și introduce fragilitate. Codecul se scalează orizontal pe mii de agenți, fără stare partajată și modularitate tolerantă la erori.

12,46 K

Conținutul de pe această pagină este furnizat de terți. Dacă nu se menționează altfel, OKX nu este autorul articolului citat și nu revendică niciun drept intelectual pentru materiale. Conținutul este furnizat doar pentru informare și nu reprezintă opinia OKX. Nu este furnizat pentru a fi o susținere de nicio natură și nu trebuie să fie considerat un sfat de investiție sau o solicitare de a cumpăra sau vinde active digitale. În măsura în care AI-ul de generare este utilizat pentru a furniza rezumate sau alte informații, astfel de conținut generat de AI poate să fie inexact sau neconsecvent. Citiți articolul asociat pentru mai multe detalii și informații. OKX nu răspunde pentru conținutul găzduit pe pagini terțe. Deținerile de active digitale, inclusiv criptomonedele stabile și NFT-urile, prezintă un grad ridicat de risc și pot fluctua semnificativ. Trebuie să analizați cu atenție dacă tranzacționarea sau deținerea de active digitale este adecvată pentru dumneavoastră prin prisma situației dumneavoastră financiare.