OpenAI bekreftet nettopp min nordlige stjerneoppgave for AI i dag ved å frigi operatøragenten deres. Ikke bare var dette min veiledende oppgave for $CODEC, men alle andre AI-investeringer jeg gjorde, inkludert de fra tidligere på året under AI-mani. Det har vært mye diskusjon med Codec med hensyn til robotikk, mens den vertikalen vil ha sin egen fortelling veldig snart, er den underliggende grunnen til at jeg var så positiv til Codec fra dag 1 på grunn av hvordan arkitekturen driver operatøragenter. Folk undervurderer fortsatt hvor mye markedsandel som står på spill ved å bygge programvare som kjører autonomt, og overgår menneskelige arbeidere uten behov for konstante spørsmål eller tilsyn. Jeg har sett mange sammenligninger med $NUIT. For det første vil jeg si at jeg er en stor fan av det Nuit bygger og ønsker ingenting annet enn suksess. Hvis du skriver "nuit" i telegrammet mitt, vil du se at jeg tilbake i april sa at hvis jeg måtte holde en mynt i flere måneder, ville det ha vært Nuit på grunn av operatøroppgaven min. Nuit var det mest lovende operatørprosjektet på papiret, men etter omfattende undersøkelser fant jeg ut at arkitekturen deres manglet dybden som trengs for å rettferdiggjøre en stor investering eller legge omdømmet mitt bak det. Med dette i tankene var jeg allerede klar over de arkitektoniske hullene i eksisterende operatøragentteam og søkte aktivt etter et prosjekt som adresserte dem. Kort tid etter dukket Codec opp (takket være at @0xdetweiler insisterte på at jeg ser dypere inn i dem), og dette er forskjellen mellom de to: $CODEC mot $NUIT Codecs arkitektur er bygget over tre lag; Maskin, system og intelligens, som skiller infrastruktur, miljøgrensesnitt og AI-logikk. Hver operatøragent i Codec kjører i sin egen isolerte virtuelle maskin eller beholder, noe som gir nesten opprinnelig ytelse og feilisolering. Denne lagdelte designen betyr at komponenter kan skaleres eller utvikles uavhengig uten å ødelegge systemet. Nuits arkitektur tar en annen vei ved å være mer monolitisk. Stabelen deres dreier seg om en spesialisert nettleseragent som kombinerer parsing, AI-resonnement og handling. Det betyr at de dypt analyserer nettsider til strukturerte data som AI kan konsumere og er avhengige av skybehandling for tunge AI-oppgaver. Codecs tilnærming med å bygge inn en lett Vision-Language-Action (VLA)-modell i hver agent betyr at den kan kjøre helt lokalt. Noe som ikke krever konstant ping tilbake til skyen for instruksjoner, kutter ut ventetid og unngår avhengighet av oppetid og båndbredde. Nuits agent behandler oppgaver ved først å konvertere nettsider til et semantisk format og deretter bruke en LLM-hjerne for å finne ut hva de skal gjøre, noe som forbedres over tid med forsterkende læring. Selv om denne flyten er effektiv for nettautomatisering, avhenger den av tung AI-behandling på skysiden og forhåndsdefinerte sidestrukturer. Codecs lokale enhetsintelligens betyr at beslutninger skjer nærmere dataene, noe som reduserer overhead og gjør systemet mer stabilt for uventede endringer (ingen skjøre skript eller DOM-antakelser). Codecs operatører følger en kontinuerlig oppfatte-tenke-handle-sløyfe. Maskinlaget strømmer miljøet (f.eks. en live-app eller robotfeed) til intelligenslaget via systemlagets optimaliserte kanaler, noe som gir AI "øyne" på den nåværende tilstanden. Agentens VLA-modell tolker deretter bildene og instruksjonene sammen for å bestemme en handling, som systemlaget utfører gjennom tastatur-/musehendelser eller robotkontroll. Denne integrerte sløyfen betyr at den tilpasser seg live-arrangementer, selv om brukergrensesnittet skifter rundt, vil du ikke bryte flyten. For å sette alt dette i en enklere analogi, tenk på Codecs operatører som en selvforsynt ansatt som tilpasser seg overraskelser på jobben. Nuits agent er som en ansatt som må ta en pause, beskrive situasjonen til en veileder over telefon og vente på instruksjoner. Uten å gå for mye ned i et teknisk kaninhull, bør dette gi deg en idé på høyt nivå om hvorfor jeg valgte Codec som min primære innsats på operatører. Ja, Nuit har støtte fra YC, et stablet team og S-nivå github. Selv om Codecs arkitektur er bygget med horisontal skalering i tankene, noe som betyr at du kan distribuere tusenvis av agenter parallelt med null delt minne eller utførelseskontekst mellom agenter. Codecs team er heller ikke dine gjennomsnittlige utviklere. VLA-arkitekturen deres åpner en rekke brukstilfeller som ikke var mulig med tidligere agentmodeller på grunn av å se gjennom piksler, ikke skjermbilder. Jeg kunne fortsette, men jeg sparer det til fremtidige innlegg.
Virtuelle miljøer for operatøragenter: $CODEC Kjerneoppgaven min rundt eksplosjonen av AI har alltid sentrert seg om fremveksten av operatøragenter. Men for at disse agentene skal lykkes, krever de dyp systemtilgang, noe som effektivt gir dem kontroll over din personlige datamaskin og sensitive data, noe som introduserer alvorlige sikkerhetsproblemer. Vi har allerede sett hvordan selskaper som OpenAI og andre teknologigiganter håndterer brukerdata. Mens de fleste ikke bryr seg, gjør de personene som kan dra mest nytte av operatøragenter, de øverste 1 % absolutt. Personlig er det null sjanse for at jeg gir et selskap som OpenAI full tilgang til maskinen min, selv om det betyr en 10× økning i produktiviteten. Så hvorfor Codec? Codecs arkitektur er sentrert om å lansere isolerte, on-demand "skystasjoner" for AI-agenter. Kjernen er en Kubernetes-basert orkestreringstjeneste (kodenavn Captain) som klargjør lette virtuelle maskiner (VM-er) i Kubernetes-pods. Hver agent får sitt eget isolerte miljø på OS-nivå (en fullstendig Linux OS-forekomst) der den kan kjøre applikasjoner, nettlesere eller hvilken som helst kode, fullstendig sandkasse fra andre agenter og verten. Kubernetes håndterer planlegging, automatisk skalering og selvreparasjon av disse agentpodene, noe som sikrer pålitelighet og muligheten til å spinne opp/ned mange agentforekomster etter hvert som belastningen krever Trusted Execution Environments (TEE-er) brukes til å sikre disse virtuelle maskinene, noe som betyr at agentens maskin kan isoleres kryptografisk, minnet og kjøringen kan beskyttes mot vertsoperativsystemet eller skyleverandøren. Dette er avgjørende for sensitive oppgaver: for eksempel kan en virtuell maskin som kjører i en enklave holde API-nøkler eller kryptolommebokhemmeligheter sikkert. Når en AI-agent (en LLM-basert «hjerne») trenger å utføre handlinger, sender den API-forespørsler til Captain-tjenesten, som deretter starter eller administrerer agentens VM-pod. Arbeidsflyten: agenten ber om en maskin, Captain (gjennom Kubernetes) tildeler en pod og legger ved et vedvarende volum (for VM-disken). Agenten kan deretter koble til den virtuelle maskinen (via en sikker kanal eller strømmegrensesnitt) for å utstede kommandoer. Captain eksponerer endepunkter for agenten for å utføre skallkommandoer, laste opp/laste ned filer, hente logger og til og med ta et øyeblikksbilde av den virtuelle maskinen for senere gjenoppretting. Denne utformingen gir agenten et komplett operativsystem å jobbe i, men med kontrollert, revidert tilgang. Fordi den er bygget på Kubernetes, kan Codec automatisk skalere horisontalt, hvis 100 agenter trenger miljøer, kan den planlegge 100 pods på tvers av klyngen, og håndtere feil ved å starte pods på nytt. Agentens virtuelle maskin kan utstyres med forskjellige MCP-servere (som en "USB-port" for AI). For eksempel er Codecs Conductor-modul en beholder som kjører en Chrome-nettleser sammen med en Microsoft Playwright MCP-server for nettleserkontroll. Dette lar en AI-agent åpne nettsider, klikke på lenker, fylle ut skjemaer og skrape innhold via standard MCP-anrop, som om det var et menneske som kontrollerer nettleseren. Andre MCP-integrasjoner kan inkludere et filsystem/terminal MCP (for å la en agent kjøre CLI-kommandoer sikkert) eller applikasjonsspesifikke MCP-er (for sky-APIer, databaser, etc.). I hovedsak gir Codec infrastrukturens "wrappers" (VM-er, enklaver, nettverk) slik at agentplaner på høyt nivå trygt kan kjøres på ekte programvare og nettverk. Bruksområder Automatisering av lommebok: Codec kan bygge inn lommebøker eller nøkler i en TEE-beskyttet VM, slik at en AI-agent kan samhandle med blokkjedenettverk (handle på DeFi, administrere kryptoaktiva) uten å avsløre hemmelige nøkler. Denne arkitekturen gjør det mulig for finansagenter på kjeden som utfører reelle transaksjoner på en sikker måte, noe som ville være svært farlig i et typisk agentoppsett. Plattformens slagord viser eksplisitt støtte for "lommebøker" som en nøkkelfunksjon. En agent kan for eksempel kjøre en CLI for en Ethereum-lommebok inne i enklaven, signere transaksjoner og sende dem, med forsikring om at hvis agenten oppfører seg dårlig, er den begrenset til VM-en og nøklene forlater aldri TEE. Nettleser og nettautomatisering: CodecFlow-agenter kan kontrollere fullstendige nettlesere i den virtuelle maskinen. Dirigent-eksemplet viser en agent som starter Chrome og strømmer skjermen til Twitch i sanntid. Gjennom Playwright MCP kan agenten navigere på nettsteder, klikke på knapper og skrape data akkurat som en menneskelig bruker. Dette er ideelt for oppgaver som nettskraping bak pålogginger, automatiserte netttransaksjoner eller testing av nettapper. Tradisjonelle rammeverk er vanligvis avhengige av API-kall eller enkle hodeløse nettleserskript; derimot kan CodecFlow kjøre en ekte nettleser med et synlig brukergrensesnitt, noe som gjør det enklere å håndtere komplekse webapplikasjoner (f.eks. med tunge JavaScript- eller CAPTCHA-utfordringer) under AI-kontroll. GUI-automatisering i den virkelige verden (eldre systemer): Fordi hver agent har et faktisk skrivebordsoperativsystem, kan den automatisere eldre GUI-applikasjoner eller eksterne skrivebordsøkter, som i hovedsak fungerer som robotprosessautomatisering (RPA), men drevet av AI. En agent kan for eksempel åpne et Excel-regneark i sin virtuelle Windows-maskin, eller grensesnitt med et gammelt terminalprogram som ikke har noen API. Codecs nettsted nevner å aktivere "eldre automatisering" eksplisitt. Dette åpner for bruk av AI for å betjene programvare som ikke er tilgjengelig via moderne APIer, en oppgave som ville vært veldig hacky eller usikker uten et innesluttet miljø. Den inkluderte noVNC-integrasjonen antyder at agenter kan observeres eller kontrolleres via VNC, noe som er nyttig for å overvåke en AI som driver et GUI. Simulering av SaaS-arbeidsflyter: Bedrifter har ofte komplekse prosesser som involverer flere SaaS-applikasjoner eller eldre systemer. for eksempel kan en ansatt ta data fra Salesforce, kombinere dem med data fra en intern ERP, og deretter sende et sammendrag på e-post til en klient. Codec kan gjøre det mulig for en AI-agent å utføre hele denne sekvensen ved å faktisk logge på disse appene via en nettleser eller klientprogramvare i VM-en, omtrent som et menneske ville gjort. Dette er som RPA, men drevet av en LLM som kan ta beslutninger og håndtere variasjon. Det er viktig at legitimasjonen til disse appene kan gis til den virtuelle maskinen på en sikker måte (og til og med omsluttet av en TEE), slik at agenten kan bruke dem uten å «se» legitimasjon i ren tekst eller eksponere dem eksternt. Dette kan akselerere automatisering av rutinemessige backoffice-oppgaver samtidig som det tilfredsstiller IT med at hver agent kjører med minst mulig privilegium og full revisjonsevne (siden hver handling i VM kan logges eller registreres). Veikart - Lanser offentlig demo i slutten av måneden - Funksjonssammenligning med andre lignende plattformer (ingen web3-konkurrent) - TAO-integrasjon - Stort spillpartnerskap Når det gjelder originalitet, er Codec bygget på et fundament av eksisterende teknologier, men integrerer dem på en ny måte for AI-agentbruk. Ideen om isolerte utførelsesmiljøer er ikke ny (beholdere, virtuelle maskiner og TEE-er er standard i cloud computing), men å bruke dem på autonome AI-agenter med et sømløst API-lag (MCP) er ekstremt nytt. Plattformen utnytter åpne standarder og verktøy der det er mulig: den bruker MCP-servere som Microsofts Playwright for nettleserkontroll i stedet for å finne opp hjulet på nytt, og planlegger å støtte AWS sine Firecracker mikro-VM-er for raskere virtualisering. Den forgrenet også eksisterende løsninger som noVNC for streaming av stasjonære datamaskiner. Å demonstrere prosjektet står på grunnlaget for velprøvd teknologi (Kubernetes, enklavemaskinvare, åpen kildekode-biblioteker), og fokuserer den opprinnelige utviklingen på limlogikk og orkestrering (den "hemmelige sausen" er hvordan det hele fungerer sammen). Kombinasjonen av åpen kildekode-komponenter og en kommende skytjeneste (antydet av omtale av et $CODEC token-verktøy og offentlig produkttilgang) betyr at Codec snart vil være tilgjengelig i flere former (både som en tjeneste og selvdriftet). Lag Moyai: 15+ års utviklererfaring, leder for tiden AI-utvikling hos Elixir Games. lil'km: 5+ år AI-utvikler, jobber for tiden med HuggingFace på LeRobot-prosjektet. HuggingFace er et stort robotikkselskap og Moyai jobber som leder for ai hos elixir games (støttet av square enix og solanafdn. Jeg har personlig videoringt hele teamet og liker virkelig energien de bringer med seg. Vennen min som satte dem på radaren min møtte dem også alle på Token2049 og hadde bare gode ting å si. Avsluttende tanker Det er fortsatt mye igjen å dekke, som jeg vil spare til fremtidige oppdateringer og innlegg i Telegram-kanalen min. Jeg har lenge trodd at skyinfrastruktur er fremtiden for operatøragenter. Jeg har alltid respektert det Nuit bygger, men Codec er det første prosjektet som har vist meg den fullstack-overbevisningen jeg lette etter. Teamet er helt klart ingeniører på toppnivå. De har åpent sagt at markedsføring ikke er deres styrke, og det er sannsynligvis grunnen til at dette har fløyet under radaren. Jeg kommer til å jobbe tett med dem for å hjelpe til med å forme GTM-strategien som faktisk gjenspeiler dybden i det de bygger. Med en markedsverdi på 4 millioner dollar og dette nivået av infrastruktur, føles den massivt underpriset. Hvis de kan levere et brukbart produkt, tror jeg det lett kan markere begynnelsen på neste AI-infrastruktursyklus. Som alltid er det risiko, og selv om jeg har undersøkt teamet i sniking de siste ukene, er ingen prosjekter noen gang helt teppesikre. Prismål? Mye høyere.
Tldr om hvorfor jeg valgte Codec > Nuit for Operators: Codec bruker en trelagsarkitektur (maskin, system, intelligens) som muliggjør isolerte agenter med høy ytelse med innebygd kontroll. Hver kodekagent kjører lokalt ved hjelp av en Vision-Language-Action (VLA)-sløyfe, noe som reduserer ventetiden og øker påliteligheten. Nuits modell er avhengig av nettleserparsing + sky-AI-anrop, noe som begrenser fleksibiliteten og introduserer skjørhet. Kodeken skaleres horisontalt på tvers av tusenvis av agenter, uten delt tilstand og feiltolerant modularitet.
Vis originalen
10,23k
56
Innholdet på denne siden er levert av tredjeparter. Med mindre annet er oppgitt, er ikke OKX forfatteren av de siterte artikkelen(e) og krever ingen opphavsrett til materialet. Innholdet er kun gitt for informasjonsformål og representerer ikke synspunktene til OKX. Det er ikke ment å være en anbefaling av noe slag og bør ikke betraktes som investeringsråd eller en oppfordring om å kjøpe eller selge digitale aktiva. I den grad generativ AI brukes til å gi sammendrag eller annen informasjon, kan slikt AI-generert innhold være unøyaktig eller inkonsekvent. Vennligst les den koblede artikkelen for mer detaljer og informasjon. OKX er ikke ansvarlig for innhold som er vert på tredjeparts nettsteder. Beholdning av digitale aktiva, inkludert stablecoins og NFT-er, innebærer en høy grad av risiko og kan svinge mye. Du bør nøye vurdere om handel eller innehav av digitale aktiva passer for deg i lys av din økonomiske tilstand.