OpenAI только что подтвердил мою северную звезду тезис для ИИ, выпустив своего оператора-агента.
Это не только был мой руководящий тезис для $CODEC, но и для всех других инвестиций в ИИ, которые я сделал, включая те, что были сделаны ранее в этом году во время мании ИИ.
С Codec было много обсуждений относительно робототехники, и хотя этот вертикаль скоро будет иметь свою собственную нарратив, основная причина, по которой я был так оптимистичен по поводу Codec с первого дня, заключается в том, как его архитектура поддерживает операторов-агентов.
Люди все еще недооценивают, сколько доли рынка на кону, создавая программное обеспечение, которое работает автономно, превосходя человеческих работников без необходимости в постоянных подсказках или контроле.
Я видел много сравнений с $NUIT. Прежде всего, я хочу сказать, что я большой поклонник того, что строит Nuit, и желаю им только успеха. Если вы наберете "nuit" в моем телеграме, вы увидите, что в апреле я сказал, что если бы мне пришлось держать одну монету в течение нескольких месяцев, это была бы Nuit из-за моего операционного тезиса.
Nuit был самым многообещающим операторским проектом на бумаге, но после обширного исследования я обнаружил, что их архитектура не имеет глубины, необходимой для оправдания крупной инвестиции или поддержки своей репутации.
С учетом этого, я уже знал о архитектурных пробелах в существующих командах операторов-агентов и активно искал проект, который бы их устранял. Вскоре после этого появился Codec (благодаря @0xdetweiler, который настаивал, чтобы я глубже изучил их), и вот в чем разница между двумя:
$CODEC против $NUIT
Архитектура Codec построена на трех уровнях: Машина, Система и Интеллект, которые разделяют инфраструктуру, интерфейс окружения и ИИ-логику. Каждый оператор-агент в Codec работает в своем собственном изолированном виртуальном машине или контейнере, что позволяет достичь почти нативной производительности и изоляции ошибок. Этот многослойный дизайн означает, что компоненты могут масштабироваться или развиваться независимо, не нарушая систему.
Архитектура Nuit идет другим путем, будучи более монолитной. Их стек вращается вокруг специализированного веб-браузерного агента, который сочетает парсинг, ИИ-рассуждение и действия. Это означает, что они глубоко парсят веб-страницы в структурированные данные для потребления ИИ и полагаются на облачную обработку для тяжелых задач ИИ.
Подход Codec к внедрению легкой модели Vision-Language-Action (VLA) в каждом агенте означает, что она может работать полностью локально. Это не требует постоянного обращения к облаку за инструкциями, что сокращает задержку и избегает зависимости от времени работы и пропускной способности.
Агент Nuit обрабатывает задачи, сначала преобразуя веб-страницы в семантический формат, а затем используя мозг LLM, чтобы понять, что делать, что со временем улучшается с помощью обучения с подкреплением. Хотя это эффективно для веб-автоматизации, этот поток зависит от тяжелой облачной обработки ИИ и предопределенных структур страниц. Локальный интеллект устройства Codec означает, что решения принимаются ближе к данным, что снижает накладные расходы и делает систему более стабильной к неожиданным изменениям (без хрупких скриптов или предположений о DOM).
Операторы Codec следуют непрерывному циклу восприятия–мышления–действия. Машинный уровень передает окружение (например, живое приложение или поток робота) на уровень интеллекта через оптимизированные каналы уровня системы, давая ИИ "глаза" на текущее состояние. Модель VLA агента затем интерпретирует визуальные данные и инструкции вместе, чтобы решить, какое действие предпринять, которое уровень системы выполняет через события клавиатуры/мыши или управление роботом. Этот интегрированный цикл означает, что он адаптируется к живым событиям, даже если интерфейс пользователя меняется, вы не нарушите поток.
Чтобы объяснить все это более простым аналогом, подумайте о операторах Codec как о самодостаточном сотруднике, который адаптируется к неожиданностям на работе. Агент Nuit похож на сотрудника, которому нужно остановиться, описать ситуацию супервайзеру по телефону и ждать инструкций.
Не углубляясь слишком сильно в технические детали, это должно дать вам общее представление о том, почему я выбрал Codec как свою основную ставку на операторов.
Да, Nuit имеет поддержку от YC, сильную команду и уровень S на github. Хотя архитектура Codec была построена с учетом горизонтального масштабирования, что означает, что вы можете развернуть тысячи агентов параллельно без общей памяти или контекста выполнения между агентами. Команда Codec тоже не средние разработчики.
Их архитектура VLA открывает множество вариантов использования, которые были невозможны с предыдущими моделями агентов из-за способности видеть через пиксели, а не скриншоты.
Я мог бы продолжать, но оставлю это для будущих постов.
Виртуальные среды для операторских агентов: $CODEC
Моя основная тезис вокруг взрыва ИИ всегда был сосредоточен на росте операторских агентов.
Но для того, чтобы эти агенты добились успеха, им требуется глубокий доступ к системе, что фактически предоставляет им контроль над вашим персональным компьютером и конфиденциальными данными, что вызывает серьезные проблемы безопасности.
Мы уже видели, как компании, такие как OpenAI и другие технологические гиганты, обрабатывают пользовательские данные. Хотя большинству людей это не важно, те, кто может извлечь наибольшую выгоду от операторских агентов, топ 1%, абсолютно заботятся об этом.
Лично я не дам компании, такой как OpenAI, полный доступ к моему компьютеру, даже если это означает 10-кратное увеличение производительности.
Так почему же Codec?
Архитектура Codec сосредоточена на запуске изолированных, по требованию "облачных рабочих столов" для ИИ агентов. В его основе лежит оркестрационная служба на базе Kubernetes (кодовое имя Captain), которая предоставляет легковесные виртуальные машины (VM) внутри подов Kubernetes.
Каждый агент получает свою собственную изолированную на уровне ОС среду (полноценный экземпляр Linux OS), где он может запускать приложения, браузеры или любой код, полностью изолированный от других агентов и хоста. Kubernetes управляет планированием, авто-масштабированием и самовосстановлением этих подов агентов, обеспечивая надежность и возможность увеличения/уменьшения количества экземпляров агентов в зависимости от нагрузки.
Доверенные среды выполнения (TEE) используются для защиты этих VM, что означает, что машина агента может быть криптографически изолирована, ее память и выполнение могут быть защищены от хостовой ОС или облачного провайдера. Это важно для чувствительных задач: например, VM, работающая в анклаве, может безопасно хранить API-ключи или секреты криптокошелька.
Когда ИИ агент ("мозг" на базе LLM) должен выполнить действия, он отправляет API-запросы в службу Captain, которая затем запускает или управляет подом VM агента. Рабочий процесс: агент запрашивает машину, Captain (через Kubernetes) выделяет под и прикрепляет постоянный том (для диска VM). Агент может затем подключиться к своей VM (через защищенный канал или потоковый интерфейс) для выполнения команд. Captain предоставляет конечные точки для агента для выполнения команд оболочки, загрузки/выгрузки файлов, получения журналов и даже создания снимка VM для последующего восстановления.
Этот дизайн предоставляет агенту полноценную операционную систему для работы, но с контролируемым, аудируемым доступом. Поскольку он построен на Kubernetes, Codec может автоматически масштабироваться горизонтально, если 100 агентам нужны среды, он может запланировать 100 подов по всему кластеру и справляться с отказами, перезапуская поды.
VM агента может быть оснащена различными MCP серверами (как "USB-порт" для ИИ). Например, модуль Conductor Codec - это контейнер, который запускает браузер Chrome вместе с сервером Microsoft Playwright MCP для управления браузером. Это позволяет ИИ агенту открывать веб-страницы, нажимать на ссылки, заполнять формы и извлекать контент через стандартные вызовы MCP, как если бы это был человек, управляющий браузером.
Другие интеграции MCP могут включать файловую систему/терминал MCP (чтобы позволить агенту безопасно выполнять команды CLI) или специфические для приложений MCP (для облачных API, баз данных и т.д.). По сути, Codec предоставляет инфраструктурные "обертки" (VM, анклавы, сети), чтобы высокоуровневые планы агентов могли безопасно выполняться на реальном программном обеспечении и сетях.
Сценарии использования
Автоматизация кошелька:
Codec может встроить кошельки или ключи внутри защищенной TEE VM, позволяя ИИ агенту взаимодействовать с блокчейн-сетями (торговать на DeFi, управлять криптоактивами) без раскрытия секретных ключей.
Эта архитектура позволяет финансовым агентам на блокчейне выполнять реальные транзакции безопасно, что было бы очень опасно в типичной настройке агента. Слоган платформы явно указывает поддержку "кошельков" как ключевую возможность.
Агент мог бы, например, запустить CLI для Ethereum кошелька внутри своего анклава, подписывать транзакции и отправлять их, с уверенностью, что если агент ведет себя неправильно, он ограничен своей VM и ключи никогда не покидают TEE.
Автоматизация браузера и веба:
Агенты CodecFlow могут управлять полными веб-браузерами в своей VM. Пример Conductor демонстрирует, как агент запускает Chrome и транслирует его экран на Twitch в реальном времени. Через Playwright MCP агент может навигировать по сайтам, нажимать кнопки и извлекать данные так же, как и человек. Это идеально для задач, таких как веб-скрейпинг за логинами, автоматизированные веб-транзакции или тестирование веб-приложений.
Традиционные фреймворки обычно полагаются на API-вызовы или простые скрипты безголовых браузеров; в отличие от этого, CodecFlow может запускать реальный браузер с видимым интерфейсом, что облегчает работу с сложными веб-приложениями (например, с тяжелым JavaScript или CAPTCHA) под управлением ИИ.
Автоматизация реальных GUI (наследственные системы):
Поскольку у каждого агента есть настоящая настольная ОС, он может автоматизировать наследственные GUI приложения или сеансы удаленного рабочего стола, фактически функционируя как автоматизация роботизированных процессов (RPA), но управляемая ИИ. Например, агент мог бы открыть электронную таблицу Excel в своей Windows VM или взаимодействовать со старым терминальным приложением, у которого нет API.
Сайт Codec упоминает возможность "наследственной автоматизации" явно. Это открывает использование ИИ для работы с программным обеспечением, которое недоступно через современные API, задача, которая была бы очень сложной или небезопасной без изолированной среды. Включенная интеграция noVNC предполагает, что агенты могут наблюдаться или управляться через VNC, что полезно для мониторинга ИИ, управляющего GUI.
Симуляция рабочих процессов SaaS:
Компании часто имеют сложные процессы, которые включают несколько приложений SaaS или наследственные системы. Например, сотрудник может взять данные из Salesforce, объединить их с данными из внутренней ERP, а затем отправить клиенту сводку по электронной почте. Codec может позволить ИИ агенту выполнить всю эту последовательность, фактически входя в эти приложения через браузер или клиентское программное обеспечение в своей VM, как это сделал бы человек. Это похоже на RPA, но с поддержкой LLM, который может принимать решения и справляться с изменчивостью.
Важно, что учетные данные для этих приложений могут быть предоставлены VM безопасно (и даже заключены в TEE), чтобы агент мог использовать их, не "видя" открытые учетные данные или не раскрывая их внешне. Это может ускорить автоматизацию рутинных задач бэк-офиса, удовлетворяя ИТ, что каждый агент работает с минимальными привилегиями и полной аудируемостью (поскольку каждое действие в VM может быть записано или зафиксировано).
Дорожная карта
- Запуск публичной демонстрации в конце месяца
- Сравнение функций с другими аналогичными платформами (нет конкурента в web3)
- Интеграция TAO
- Крупное партнерство в игровой индустрии
С точки зрения оригинальности, Codec построен на основе существующих технологий, но интегрирует их новым способом для использования ИИ агентов. Идея изолированных сред выполнения не нова (контейнеры, VM и TEE являются стандартом в облачных вычислениях), но применение их к автономным ИИ агентам с бесшовным API слоем (MCP) является крайне новаторским.
Платформа использует открытые стандарты и инструменты, где это возможно: она использует MCP серверы, такие как Playwright от Microsoft для управления браузером, вместо того, чтобы изобретать это колесо заново, и планирует поддерживать микро-VM Firecracker от AWS для более быстрой виртуализации. Она также форкнула существующие решения, такие как noVNC для потоковой передачи рабочих столов. Это демонстрирует, что проект стоит на основах проверенных технологий (Kubernetes, аппаратное обеспечение анклавов, библиотеки с открытым исходным кодом), сосредотачивая свое оригинальное развитие на логике "клея" и оркестрации ("секретный соус" - это то, как все это работает вместе).
Комбинация компонентов с открытым исходным кодом и предстоящей облачной службы (намек на упоминание утилиты токена $CODEC и публичного доступа к продукту) означает, что Codec вскоре будет доступен в нескольких формах (как услуга и самохостинг).
Команда
Moyai: более 15 лет опыта разработки, в настоящее время возглавляет разработку ИИ в Elixir Games.
lil’km: более 5 лет разработчик ИИ, в настоящее время работает с HuggingFace над проектом LeRobot.
HuggingFace - это крупная робототехническая компания, а Moyai работает в качестве главы ИИ в Elixir Games (поддерживается Square Enix и solanafdn).
Я лично общался с всей командой по видеосвязи и действительно понравилась энергия, которую они привносят. Мой друг, который поставил их на мой радар, также встретился с ними на Token2049 и только хорошо отзывался о них.
Заключительные мысли
Еще многое предстоит обсудить, что я сохраню для будущих обновлений и постов в моем Telegram-канале.
Я давно верю, что облачная инфраструктура - это будущее для операторских агентов. Я всегда уважал то, что строит Nuit, но Codec - это первый проект, который показал мне полную уверенность в стеке, которую я искал.
Команда явно топовые инженеры. Они открыто заявили, что маркетинг не их сильная сторона, что, вероятно, является причиной, почему это прошло незамеченным. Я буду тесно работать с ними, чтобы помочь сформировать стратегию GTM, которая действительно отражает глубину того, что они строят.
С рыночной капитализацией в $4 млн и таким уровнем инфраструктуры, это кажется сильно недооцененным. Если они смогут предоставить пригодный для использования продукт, я думаю, это может легко ознаменовать начало следующего цикла инфраструктуры ИИ.
Как всегда, есть риск, и хотя я проверял команду в тайне в течение последних нескольких недель, ни один проект никогда не является полностью защищенным от мошенничества.
Целевые цены? Намного выше.

Кратко о том, почему я выбрал Codec > Nuit для операторов:
Codec использует трехуровневую архитектуру (Машина, Система, Интеллект), что позволяет создавать изолированные, высокопроизводительные агенты с нативным управлением.
Каждый агент Codec работает локально, используя цикл Видение-Язык-Действие (VLA), что снижает задержку и увеличивает надежность.
Модель Nuit зависит от парсинга браузера и облачных AI-вызовов, что ограничивает гибкость и вводит хрупкость.
Codec масштабируется горизонтально на тысячи агентов, без общего состояния и с отказоустойчивой модульностью.
10,23 тыс.
56
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.