Issue #39 · 2026-07-02 · 2026. 7. 1.

vibecamp ai builder 2026-07-02 — Rigorix — 의도를 결정론적 DAG로 컴파일하는 코딩 에이전트

2026-07-02 AI 빌더 일간 호 — 오늘 11개 카드를 정리했습니다.

🛠

최신 기술 트렌드

Rigorix 오픈소스 코딩 에이전트의 결정론적 DAG 실행 파이프라인 데모

Rigorix — 의도를 결정론적 DAG로 컴파일하는 코딩 에이전트

매 단계를 LLM에 맡기는 대신, 자연어 작업을 먼저 결정론적이고 검토 가능한 DAG(실행 그래프)로 컴파일하는 오픈소스 코딩 에이전트 런타임입니다. DAG가 '어떤 파일을 읽고, 어떤 패치를 만들고, 어떤 테스트를 돌릴지' 흐름을 통제하고, LLM은 그 안의 내용만 채웁니다. Rust 런타임에 위험 정책·권한 규칙·실행 예산·품질 게이트를 걸어 '제한된 자율성(bounded autonomy)'을 지향합니다.

💡💡 열린 에이전트 루프의 재현·감사 어려움을 DAG로 푸는 대안 아키텍처입니다. 정책 강제 CI/CD 처럼 통제가 필요한 환경에서 참고할 만합니다.

누가: Arman Jalili (arman-jalili/rigorix-oss), HN user arman-w-jalili
무엇을: Rigorix — open-source Rust coding-agent runtime that compiles a natural-language task into a deterministic, reviewable DAG and lets the LLM only fill in content within that graph
언제: 2026-07-01T01:17:41Z
왜: Open-ended agent loops are non-repeatable and hard to audit; compiling intent into a fixed DAG makes AI software engineering deterministic, auditable, and policy-bounded

#에이전트#코딩에이전트#결정론#rust#오픈소스#감사가능성

이미지: AI 생성 이미지원문 →

Anthropic, Claude 매니지드 에이전트 API 5종 확장

Claude Developer Platform의 매니지드 에이전트(Managed Agents)에 다섯 가지가 추가됐습니다. 메시지가 생성되는 중간 텍스트를 미리 보는 이벤트 델타 스트리밍, 세션별로 모델·프롬프트·툴·MCP·스킬을 갈아끼우는 세션 단위 오버라이드, vault 자격증명의 주입 위치(headers·body) 제어, 그리고 배포·배포실행 라이프사이클까지 폴링 없이 잡는 웹훅 확대입니다. 세션 목록에는 역방향 페이지네이션 커서도 붙었습니다.

💡💡 Claude로 에이전트를 프로덕션 운영할 때 실시간 스트리밍·세션 커스터마이징·자격증명 통제가 한 번에 갖춰집니다. 폴링을 없애 운영 관측성이 올라갑니다.

누가: Anthropic — Claude Developer Platform team
무엇을: Claude Managed Agents API 확장 — 스트리밍 event deltas, 세션 단위 에이전트 오버라이드, vault 자격증명 주입 위치 제어, 배포 라이프사이클 웹훅 확대, 세션 목록 역방향 페이지네이션
언제: 2026-07-01T00:00:00Z
왜: 매니지드 에이전트를 프로덕션에서 운영하려면 실시간 스트리밍·세션별 커스터마이징·자격증명 통제·폴링 없는 이벤트 반응이 필요했다

#claude#에이전트#매니지드에이전트#webhook#MCP#스트리밍

이미지: AI 생성 이미지원문 →

OpenAI, GeneBench-Pro 공개 — 최상위 모델도 약 70% 실패

OpenAI가 유전체·정량생물학·중개의학 129개 문제로 AI 에이전트의 '지저분한 실제 연구 판단력'을 재는 벤치마크 GeneBench-Pro를 공개했습니다. 각 문제는 일부러 노이즈를 넣은 데이터셋과 다운스트림 결정에 연결된 추정 목표를 짝지었습니다. 결과는 GPT-5.6 Sol Pro 31.5%, GPT-5.6 Sol 28.7%, 비 GPT 최강인 Anthropic Claude Opus 4.8이 16.0%로, 프런티어 모델이 약 70%를 실패했습니다. 대표 10문제는 Hugging Face에 오픈소스로 공개됐습니다.

💡💡 사실 암기가 아니라 노이즈 낀 데이터에서 분석 경로를 스스로 고르는 '판단' 축을 노출합니다. 에이전트를 과학·데이터분석에 넣으려는 빌더에게 냉정한 기준선입니다.

누가: OpenAI
무엇을: GeneBench-Pro — 유전체·정량생물학·중개의학 129개 문제로 AI 에이전트의 '지저분한 실제 연구 판단력' 을 측정하는 벤치마크 공개 + Hugging Face 에 10문제 오픈소스
언제: 2026-07-01T00:30:00Z
왜: 사실 암기가 아니라 노이즈 낀 데이터에서 분석 경로를 스스로 고르고 판단하는 실제 연구 능력을 재려는 목적 — 기존 벤치마크가 놓친 '판단' 축을 노출

#벤치마크#에이전트#openai#생물학#추론#오픈소스

이미지: AI 생성 이미지원문 →

🏆

해커톤·대회

디지털포렌식 챌린지 2026 — 국정원·한국정보보호학회

국가정보원이 한국정보보호학회와 함께 9회째 '디지털포렌식 챌린지 2026'을 엽니다. 등록은 7/1 시작, 대회 기간은 7/1~9/30, 시상식은 11월입니다. AI 코딩 취약점·가상자산 추적 등 실전형 '문제풀이'와, 로그데이터로 사이버 침해사고·개인정보 유출을 판단하는 프로그램을 만드는 '기술공모' 두 분야로 나뉩니다. 개인 또는 4인 이내 팀(공공·학생·일반)으로 dfchallenge.org에서 신청하며, 총 14팀을 시상합니다.

💡💡 AI 코딩 취약점·온체인 추적처럼 지금 가장 실무적인 보안 주제를 다룹니다. 자기 코드의 보안 사각지대를 실전 문제로 훈련하고 국가정보원장상으로 커리어 시그널을 얻을 수 있습니다.

누가: 주최: 국가정보원, 공동주최: 한국정보보호학회 (개인 또는 4인 이내 팀, 공공·학생·일반 부문)
무엇을: AI 코딩 취약점·가상자산 추적 등 실전형 '문제풀이'와 로그데이터 기반 사이버 침해사고·개인정보 유출 판단 프로그램을 만드는 '기술공모' 두 분야로 겨루는 디지털포렌식 챌린지 (9회째)
언제: 참가 신청 시작: 2026-07-01 / 대회 기간: 2026-07-01 ~ 2026-09-30 / 시상식: 2026년 11월
어디서: 온라인 신청 (dfchallenge.org), 대한민국
왜: AI 시대 디지털 범죄 대응 역량을 갖춘 실무형 보안·포렌식 인재를 발굴하기 위함. AI로 생성된 코드의 취약점 분석, 가상자산 추적 등 최신 위협에 대응하는 실전 문제 해결력을 평가
어떻게: 7월 1일부터 공식 홈페이지 dfchallenge.org에서 개인/팀(4인 이내)으로 자격(공공·학생·일반)에 맞춰 등록

#해커톤#보안#디지털포렌식#취약점분석#가상자산#국내

이미지: AI 생성 이미지원문 →

Agentic AI Build Week 2026 — 동남아 최대 에이전트 빌더톤

동남아 최대 온사이트 빌더톤으로, 실제 기업 과제를 푸는 자율 에이전트(agentic AI) 솔루션을 만들어 데모데이에서 겨룹니다. 문제 공개 7/1, 트랙 확정 마감 7/10, 빌드 위크 7/11~12, 제출 마감·데모데이·시상 7/12로 이어집니다. 장소는 베트남 호치민 Galaxy Innovation Park이고 Devpost로 등록합니다. 상금 풀은 약 13개 트랙 총 $1,000,000+이며, Founder Mode 트랙은 최대 $150K GenAI Fund 투자 기회로 연결됩니다.

💡💡 심사보다 '배포 가능한 솔루션'에 초점을 둬 에이전트를 실제 배포까지 밀어붙이는 경험을 압축합니다. 참가하지 않아도 트랙 구성·심사기준에서 인사이트를 얻을 수 있습니다.

누가: 주최: GenAI Fund (동남아 빌더 생태계). 팀 단위 참가, 법정 성년 이상
무엇을: 실제 기업 과제를 푸는 agentic AI(자율 에이전트) 솔루션을 5일간 만들어 데모데이에서 겨루는 동남아 최대 온사이트 빌더톤. 심사보다 '배포 가능한 솔루션'에 초점 — 우승작은 실제 배포 논의로 연결
언제: 문제 공개(등록 마일스톤): 2026-07-01 / 트랙 확정 마감: 2026-07-10 21:00 ICT / 빌드 위크: 2026-07-11~12 / 제출 마감: 2026-07-12 09:00 ICT / 데모데이·시상: 2026-07-12
어디서: 베트남 호치민 Galaxy Innovation Park (온사이트) + Devpost 등록, 전 세계 참가 가능
왜: 판단 기준이 '만들 수 있는가'가 아니라 '실제로 배포·출시할 수 있는가'. 실전 엔터프라이즈 문제를 푸는 에이전트를 요구하며, Founder Mode 트랙은 창업·투자 유치로 직결
어떻게: Devpost(agentic-ai-build-week-2026.devpost.com)에서 팀으로 등록. 7월 1일 공개된 문제 중 트랙을 선택해 7월 10일까지 확정

#해커톤#에이전트#agentic-ai#엔터프라이즈#베트남#글로벌

이미지: AI 생성 이미지원문 →

💰

매출·사례

Venice AI, 프라이버시 우선 플랫폼으로 유니콘 — $65M 시리즈A

Venice AI가 Dragonfly가 주도한 첫 외부 투자 $65M 시리즈A를 유치하며 밸류 $1B 유니콘이 됐습니다. 클라이언트 사이드 암호화와 서버 미저장을 앞세워 OpenAI·Anthropic 등 200개+ 오픈·클로즈드 모델에 접근하게 하는 중립 도구입니다. 이미 연환산 매출(run-rate) $70M+에 흑자이며, 활성 사용자 3M, 월 순방문 85만+, 하루 평균 API 호출 1.7M을 기록합니다. 창업자·CEO는 전 ShapeShift 창업자 Erik Voorhees입니다.

💡💡 '데이터 미저장·클라이언트 암호화'라는 프라이버시 차별화가 흑자 유니콘으로 성립함을 보여줍니다. 다중모델 게이트웨이가 상업적으로 유효한 축임을 시사합니다.

누가: Venice AI, 창업자·CEO Erik Voorhees (전 ShapeShift 창업자)
무엇을: $65M 시리즈A, 밸류 $1B(유니콘), 연환산 매출(run-rate) $70M+·흑자, 활성 사용자 3M·일 API 호출 1.7M·월 순방문 85만+
언제: 2026-07-01 TechCrunch 보도 (07:25 PDT) — 시리즈A $65M 공개, ARR $70M·흑자 상태
어디서: 미국 / TechCrunch, 투자사 Dragonfly·Coinbase Ventures·North Island Ventures
왜: '프라이버시를 포기하지 않고 200개+ AI 모델에 접근하고 싶다'는 수요 — 서버에 데이터 미저장·클라이언트 사이드 암호화로 중립 도구 지향
어떻게: 오픈소스+클로즈드 모델을 프록시로 라우팅, 데이터 미저장 구조 + 유료 구독 시 종단간 암호화. 외부 투자 없이 흑자 도달 후 첫 라운드로 확장

#매출#유니콘#프라이버시#모델게이트웨이#시리즈A#암호화

이미지: AI 생성 이미지원문 →

Together AI, $800M 시리즈C로 밸류 $8.3B — 예약매출 $1.15B

AI 네오클라우드 Together AI가 Aramco Ventures가 주도하고 Nvidia·Vista·General Catalyst 등이 참여한 $800M 시리즈C를 유치했습니다. 밸류는 16개월 전 시리즈B $3.3B에서 $8.3B로 뛰었습니다. Nvidia GPU 클러스터와 AI 전용 인프라로 오픈소스 모델을 호스팅하며 Cursor·Cognition·Decagon 등 수천 유료 고객을 둡니다. 지난 1년간 오픈소스 모델 사용이 3배로 늘어난 흐름을 타고 전분기 기준 연 예약매출(annual bookings) $1.15B+를 보고했습니다.

💡💡 오픈소스 모델 채택 3배 급증이 GPU 인프라 예약매출 $1.15B·밸류 2.5배로 직결됐습니다. 오픈소스 서빙 인프라가 폭발 성장 축임을 시사합니다.

누가: Together AI, 공동창업자 Vipul Ved Prakash(CEO)·Percy Liang·Ce Zhang
무엇을: $800M 시리즈C, 밸류 $8.3B(16개월 전 $3.3B 대비 2.5배), 연 예약매출(annual bookings) $1.15B+, 고객사 Cursor·Cognition·Decagon 등 수천
언제: 2026-07-01 TechCrunch 보도 (11:29 PDT) — 시리즈C $800M 공개, 연 예약매출 $1.15B(전분기 기준)
어디서: 미국 / TechCrunch, 리드 투자사 Aramco Ventures + Nvidia·Vista·General Catalyst 등
왜: 값비싼 독점 모델 대비 저렴한 오픈소스 모델 채택이 지난 1년간 3배로 급증 — 이를 호스팅할 GPU 인프라 수요 폭증
어떻게: Nvidia GPU 클러스터 + AI 전용 인프라를 네오클라우드로 제공해 오픈소스 모델 호스팅 수요를 흡수, 유료 고객 기반으로 예약매출 확대

#매출#네오클라우드#GPU#오픈소스#시리즈C#인프라

이미지: AI 생성 이미지원문 →

🎙

기술+사람 인터뷰

전 Llama 총괄 Sergey Edunov, 확산 모델의 다음은 신약 개발

Latent Space 팟캐스트에 Genesis Molecular AI의 CTO Sergey Edunov(전 Meta의 Llama 2·Llama 3 학습 총괄)와 CEO Evan Feinberg가 출연했습니다. 이미지 생성에 쓰이던 확산(diffusion) 모델이 이제는 약물 분자가 단백질 포켓에 결합하는 구조를 sub-angstrom 정확도로 예측하는 신약 개발에서 더 중요해지고 있다는 논의입니다. 자사 파운데이션 모델 'Pearl', LLM에서 빌려온 3단계 스케일링 플레이북, 화학자 생산성을 100배로 끌어올리는 에이전트 플랫폼 'Sapphire', 설계-제조-테스트 루프를 닫는 wet-lab 파트너십을 제시했습니다.

💡💡 Edunov는 LLM 아키텍처가 2017년 트랜스포머에서 크게 벗어나지 못한다고 봅니다. 최전선 인재가 확산 모델·과학 도메인으로 이동하는 '다음 개척지' 시그널입니다.

누가: 인터뷰이: Sergey Edunov (Genesis Molecular AI CTO, 전 Meta Llama 2·Llama 3 학습 총괄), Evan Feinberg (Genesis Molecular AI 창업자·CEO) / 진행: Latent Space (swyx·Alessio)
무엇을: 이미지 생성에서 신약 개발로 무게중심이 옮겨간 확산(diffusion) 모델, 단백질-분자 결합 예측 모델 'Pearl', LLM식 3단계 스케일링 플레이북, 에이전트 플랫폼 'Sapphire'
언제: 2026-07-01 KST (Latent Space 팟캐스트 최신 에피소드 공개 및 BigGo Finance 보도, 원기사 2026-06-30 23:09 UTC)
어디서: Latent Space: The AI Engineer Podcast (보도: BigGo Finance)
왜: 프런티어 LLM 아키텍처가 2017년 트랜스포머에서 크게 벗어나지 못하는 사이, LLM 최전선을 이끌던 인재가 확산 모델·과학 도메인으로 이동하는 흐름을 보여주는 신선한 시그널. AI 빌더에게 '다음 개척지'가 어디인지 알려준다.
어떻게: LLM에서 검증된 스케일링 법칙을 저데이터 도메인(신약)에 이식하고, 물리 기반 보상 → 실제 wet-lab 측정으로 이어지는 RL 루프, 그리고 24/7 에이전트가 모델을 반복 호출해 화학자가 실제로 만들고 싶어 하는 분자를 설계하도록 설계-제조-테스트 루프를 자동화

#인터뷰#확산모델#신약개발#llama#스케일링#에이전트

이미지: AI 생성 이미지원문 →

이 호가 도움됐다면 공유해 주세요.

📤 공유하기𝕏 @in f 💬✈B ✉