vibecamp ai builder · #14 · 2026-05-17

vibecamp ai builder 2026-05-17

2026-05-17 AI 빌더 일간 호.

8개 카드 · AI Agent 를 만드는 사람의 일간

🛠

빌더 신호

NVIDIA SANA-WM, 단일 GPU로 1분 720p 영상 생성 월드모델 공개

NVIDIA Labs가 5월 16일 단일 이미지와 카메라 궤적만으로 60초 길이 720p 영상을 생성하는 2.6B 파라미터 오픈소스 월드 모델 SANA-WM을 공개했다. 표준 softmax 어텐션은 영상 길이가 길어질수록 메모리가 폭발해 분 단위 생성이 비현실적이었으나, SANA-WM은 Gated DeltaNet + softmax 하이브리드 백본으로 영상 길이와 무관하게 일정한 D×D 상태를 유지해 이 문제를 해결했다. 성능도 인상적이다. H100 8장에서 시간당 22편을 생성해 비슷한 VBench 품질의 LingBot-World 대비 36배 높은 처리량을 보이며, NVFP4 양자화를 적용한 증류 버전은 RTX 5090 한 장으로 60초 720p 클립을 34초 만에 denoise한다. 모델은 H100 64장으로 약 18.5일, 공개 영상 클립 21만 2,975편만으로 학습됐고 NVlabs/Sana GitHub 레포에서 받을 수 있다. Hacker News 프론트페이지에서 265점을 기록했다.

💡💡 월드 모델·비디오 생성이 더 이상 대규모 GPU 클러스터의 영역이 아닙니다. RTX 5090 한 장이면 1분 영상 생성을 실험할 수 있으니, 카메라 제어형 영상·시뮬레이션·게임 프로토타입을 구상 중이라면 SANA-WM 레포를 바로 받아 PoC를 돌려보세요.

원문 →#world-model#video-generation#open-source#nvidia#diffusion-transformer

arXiv, 검증 안 한 LLM 논문 제출 시 1년 투고 금지

프리프린트 저장소 arXiv가 5월 16일, LLM 생성 결과를 검증하지 않은 명백한 증거가 담긴 논문을 제출한 저자에게 1년 투고 금지를 부과하는 강화 정책을 공식화했다. 금지 후 첫 투고는 동료심사 학회/저널을 먼저 통과해야 한다. 금지를 유발하는 증거에는 환각된 참고문헌, 그리고 "여기 200자 요약입니다" 같은 LLM 메타코멘트나 "실험에서 나온 실제 수치를 채워 넣으세요" 같은 플레이스홀더 지시문이 포함된다. 저자는 생성 방식과 무관하게 모든 내용에 책임을 진다. 이번 조치는 AI 생성 콘텐츠 범람을 배경으로 한다 — Nikkei는 AI 리뷰어를 조작하려는 "긍정적 리뷰만" 같은 숨겨진 프롬프트가 17개 arXiv 프리프린트에 심어져 있음을 발견했다. 전면 금지가 아니라 책임 있는 LLM 사용은 허용되며, 모더레이터가 문제를 표시하고 섹션 의장이 증거를 확인하며 이의 제기 절차도 있다.

💡💡 LLM으로 논문·기술문서·릴리스 노트를 작성한다면 출력 검증을 워크플로의 필수 단계로 박아두세요. 환각 레퍼런스 검사와 "여기 요약입니다" 같은 메타코멘트 잔재 제거를 자동 린트로 만들어두면 사고를 막을 수 있습니다.

원문 →#arxiv#ai-policy#research-integrity#llm-hallucination#ai-slop

OpenHuman, '맥락 우선' 데스크탑 에이전트로 GitHub 트렌딩 1위

오픈소스 데스크탑 AI 에이전트 OpenHuman이 5월 16일 GitHub Trending 1위에 올랐다. 이메일·코드 레포·캘린더·커뮤니케이션 도구에 OAuth로 지속 연결해 사용자 맥락을 즉시 구축하는 점이 특징으로, 데이터를 connection→fetching→memory 3단계 파이프라인으로 처리하고 메모리는 로컬 SQLite와 Markdown 파일에 저장한다. 차별점은 "맥락 우선(context-first)" 설계다. 개발자 콜렉티브 tinyhumansai는 "대부분의 에이전트는 차갑게 시작한다. Hermes는 작업을 지켜보며 배우고, OpenClaw는 플러그인이 맥락을 실어 오길 기다린다"고 기존 방식을 비판한다. 사용자가 평문 파일로 직접 검사·편집할 수 있는 메모리 계층을 제공해 빌더 친화적이다. 5월 13일 v0.53.43으로 공개됐고, 보안 우려로 흔들리는 카테고리 1위 OpenClaw(스타 37만 2,000개)와 대비된다. 다만 OpenHuman은 현재 776 스타로, 지속적 규모가 아닌 초기 모멘텀 단계다.

💡💡 에이전트를 설계한다면 메모리를 블랙박스가 아니라 사용자가 평문 파일로 검사·수정할 수 있는 계층으로 만들어보세요. '맥락을 나중에 채우기'보다 OAuth로 선제 구축하는 접근은 차용할 만하지만, 776스타 초기 단계인 만큼 프로덕션 도입 전 보안·안정성은 직접 검증해야 합니다.

원문 →#ai-agent#github-trending#open-source#desktop-agent#context-engineering

🏆

해커톤·대회

국립중앙과학관 'AI 핵 캠프 2026', 국민 투표로 우승작 선정

국립중앙과학관이 '국민의 삶을 바꾸는 AI 혁신 솔루션 개발'을 주제로 'AI 핵 캠프(Hack Camp) 2026'을 5월 16~17일 무박 2일 일정으로 대전 국립중앙과학관 미래기술관에서 개최했다. 고교생 이상 대한민국 국민이면 누구나 개인 또는 4인 이내 팀으로 참가해, 디지털 헬스·안전·포용·교육 4개 분야 중 하나를 골라 AI 솔루션을 개발했다. 이번 행사의 차별점은 심사 방식이다. 전문가 심사뿐 아니라 5월 11~16일 진행된 대국민 온라인·현장 투표(과학관 내 "AI 투표소")를 합산해 5월 17일 우승작을 최종 선정했다. 시상은 대상 1팀(상금 200만 원·과학기술부총리상), 최우수상 1·우수상 3·인기상 1·장려상 6팀으로 구성됐다. 정부 주최 공공 해커톤이 기술 완성도와 시민 공감대를 함께 평가하는 모델을 실험한 사례다.

💡💡 사회 문제 해결형 AI 프로젝트라면 실제 사용자 투표로 검증되는 공공 해커톤을 노려보세요. 데모 완성도뿐 아니라 '누가 이걸 실제로 쓰고 싶어 하는가'를 빌드 단계부터 평가 기준에 넣으면 채택 가능성이 올라갑니다.

원문 →#public-sector#korea#social-impact#ai-solution#hackathon

시카고대 'Prophet Hacks', 예측 AI 에이전트 32시간 대결

시카고 대학교 Prophet Arena 팀이 주최한 Prophet Hacks(AI Forecasting Hackathon)가 5월 16~17일 John Crerar Library에서 32시간 일정으로 열렸다. 제출 마감은 5월 17일 오후 5시(CDT), 현재 87명이 참가했고 온라인은 Discord로도 합류 가능하다. 참가자는 "미래를 예측하는 최고의 AI 에이전트"를 Forecasting·Trading 두 트랙으로 개발한다. 핵심은 평가 방식이다. 제출된 에이전트는 Kalshi 예측시장 데이터를 쓰는 Prophet Arena 시스템에서 2주간 실시간으로 지속 채점되어, 운에 의한 단발성 결과를 배제하고 실제 예측 능력을 검증한다. 각 트랙 우승팀은 한국에서 열리는 ICML 워크숍 발표 지원 여행(최대 $2,000)을 받으며, 준우승 $500, 오픈소스 기여 $300/$100이 추가로 걸렸다. Sigma Lab·Fleet AI·Kalshi가 후원했다.

💡💡 에이전트를 만든다면 '데모 1회'가 아니라 실데이터로 며칠~몇 주 지속 채점되는 라이브 벤치마크로 검증하세요. Prophet Arena 같은 오픈 벤치마크에 자신의 에이전트를 올려보면 운과 실력을 분리해 약점을 정확히 짚을 수 있습니다.

원문 →#ai-agent#forecasting#prediction-market#uchicago#icml

💰

매출·사례

Loova Agents, 멀티모델 AI 영상툴로 PH 일간 1위

여러 최상위 AI 영상·이미지 모델을 하나의 워크스페이스로 묶은 'AI 영상 디렉터' Loova Agents가 5월 16일 Product Hunt에 런칭해 당일 일간 1위(65 upvotes, 298 comments)에 올랐다. Seedance 2.0·VEO 3.1·Kling O1·Sora 2 Pro·GPT Image 2·Nano Banana Pro 등 파편화된 모델을 텍스트-투-비디오, 이미지-투-비디오, 바이럴 이펙트로 통합한 점이 특징이다. 수익화는 공개 가격 기준 4단계 크레딧 구독으로, Lite $15/mo(300크레딧)·Pro $39.20/mo(1,200크레딧, 전 모델)·Max $59.40/mo(3,000크레딧, "가장 인기")·Ultimate $119.50/mo(8,000크레딧)이다(연간 결제 기준). 5인 규모 소규모 팀이 운영하며, 정확한 MRR/ARR은 비공개라 매출 규모는 공개 가격대로만 가늠할 수 있다. 빠르게 늘어나는 AI 미디어 모델을 직접 다루는 대신 큐레이션 레이어로 상품화한 사례다.

💡💡 파편화된 신규 AI 모델을 직접 좇기보다, 여러 모델을 묶어 '큐레이션 + 크레딧 구독' 레이어로 상품화하면 소규모 팀도 곧장 과금할 수 있습니다. 모델 선택의 복잡도를 사용자 대신 흡수하는 것이 곧 제품의 가치 제안이 됩니다.

원문 →#producthunt#ai-video#subscription#credit-based#monetization

Ramp AI Index: Anthropic, 사상 첫 OpenAI 추월(34.4%)

핀테크 기업 Ramp가 5월 13일 발표한 AI Index 5월호에서, Anthropic이 기업 도입률에서 사상 처음으로 OpenAI를 추월했다. 4월 기준 데이터로 Anthropic은 +3.8%p 오른 34.4%, OpenAI는 -2.9%p 내린 32.3%를 기록했다. 이 지수는 추정·설문이 아니라 5만+ 기업의 실제 코퍼레이트 카드·인보이스 결제 데이터를 익명 집계한 것이라 "AI 빌더가 어디에 돈을 쓰는가"를 직접 보여준다. 지난 1년간 Anthropic은 기업 도입을 4배 늘린 반면 OpenAI는 +0.3%p 정체했고, 역전의 핵심 동력으로 "Anthropic 역사상 가장 빠르게 성장한 제품"인 Claude Code가 지목됐다. 리포트에 따르면 Uber는 2026년 AI 예산을 4개월 만에 소진했는데 대부분 Claude Code·Cursor에 쓰였으며, 엔지니어 도입률이 32%→84%로 뛰고 커밋 코드의 약 70%가 AI 생성이라고 한다.

💡💡 AI 빌더 도구를 만든다면 '어떤 모델 생태계 위에 올라탈지'가 곧 수익 곡선을 좌우합니다. 결제 데이터상 상승 곡선에 있는 생태계(Claude/Claude Code/MCP)와의 호환·통합을 우선순위에 두면 유료 전환에 유리합니다.

원문 →#ramp-ai-index#anthropic#business-adoption#claude-code#market-data

🎙

빌더 인터뷰

Abridge CEO "모든 에이전트는 결국 코딩 에이전트"

AI 엔지니어링 팟캐스트 Latent Space가 5월 14일 공개한 65분짜리 크로스오버 에피소드에서, 헬스케어 AI 스타트업 Abridge의 공동창업자 Janie Lee와 임상 의사결정 지원 리드 Chai Asawa가 Redpoint의 Jacob Effron, Swyx와 대담했다. Abridge는 ChatGPT 이전인 2018년에 창업해 진료 대화를 자동 문서화하는 ambient AI로 출발, 의사들이 주 10~20시간 쓰는 "pajama time"(퇴근 후 차트 작성) 부담을 겨냥했다. 올해 250개 미국 의료 시스템에서 80M+ 대화를 지원하며 누적 1억 건을 처리한다. 인터뷰의 핵심은 엔지니어링이다. 단일 모델이 아닌 "constellation of models"를 운용해 품질·지연·비용을 동시에 잡고, "거의 모든 에이전트는 그 밑에 코딩 에이전트"라는 관점으로 EHR을 파일시스템처럼 다뤄 실시간 에이전트를 구현했다. 사전 승인을 45일에서 수 분으로 줄였고, Lee는 헬스케어에선 "80/20이 통하지 않는다"고 강조했다.

💡💡 도메인 특화 에이전트를 만들 때 외부 데이터·시스템을 '파일시스템'처럼 추상화하면 코딩 에이전트 패턴을 그대로 재사용할 수 있습니다. 또한 단일 파운데이션 모델에 묶이지 말고 작업별로 모델을 조합해 품질·지연·비용을 따로 최적화하세요.

원문 →#interview#latent-space#ai-agents#healthcare-ai#model-strategy

이 호가 도움됐다면 공유해 주세요 — 빌더 한 명이 더 알게 됩니다.

📤 공유하기𝕏 @in f 💬✈B ✉