Issue #14 · 2026-05-17 · 2026. 5. 20.

vibecamp ai builder 2026-05-17

2026-05-17 AI 빌더 일간 호.

🛠

최신 기술 트렌드

NVIDIA SANA-WM, 단일 GPU로 1분 720p 영상 생성 월드모델 공개

NVIDIA Labs가 5월 16일 단일 이미지와 카메라 궤적만으로 60초 길이 720p 영상을 생성하는 2.6B 파라미터 오픈소스 월드 모델 SANA-WM을 공개했다. 표준 softmax 어텐션은 영상 길이가 길어질수록 메모리가 폭발해 분 단위 생성이 비현실적이었으나, SANA-WM은 Gated DeltaNet + softmax 하이브리드 백본으로 영상 길이와 무관하게 일정한 D×D 상태를 유지해 이 문제를 해결했다. 성능도 인상적이다. H100 8장에서 시간당 22편을 생성해 비슷한 VBench 품질의 LingBot-World 대비 36배 높은 처리량을 보이며, NVFP4 양자화를 적용한 증류 버전은 RTX 5090 한 장으로 60초 720p 클립을 34초 만에 denoise한다. 모델은 H100 64장으로 약 18.5일, 공개 영상 클립 21만 2,975편만으로 학습됐고 NVlabs/Sana GitHub 레포에서 받을 수 있다. Hacker News 프론트페이지에서 265점을 기록했다.

💡💡 월드 모델·비디오 생성이 더 이상 대규모 GPU 클러스터의 영역이 아닙니다. RTX 5090 한 장이면 1분 영상 생성을 실험할 수 있으니, 카메라 제어형 영상·시뮬레이션·게임 프로토타입을 구상 중이라면 SANA-WM 레포를 바로 받아 PoC를 돌려보세요.

누가: NVIDIA Labs (NVlabs) 연구팀
무엇을: 단일 이미지 + 카메라 궤적 입력으로 60초 720p 비디오를 생성하는 2.6B 파라미터 오픈소스 월드 모델 SANA-WM 공개. Gated DeltaNet + softmax 하이브리드 어텐션으로 분 단위 생성의 메모리 폭증 문제 해결
언제: 2026-05-16T00:00:00Z
왜: 표준 softmax 어텐션은 영상 길이에 따라 메모리가 폭발해 분 단위 생성이 비현실적이었으나, 하이브리드 선형 디퓨전 트랜스포머로 일정한 D×D 상태를 유지해 단일 GPU에서도 1분 720p 생성을 가능하게 함

#world-model#video-generation#open-source#nvidia#diffusion-transformer

이미지: AI 생성 이미지원문 →

arXiv, 검증 안 한 LLM 논문 제출 시 1년 투고 금지

프리프린트 저장소 arXiv가 5월 16일, LLM 생성 결과를 검증하지 않은 명백한 증거가 담긴 논문을 제출한 저자에게 1년 투고 금지를 부과하는 강화 정책을 공식화했다. 금지 후 첫 투고는 동료심사 학회/저널을 먼저 통과해야 한다. 금지를 유발하는 증거에는 환각된 참고문헌, 그리고 "여기 200자 요약입니다" 같은 LLM 메타코멘트나 "실험에서 나온 실제 수치를 채워 넣으세요" 같은 플레이스홀더 지시문이 포함된다. 저자는 생성 방식과 무관하게 모든 내용에 책임을 진다. 이번 조치는 AI 생성 콘텐츠 범람을 배경으로 한다 — Nikkei는 AI 리뷰어를 조작하려는 "긍정적 리뷰만" 같은 숨겨진 프롬프트가 17개 arXiv 프리프린트에 심어져 있음을 발견했다. 전면 금지가 아니라 책임 있는 LLM 사용은 허용되며, 모더레이터가 문제를 표시하고 섹션 의장이 증거를 확인하며 이의 제기 절차도 있다.

💡💡 LLM으로 논문·기술문서·릴리스 노트를 작성한다면 출력 검증을 워크플로의 필수 단계로 박아두세요. 환각 레퍼런스 검사와 "여기 요약입니다" 같은 메타코멘트 잔재 제거를 자동 린트로 만들어두면 사고를 막을 수 있습니다.

누가: arXiv (정책 발표: 컴퓨터과학 섹션 의장 Thomas Dietterich)
무엇을: LLM 생성 결과를 검증하지 않은 명백한 증거가 있는 논문을 제출한 저자에게 1년 투고 금지를 부과하는 강화 정책 공식화. 금지 후 첫 투고는 동료심사 통과 필수
언제: 2026-05-16T00:00:00Z
왜: 환각된 참고문헌, 논문에 남은 LLM 메타코멘트('여기 200자 요약' 등), 플레이스홀더 지시문이 arXiv에 범람. Nikkei가 17개 프리프린트에서 AI 리뷰어 조작용 숨겨진 프롬프트를 발견하는 등 연구 무결성 위협 확대

#arxiv#ai-policy#research-integrity#llm-hallucination#ai-slop

이미지: AI 생성 이미지원문 →

OpenHuman, '맥락 우선' 데스크탑 에이전트로 GitHub 트렌딩 1위

오픈소스 데스크탑 AI 에이전트 OpenHuman이 5월 16일 GitHub Trending 1위에 올랐다. 이메일·코드 레포·캘린더·커뮤니케이션 도구에 OAuth로 지속 연결해 사용자 맥락을 즉시 구축하는 점이 특징으로, 데이터를 connection→fetching→memory 3단계 파이프라인으로 처리하고 메모리는 로컬 SQLite와 Markdown 파일에 저장한다. 차별점은 "맥락 우선(context-first)" 설계다. 개발자 콜렉티브 tinyhumansai는 "대부분의 에이전트는 차갑게 시작한다. Hermes는 작업을 지켜보며 배우고, OpenClaw는 플러그인이 맥락을 실어 오길 기다린다"고 기존 방식을 비판한다. 사용자가 평문 파일로 직접 검사·편집할 수 있는 메모리 계층을 제공해 빌더 친화적이다. 5월 13일 v0.53.43으로 공개됐고, 보안 우려로 흔들리는 카테고리 1위 OpenClaw(스타 37만 2,000개)와 대비된다. 다만 OpenHuman은 현재 776 스타로, 지속적 규모가 아닌 초기 모멘텀 단계다.

💡💡 에이전트를 설계한다면 메모리를 블랙박스가 아니라 사용자가 평문 파일로 검사·수정할 수 있는 계층으로 만들어보세요. '맥락을 나중에 채우기'보다 OAuth로 선제 구축하는 접근은 차용할 만하지만, 776스타 초기 단계인 만큼 프로덕션 도입 전 보안·안정성은 직접 검증해야 합니다.

누가: tinyhumansai 개발자 콜렉티브
무엇을: 이메일·코드 레포·캘린더·커뮤니케이션 도구에 OAuth로 연결해 사용자 맥락을 즉시 구축하는 오픈소스 데스크탑 AI 에이전트 OpenHuman이 GitHub Trending 1위 등극. 로컬 SQLite + Markdown으로 검사·편집 가능한 메모리 계층 제공
언제: 2026-05-16T16:32:00Z
왜: 기존 에이전트(OpenClaw는 플러그인 대기, Hermes는 작업 관찰 학습)가 '차갑게 시작'하는 반면 OpenHuman은 connection→fetching→memory 3단계 파이프라인으로 사용자 이해를 선제적으로 형성. 카테고리 1위 OpenClaw의 보안 우려로 흔들리는 시장에 진입

#ai-agent#github-trending#open-source#desktop-agent#context-engineering

이미지: AI 생성 이미지원문 →

🏆

해커톤·대회

국립중앙과학관 'AI 핵 캠프 2026', 국민 투표로 우승작 선정

국립중앙과학관이 '국민의 삶을 바꾸는 AI 혁신 솔루션 개발'을 주제로 'AI 핵 캠프(Hack Camp) 2026'을 5월 16~17일 무박 2일 일정으로 대전 국립중앙과학관 미래기술관에서 개최했다. 고교생 이상 대한민국 국민이면 누구나 개인 또는 4인 이내 팀으로 참가해, 디지털 헬스·안전·포용·교육 4개 분야 중 하나를 골라 AI 솔루션을 개발했다. 이번 행사의 차별점은 심사 방식이다. 전문가 심사뿐 아니라 5월 11~16일 진행된 대국민 온라인·현장 투표(과학관 내 "AI 투표소")를 합산해 5월 17일 우승작을 최종 선정했다. 시상은 대상 1팀(상금 200만 원·과학기술부총리상), 최우수상 1·우수상 3·인기상 1·장려상 6팀으로 구성됐다. 정부 주최 공공 해커톤이 기술 완성도와 시민 공감대를 함께 평가하는 모델을 실험한 사례다.

💡💡 사회 문제 해결형 AI 프로젝트라면 실제 사용자 투표로 검증되는 공공 해커톤을 노려보세요. 데모 완성도뿐 아니라 '누가 이걸 실제로 쓰고 싶어 하는가'를 빌드 단계부터 평가 기준에 넣으면 채택 가능성이 올라갑니다.

누가: 주최: 국립중앙과학관(과학기술정보통신부 산하). 참가 대상: 고교생 이상 대한민국 국민 누구나 — 개인 또는 4인 이내 팀.
무엇을: '국민의 삶을 바꾸는 AI 혁신 솔루션 개발'을 주제로, 디지털 헬스·디지털 안전·디지털 포용·디지털 교육 4개 분야 중 하나를 선택해 AI 솔루션을 개발하고 무박 2일간 경쟁.
언제: 해커톤 본행사 2026-05-16(토)~05-17(일) 무박 2일, 대전 국립중앙과학관 미래기술관. 대국민 투표 05-11~05-16, 우승작 최종 선정·시상 05-17.
왜: 전문가 심사뿐 아니라 일반 국민이 직접 투표하는 방식을 도입 — 기술 완성도와 사회적 공감대를 함께 평가한다. 과학관 현장의 'AI 투표소'로 시민 참여를 끌어낸 점이 차별점.

#public-sector#korea#social-impact#ai-solution#hackathon

이미지: AI 생성 이미지원문 →

시카고대 'Prophet Hacks', 예측 AI 에이전트 32시간 대결

시카고 대학교 Prophet Arena 팀이 주최한 Prophet Hacks(AI Forecasting Hackathon)가 5월 16~17일 John Crerar Library에서 32시간 일정으로 열렸다. 제출 마감은 5월 17일 오후 5시(CDT), 현재 87명이 참가했고 온라인은 Discord로도 합류 가능하다. 참가자는 "미래를 예측하는 최고의 AI 에이전트"를 Forecasting·Trading 두 트랙으로 개발한다. 핵심은 평가 방식이다. 제출된 에이전트는 Kalshi 예측시장 데이터를 쓰는 Prophet Arena 시스템에서 2주간 실시간으로 지속 채점되어, 운에 의한 단발성 결과를 배제하고 실제 예측 능력을 검증한다. 각 트랙 우승팀은 한국에서 열리는 ICML 워크숍 발표 지원 여행(최대 $2,000)을 받으며, 준우승 $500, 오픈소스 기여 $300/$100이 추가로 걸렸다. Sigma Lab·Fleet AI·Kalshi가 후원했다.

💡💡 에이전트를 만든다면 '데모 1회'가 아니라 실데이터로 며칠~몇 주 지속 채점되는 라이브 벤치마크로 검증하세요. Prophet Arena 같은 오픈 벤치마크에 자신의 에이전트를 올려보면 운과 실력을 분리해 약점을 정확히 짚을 수 있습니다.

누가: 주최: University of Chicago Prophet Arena Team(Haifeng Xu 교수의 Sigma Lab 관련). 후원: Sigma Lab·Fleet AI·Kalshi. 참가: 시카고 대학교 John Crerar Library 오프라인 + Discord 온라인, 현재 87명 참가.
무엇을: 미래를 예측하는 AI 에이전트를 개발하는 해커톤. Forecasting(예측)·Trading(거래) 두 트랙으로 나뉘며, 에이전트는 Kalshi 예측시장 데이터를 쓰는 Prophet Arena 벤치마크에서 2주간 지속 평가된다.
언제: 2026-05-16(토)~05-17(일) 32시간 해커톤, 제출 마감 05-17 오후 5시 CDT. 제출 후 Prophet Arena 평가 시스템이 2주간 실시간 채점.
왜: 1회성 데모가 아니라 실제 미래 사건에 대해 2주간 연속 채점하는 라이브 평가 방식이 핵심 — 운에 의한 결과를 배제하고 에이전트의 실제 예측 능력을 검증한다. 우승 보상이 한국 ICML 워크숍 발표 기회라는 점도 학술 연계가 강하다.

#ai-agent#forecasting#prediction-market#uchicago#icml

이미지: AI 생성 이미지원문 →

💰

매출·사례

Loova Agents, 멀티모델 AI 영상툴로 PH 일간 1위

여러 최상위 AI 영상·이미지 모델을 하나의 워크스페이스로 묶은 'AI 영상 디렉터' Loova Agents가 5월 16일 Product Hunt에 런칭해 당일 일간 1위(65 upvotes, 298 comments)에 올랐다. Seedance 2.0·VEO 3.1·Kling O1·Sora 2 Pro·GPT Image 2·Nano Banana Pro 등 파편화된 모델을 텍스트-투-비디오, 이미지-투-비디오, 바이럴 이펙트로 통합한 점이 특징이다. 수익화는 공개 가격 기준 4단계 크레딧 구독으로, Lite $15/mo(300크레딧)·Pro $39.20/mo(1,200크레딧, 전 모델)·Max $59.40/mo(3,000크레딧, "가장 인기")·Ultimate $119.50/mo(8,000크레딧)이다(연간 결제 기준). 5인 규모 소규모 팀이 운영하며, 정확한 MRR/ARR은 비공개라 매출 규모는 공개 가격대로만 가늠할 수 있다. 빠르게 늘어나는 AI 미디어 모델을 직접 다루는 대신 큐레이션 레이어로 상품화한 사례다.

💡💡 파편화된 신규 AI 모델을 직접 좇기보다, 여러 모델을 묶어 '큐레이션 + 크레딧 구독' 레이어로 상품화하면 소규모 팀도 곧장 과금할 수 있습니다. 모델 선택의 복잡도를 사용자 대신 흡수하는 것이 곧 제품의 가치 제안이 됩니다.

누가: Loova 팀 — 크리에이티브 AI에 특화된 소규모 스타트업. AI 영상/이미지 생성 워크스페이스 loova.ai 운영
무엇을: 여러 최상위 AI 영상·이미지 모델(Seedance 2.0, VEO 3.1, Kling O1, Sora 2 Pro, Nano Banana Pro 등)을 하나의 크레딧 기반 워크스페이스로 묶은 'AI 영상 디렉터'. 유료 구독 4단계 — Lite $15 / Pro $39.20 / Max $59.40 / Ultimate $119.50 (월, 연간 결제)
언제: 2026년 5월 16일 Product Hunt 공식 런칭 — 당일 일간 1위 (65 upvotes, 298 comments)
왜: AI 영상 모델이 파편화돼 있어 크리에이터가 모델마다 따로 가입·결제해야 하는 불편을 하나의 크레딧 구독으로 통합. 모델 선택을 추상화한 'AI 영상 SaaS' 레이어를 선점

#producthunt#ai-video#subscription#credit-based#monetization

이미지: AI 생성 이미지원문 →

Ramp AI Index: Anthropic, 사상 첫 OpenAI 추월(34.4%)

핀테크 기업 Ramp가 5월 13일 발표한 AI Index 5월호에서, Anthropic이 기업 도입률에서 사상 처음으로 OpenAI를 추월했다. 4월 기준 데이터로 Anthropic은 +3.8%p 오른 34.4%, OpenAI는 -2.9%p 내린 32.3%를 기록했다. 이 지수는 추정·설문이 아니라 5만+ 기업의 실제 코퍼레이트 카드·인보이스 결제 데이터를 익명 집계한 것이라 "AI 빌더가 어디에 돈을 쓰는가"를 직접 보여준다. 지난 1년간 Anthropic은 기업 도입을 4배 늘린 반면 OpenAI는 +0.3%p 정체했고, 역전의 핵심 동력으로 "Anthropic 역사상 가장 빠르게 성장한 제품"인 Claude Code가 지목됐다. 리포트에 따르면 Uber는 2026년 AI 예산을 4개월 만에 소진했는데 대부분 Claude Code·Cursor에 쓰였으며, 엔지니어 도입률이 32%→84%로 뛰고 커밋 코드의 약 70%가 AI 생성이라고 한다.

💡💡 AI 빌더 도구를 만든다면 '어떤 모델 생태계 위에 올라탈지'가 곧 수익 곡선을 좌우합니다. 결제 데이터상 상승 곡선에 있는 생태계(Claude/Claude Code/MCP)와의 호환·통합을 우선순위에 두면 유료 전환에 유리합니다.

누가: Ramp — 코퍼레이트 카드/지출 관리 핀테크. 5만+ 기업의 실제 결제 데이터를 익명 집계해 AI 도구 도입률 지수 발표
무엇을: AI 도구 기업 도입률 지수. Anthropic이 사상 처음으로 OpenAI를 추월 — Anthropic 34.4%(4월 +3.8%p) vs OpenAI 32.3%(-2.9%p). 지난 1년 Anthropic은 기업 도입 4배 성장, OpenAI는 +0.3%p 정체
언제: 2026년 5월 13일 Ramp AI Index 5월호 발표 (분석 대상 데이터는 2026년 4월 기준)
왜: 추정·설문이 아닌 실제 기업 카드/인보이스 결제 데이터 기반이라 'AI 빌더가 어디에 돈을 쓰는가'를 직접 보여줌. Claude Code가 Anthropic 역사상 가장 빠르게 성장한 제품이라는 점이 도입률 역전의 핵심 동력

#ramp-ai-index#anthropic#business-adoption#claude-code#market-data

이미지: AI 생성 이미지원문 →

🎙

기술+사람 인터뷰

Abridge CEO "모든 에이전트는 결국 코딩 에이전트"

AI 엔지니어링 팟캐스트 Latent Space가 5월 14일 공개한 65분짜리 크로스오버 에피소드에서, 헬스케어 AI 스타트업 Abridge의 공동창업자 Janie Lee와 임상 의사결정 지원 리드 Chai Asawa가 Redpoint의 Jacob Effron, Swyx와 대담했다. Abridge는 ChatGPT 이전인 2018년에 창업해 진료 대화를 자동 문서화하는 ambient AI로 출발, 의사들이 주 10~20시간 쓰는 "pajama time"(퇴근 후 차트 작성) 부담을 겨냥했다. 올해 250개 미국 의료 시스템에서 80M+ 대화를 지원하며 누적 1억 건을 처리한다. 인터뷰의 핵심은 엔지니어링이다. 단일 모델이 아닌 "constellation of models"를 운용해 품질·지연·비용을 동시에 잡고, "거의 모든 에이전트는 그 밑에 코딩 에이전트"라는 관점으로 EHR을 파일시스템처럼 다뤄 실시간 에이전트를 구현했다. 사전 승인을 45일에서 수 분으로 줄였고, Lee는 헬스케어에선 "80/20이 통하지 않는다"고 강조했다.

💡💡 도메인 특화 에이전트를 만들 때 외부 데이터·시스템을 '파일시스템'처럼 추상화하면 코딩 에이전트 패턴을 그대로 재사용할 수 있습니다. 또한 단일 파운데이션 모델에 묶이지 말고 작업별로 모델을 조합해 품질·지연·비용을 따로 최적화하세요.

누가: Abridge 공동창업자/CEO Janie Lee와 Clinical Decision Support 리드 Chai Asawa가 Latent Space의 Swyx, Redpoint의 Jacob Effron과 대담
무엇을: ChatGPT 이전(2018년)에 창업한 헬스케어 AI 스타트업 Abridge가 ambient 임상 문서화에서 출발해 실시간 임상 에이전트로 확장한 과정과 엔지니어링 전략 — 모델 컨스털레이션, EHR을 파일시스템처럼 다루는 에이전트, 사전 승인 자동화 — 을 공개
언제: 2026-05-14 공개 (Latent Space: The AI Engineer Podcast 신규 에피소드, 약 65분)
왜: AI 빌더에게 '도메인 특화 에이전트 제품을 어떻게 엔지니어링하는가'의 구체적 사례. 단일 모델 종속을 피하는 모델 조합 전략, '모든 에이전트는 코딩 에이전트'라는 아키텍처 관점, 헬스케어처럼 80/20이 통하지 않는 고정확도 도메인에서의 평가 기준이 일반 SaaS 빌더에게도 직접 적용 가능

#interview#latent-space#ai-agents#healthcare-ai#model-strategy

이미지: AI 생성 이미지원문 →

이 호가 도움됐다면 공유해 주세요.

📤 공유하기𝕏 @in f 💬✈B ✉