본문 바로가기
하루5분.짧고 굵은 테크/#_.AI

Qwen 3.7부터 NVIDIA Vera까지, AI 개발 도구와 하드웨어의 진화 - 2026년 5월 주간 요약

by t루핑_. 2026. 5. 20.

이번 주 AI 업계는 새로운 모델, 개발 도구, 그리고 대규모 인수합병으로 들썩였습니다. 알리바바의 Qwen 3.7이 Arena에서 경쟁력 있는 순위에 올랐고, Cursor는 강화학습과 합성 데이터를 활용한 Composer 2.5를 공개했으며, Anthropic의 Stainless 인수는 SDK 자동화 분야에 큰 변화를 예고하고 있습니다. 이 외에도 LLM의 정치 검열 메커니즘 분석부터 NVIDIA의 첫 번째 에이전트용 CPU 출시까지, AI 기술의 깊이와 폭이 동시에 확장되고 있습니다.

🚀 빅테크 & 스타트업

Anthropic, SDK 스타트업 Stainless 인수

Anthropic이 개발자 도구 스타트업 Stainless를 인수했습니다. Stainless의 SDK 자동화 플랫폼은 OpenAI, Google, Cloudflare 등 주요 AI 기업에서 널리 사용되고 있으며, 이번 인수는 Anthropic의 개발자 도구 전략 강화를 시사합니다.

Anthropic 뉴스

  • Stainless는 OpenAI, Google, Cloudflare를 포함한 주요 AI 기업의 핵심 개발 도구로 활용되어 온 SDK 자동화 플랫폼 운영
  • Anthropic의 개발자 도구 포트폴리오 확대와 개발 생산성 강화를 위한 전략적 인수

NVIDIA의 에이전트 전용 CPU 'Vera' 출시, 주요 AI 연구실에 공급

NVIDIA의 첫 AI 에이전트용 CPU인 Vera가 완성되어 Anthropic, OpenAI, SpaceX AI, Oracle 등 주요 AI 연구실에 공급되었습니다. NVIDIA 부사장 Ian Buck이 직접 인수를 전달하며, 88개의 커스텀 Olympus 코어와 강화된 메모리 대역폭으로 고성능 에이전트 실행 환경을 제공합니다.

NVIDIA 블로그

  • Vera는 88개 커스텀 NVIDIA Olympus 코어와 1.2 TB/s 메모리 대역폭으로 구성
  • 코어당 성능이 기존 대비 50% 향상되어 에이전트 워크로드 최적화
  • Vera Rubin NVL72에서 NVLink-C2C 연결을 통해 Rubin GPU 2개와 쌍을 이루며 운영

Elon Musk의 OpenAI 소송 전원 기각, 항소 예정

Elon Musk가 Sam Altman과 OpenAI를 상대로 제기한 소송의 모든 청구가 배심원단에 의해 기각되었습니다. 배심원단은 Musk의 소송 제기 시간 지연을 주요 근거로 판단했으며, Musk는 이 결정에 대한 항소를 진행할 계획입니다.

NPR

  • 배심원단이 Musk의 모든 청구 전원 기각 결정
  • 소송 제기 시간 경과를 이유로 한 법적 판단
  • Musk는 항소 의사 표명

🔬 과학 & 미래 기술

언어모델 사전학습의 일반화 역학: 모드 호핑 현상

언어모델은 사전학습 과정에서 패턴 모방과 적응 지능 사이를 예측 불가능하게 전환하는 '모드 호핑' 현상을 보인다. 이 현상은 표준 최적화 기법으로 수정할 수 없으며, 각 학습 윈도우의 데이터가 주도하는 모델 용량 경쟁의 결과로 나타난다. 연구자들은 이러한 일반화 역학을 활용하여 사전학습 체크포인트 선택, 안정적 일반화를 위한 데이터 큐레이션, LM 행동 예측 메트릭을 개선할 수 있음을 제안한다.

Generalization Dynamics of LM Pre-training

  • 사전학습 중 패턴 모방과 적응 지능 사이의 예측 불가능한 전환 메커니즘 규명
  • 표준 최적화 기법으로는 수정 불가능한 모델 용량 경쟁의 결과로 발생
  • 학습 체크포인트 선택과 데이터 큐레이션 최적화에 일반화 역학 활용 가능
  • LM 행동 예측 메트릭 개선으로 사전학습 성능 평가 고도화

HRM-Text: 극도로 효율적인 새로운 텍스트 생성 모델 아키텍처

HRM 아키텍처 기반의 1B 텍스트 생성 모델로, 기초 모델 대비 130~600배 적은 컴퓨팅150~900배 적은 데이터로 학습할 수 있는 혁신적인 모델이다. 0.6B 파라미터 버전은 단일 노드의 8개 H100 GPU에서 약 50시간 내 약 $800에, 1B 파라미터 모델은 2개 노드의 16개 H100 GPU에서 약 46시간 내 약 $1,472에 학습 가능하다. 획기적인 컴퓨팅 효율 개선으로 기초 모델 사전학습을 대중적으로 접근 가능하게 만들어 AI 개발의 진입장벽을 크게 낮춘다.

HRM-Text (GitHub Repo)

  • 기초 모델 대비 130~600배 적은 컴퓨팅으로 텍스트 생성 모델 학습 가능
  • 150~900배 적은 데이터로 학습 효율 극대화한 새로운 모델 아키텍처
  • 0.6B 파라미터: 8개 H100 GPU, 약 50시간, $800대 비용으로 학습 가능
  • 1B 파라미터: 16개 H100 GPU, 약 46시간, $1,472 비용으로 accessible한 기초 모델 개발

👨‍💻 프로그래밍

Cursor Composer 2.5 출시

Cursor가 타겟 강화 학습, 합성 데이터, 분산 학습 기법으로 훈련된 코딩 에이전트 Composer 2.5를 출시했습니다. 이 업데이트는 개발자 생산성을 향상시키는 차세대 개발자 도구입니다.

cursor.com

  • 강화 학습으로 훈련된 개선된 코딩 에이전트
  • 합성 데이터와 분산 학습 기법 적용
  • 개발자의 코드 생성 및 자동화 향상

프로덕션 환경에서 장시간 에이전트 운영 - LangChain 웨비나

LangChain 웨비나에서 프로덕션 환경의 에이전트 배포에 필수적인 지속 가능한 실행과 중단 지점부터의 재개 기능을 구현하는 방법을 배울 수 있습니다. LangChain 프레임워크를 활용하여 복잡한 워크플로우를 안정적으로 처리하는 실무 기법을 소개합니다.

LangChain 웨비나

  • 프로덕션 환경의 지속 가능한 에이전트 실행
  • 중단 지점 복구 및 중단 없는 재개 기능
  • LangChain 프레임워크 기반 배포 전략
  • 장시간 복잡한 작업 안정성 향상

Lovable: 반복 지시사항을 재사용 가능한 스킬로 변환

Lovable의 새로운 Skills 기능은 반복되는 개발 지시사항을 마크다운 기반의 재사용 가능한 스킬로 변환합니다. 개발자가 동일한 설명을 반복할 필요 없이 개발 효율성을 크게 향상시키는 혁신적인 개발자 도구 기능입니다.

lovable.dev

  • 마크다운 기반 재사용 가능한 지시사항
  • 반복적인 작업 설명 완전 제거
  • 여러 프로젝트에 걸친 스킬 재활용
  • 개발 생산성 및 워크플로우 최적화

🎨 디자인 & 데이터 사이언스

AI 기반 검색을 위한 아키텍처 및 데이터 기초 백서

Algolia의 백서는 대규모 AI 기반 검색 시스템을 위한 완전한 기술 스택과 데이터 아키텍처를 제시합니다. 하이브리드 검색을 통해 어휘 정확성과 의미론적 재현율을 결합하고, 성능 메트릭을 제품 기능으로 엔지니어링하며, 검색된 소스 기반의 리랭킹과 추천을 설정하는 방법을 다룹니다. 코드 스니펫과 실전 RAG 프롬프트 계약, 프로덕션 안티패턴을 포함한 기술 가이드입니다.

백서 다운로드

  • 하이브리드 검색으로 어휘 정확성과 의미론적 재현율 결합
  • p95/p99 성능을 제품 기능으로 엔지니어링하는 방법
  • 리랭킹 및 추천 설정과 RAG 프롬프트 계약
  • 대규모 AI 검색 구현을 위한 프로덕션 안티패턴

에이전트 평가: 상세 기술 가이드

LLM 평가는 정적 벤치마크에서 더 동적이고 현실적인 에이전트 시스템으로 전환되고 있습니다. 코딩과 의료 같은 고위험 역할을 담당하는 에이전트가 증가함에 따라, 복잡한 환경에서 장시간에 걸쳐 에이전트를 테스트하는 현실적인 하니스를 통한 데이터 과학적 평가가 필수적입니다. 결과 지향적 성능 측정과 메트릭 개선 방법을 제안합니다.

가이드 읽기

  • LLM 평가가 정적 벤치마크에서 동적 에이전트 시스템으로 변화
  • 복잡한 환경에서 장시간 성능 측정의 필요성
  • 고위험 역할 수행 에이전트의 엄격한 성능 평가
  • 결과 지향적 평가 메트릭과 데이터 기반 개선 전략

NVIDIA Cosmos를 활용한 로봇 비디오 생성 파인튜닝

NVIDIA Cosmos Predict 2.5는 텍스트에서 비디오를 생성하며, LoRA/DoRA 기법을 통해 로봇 조작 같은 특정 작업에 맞게 조정합니다. 단일 GPU에서 효율적인 파인튜닝 파이프라인을 제공하면서 메모리 사용을 최소화하고 파괴적 망각을 방지합니다. 합성 궤적을 빠르게 생성하여 로봇 학습 데이터 생성을 가속화합니다.

상세 내용 보기

  • 텍스트 프롬프트에서 로봇 조작 비디오 생성
  • LoRA/DoRA를 통한 효율적인 ML 파이프라인 파인튜닝
  • 단일 GPU에서 메모리 제약 조건 극복
  • LoRA는 메모리 제약, DoRA는 학습 불안정성 해결에 최적화

🎁 기타

엘론 머스크의 오픈AI 소송, 배심원단이 모든 청구 기각

엘론 머스크가 오픈AI CEO 샘 알트만을 상대로 제기한 소송에서 배심원단이 모든 청구를 기각했습니다. 법원은 머스크가 소송을 제기하기 위해 너무 오래 기다렸다고 판단했으며, 머스크는 이 판결에 대해 항소할 계획을 밝혔습니다. 이 결정은 머스크와 오픈AI 간의 오랜 법적 갈등에 마침표를 찍는 것으로, 인공지능 업계의 주요 인물 간 분쟁이 법적으로 정리되는 과정을 보여줍니다.

NPR 기사

  • 배심원단이 머스크의 모든 청구를 기각
  • 소송 제기 시기가 너무 늦었다는 법원의 판단
  • 머스크의 항소 의사 표현

에이전트 기반 시스템의 평가 방식이 정적인 벤치마크에서 동적인 실세계 환경으로 전환되고 있으며, 특히 코딩과 의료 같은 고위험 분야에서의 에이전트 도입이 확대됨에 따라 엄격한 성능 측정과 결과 중심의 평가가 필수 요소가 되었습니다.

이번 주의 소식은 AI 개발이 단순한 모델 성능 경쟁을 넘어 개발자 생산성, 에이전트 신뢰성, 그리고 관련 하드웨어 인프라의 고도화로 진화하고 있음을 보여줍니다. Cursor Composer 2.5의 강화학습 기반 개선, HRM-Text의 130~600배 적은 연산량으로 모델 훈련 가능, NVIDIA Vera CPU의 에이전트 최적화 설계 등은 모두 AI 시스템을 더욱 실용적이고 경제적으로 만들려는 노력입니다. 앞으로 에이전트 시스템의 대규모 상용화를 위해서는 이러한 도구와 하드웨어의 통합, 그리고 신뢰성 평가 기준의 표준화가 핵심 과제가 될 것으로 예상됩니다.


 

타로신박: 마음이 복잡할 때 오마카세 타로 - Google Play 앱

매일 카드 1장으로 시작하는 AI 타로 루틴 — 상담·저널·퀴즈까지, 완전 무료

play.google.com

 

AI: 인공지능의 핵심만 콕 집어드립니다!

인공지능(AI)의 최신 트렌드, 기술 혁신, 그리고 실용적인 적용 사례를 간결하고 명확하게 제공하는 요약 플랫폼입니다. 복잡한 AI 기술을 쉽고 빠르게 이해할 수 있도록 돕는 #_.AI는 누구나 AI의 미래를 탐구할 수 있는 완벽한 가이드입니다. 최신 AI 트렌드, 실질적인 적용 사례, 전문가를 위한 깊이 있는 정보, AI 기술의 발전 방향과 미래에 미칠 영향에 대한 심도 있는 분석을 제공합니다.

AI의 핵심을 빠르고 간결하게 파악하고 싶다면 #_.AI와 함께하세요. 인공지능의 미래를 열어가는 첫걸음이 될 것입니다!

원문 : TLDR

 

728x90