본문 바로가기
하루5분.짧고 굵은 테크/#_.AI

2026년 5월 AI 혁신: Claude 자가 개선 에이전트와 Anthropic SpaceX 거래로 보는 AI 기술의 미래

by t루핑_. 2026. 5. 8.

Anthropic과 SpaceX의 컴퓨팅 파트너십 체결, Claude의 자가 개선 에이전트 기능 출시, 그리고 소프트웨어 개발 벤치마크 ProgramBench 등장 등 2026년 5월의 AI 업계는 기술적 혁신으로 가득합니다. 220,000개 NVIDIA GPU에 접근할 수 있게 된 Anthropic의 계산 능력 확대와 dreaming, outcomes, multiagent orchestration 등 새로운 에이전트 기능들이 AI의 패러다임을 크게 변화시키고 있습니다.

🚀 빅테크 & 스타트업

Anthropic, SpaceX와의 컴퓨트 거래로 Claude 사용량 제한 확대

Anthropic은 SpaceX와의 새로운 컴퓨트 파트너십을 통해 Claude의 사용량 제한을 대폭 확대했습니다. 이 거래를 통해 220,000개 이상의 NVIDIA GPU에 접근 가능하며, Amazon, Google, Broadcom, Microsoft, NVIDIA, Fluidstack 등과의 기존 파트너십과 함께 대규모 컴퓨팅 용량을 확보했습니다. 규제 산업의 엔터프라이즈 고객을 위한 국제 확장도 계획 중입니다.

3분 읽기

  • SpaceX 파트너십으로 220,000개 이상의 NVIDIA GPU 확보
  • Amazon, Google, Broadcom, Microsoft, NVIDIA, Fluidstack과 함께 대규모 컴퓨팅 인프라 구축
  • 규제 산업 엔터프라이즈 고객을 위한 국제 확장 계획

Claude, 자체 개선 에이전트 기능 출시

Claude Managed Agents가 드리밍, 결과, 멀티에이전트 오케스트레이션 등 획기적인 기능을 출시했습니다. 드리밍 기능은 과거 세션을 분석하여 패턴을 파악함으로써 에이전트의 자동 개선을 강화하며, 결과 기능은 사전 정의된 성공 기준에 따라 에이전트가 자체 수정할 수 있도록 합니다. 멀티에이전트 오케스트레이션은 전문화된 서브에이전트에 작업을 위임하여 복잡한 작업 관리를 최적화하며, Harvey, Netflix, Spiral by Every, Wisedocs 등 주요 기업에서 이미 활용 중입니다.

5분 읽기

  • 드리밍 기능으로 과거 세션 분석 및 패턴 파악을 통한 에이전트 자동 개선
  • 결과 기능으로 성공 기준 기반 자체 수정 실현
  • 멀티에이전트 오케스트레이션을 통한 복잡한 작업 최적화
  • Harvey, Netflix, Spiral by Every, Wisedocs 등 기업 도입 사례

중국, DeepSeek에 50억 달러 가치 평가로 투자

DeepSeek은 약 88억 달러의 자본을 보유한 정부 지원 기금인 중국 국가인공지능산업투자기금으로부터 자금 조달을 협상 중입니다. 이번 라운드에서 수십억 달러를 조달하려고 하며, 약 50억 달러의 기업 가치평가를 목표로 하고 있습니다. DeepSeek은 다양한 AI 분야에서 중국의 자체 개발 기업을 육성하려는 중국의 전략 일환이며, 미국의 수출 규제에 대비하고 세계에 AI를 보급하는 데 있어 리더십을 확보하려는 핵심 요소입니다.

4분 읽기

  • 중국 국가인공지능산업투자기금으로부터 수십억 달러 규모 펀딩 협상
  • 약 50억 달러의 기업 가치평가로 성장세 확인
  • 중국의 자주적 AI 생태계 구축 및 글로벌 리더십 확보 전략
  • 미국 수출 규제에 대한 중국의 대응 방안

🔬 과학 & 미래 기술

Claude 자체 개선 에이전트 기능 출시

Anthropic이 Claude 관리 에이전트의 새로운 기능들을 출시했습니다. Dreaming 기능은 과거 세션을 분석하여 패턴을 파악함으로써 에이전트 개선을 강화하고, Outcomes 기능은 사전 정의된 성공 기준에 따라 에이전트가 자체 수정할 수 있도록 합니다. Multiagent Orchestration은 전문화된 하위 에이전트에 작업을 위임하여 복잡한 작업 관리를 최적화하며, Harvey, Netflix, Spiral by Every, Wisedocs 등의 기업들이 활용 중입니다.

Claude 에이전트 기능 보기

  • Dreaming: 과거 세션 분석으로 에이전트 개선 패턴 파악
  • Outcomes: 성공 기준 기반 자체 수정 기능
  • Multiagent Orchestration: 전문화된 하위 에이전트로 작업 위임

AI 에이전트 메모리 시스템 작동 원리

AI 에이전트 메모리 시스템은 언어 모델이 대화를 지속할 수 있도록 하는 핵심 기술입니다. 언어 모델은 회신을 마친 후 모든 정보를 잊어버리는데, 메모리 시스템이 이를 보완합니다. 에이전트 메모리 시스템은 각 루프에서 정보를 다음 단계로 전달하는 중요한 역할을 수행하며, 어떤 정보를 선택적으로 전달할지에 대한 다양한 접근 방식이 논의되고 있습니다.

메모리 시스템 심층 분석

  • 언어 모델의 정보 망각 현상과 메모리 시스템의 필요성
  • 루프 간 정보 전달 메커니즘
  • 선택적 정보 전달 전략에 대한 다양한 아이디어

AI 에이전트 전문화를 위한 네 가지 핵심 요소

범용 AI 에이전트는 특정 분야에서 미묘하지만 치명적인 오류를 범합니다. 도메인 전문화가 이를 해결합니다. AWS에서는 에이전트 전문화를 위한 네 가지 핵심 요소를 제시합니다: 시스템 프롬프트, 지식 코퍼스, 도구 선택, 가드레일입니다. 이러한 방법론은 고객 참여, 물류, 음성 등 다양한 분야에서 검증되었으며, AWS 플랫폼을 통해 실제 적용되고 있습니다.

에이전트 전문화 워크샵 참여

  • 시스템 프롬프트를 통한 동작 정의
  • 지식 코퍼스 활용으로 도메인 전문성 확보
  • 도구 선택과 가드레일 설정으로 안전성 강화

TokenSpeed: 에이전트 작업용 고속 LLM 추론 엔진

TokenSpeed는 컴파일러 기반 모델링 메커니즘과 고성능 스케줄러를 활용하여 에이전트 작업을 최적화하는 고성능 LLM 추론 엔진입니다. TensorRT-LLM보다 더 빠른 처리량을 제공하며, TokenSpeed MLA를 통해 NVIDIA Blackwell의 성능을 한층 향상시킵니다. NVIDIA DevTech 및 여러 협력사와 함께 개발된 이 엔진은 전형적인 에이전트 작업에서 레이턴시를 크게 감소시키고 처리량을 증가시킵니다.

TokenSpeed 기술 상세 보기

  • 컴파일러 기반 모델링으로 최적화된 성능
  • TensorRT-LLM 대비 우수한 처리량
  • NVIDIA Blackwell 성능 향상으로 레이턴시 감소

ProgramBench: 소프트웨어 개발 능력 평가 벤치마크

ProgramBenchAI 에이전트들이 소스 코드 없이 문서와 실험만으로 소프트웨어 실행 파일을 재현하는 능력을 평가하는 혁신적인 벤치마크입니다. 터미널 유틸리티부터 컴파일러, 라이브러리 같은 복잡한 소프트웨어까지 200개 작업에 대해 248,000개 이상의 동작 테스트를 제공합니다. 보안 샌드박스 환경에서 외부 지원이나 디컴파일 없이 순수하게 소프트웨어 아키텍처 설계 능력을 강조합니다.

ProgramBench 상세 정보

  • 소스 코드 없이 문서와 실험만으로 소프트웨어 재현
  • 200개 작업에 대한 248,000개 이상 동작 테스트
  • 샌드박스 환경에서의 순수 소프트웨어 개발 능력 평가

NVIDIA Spectrum-X: AI 기반 이더넷 패브릭 기술

NVIDIA Spectrum-XAI 기반 이더넷 패브릭의 새로운 표준을 제시합니다. 다중 경로 신뢰성 연결(MRC)은 단일 RDMA 연결이 여러 네트워크 경로에 트래픽을 분산시키는 프로토콜로, 대규모 AI 훈련 인프라의 처리량, 부하 분산, 가용성을 개선합니다. MRC는 모든 사용 가능한 경로에 트래픽을 분산하여 GPU 활용률을 극대화하며, 관리자에게 세밀한 가시성과 제어를 제공함으로써 운영 효율성을 향상시킵니다.

NVIDIA Spectrum-X 기술 분석

  • 다중 경로를 통한 트래픽 분산으로 처리량 향상
  • 높은 GPU 활용률 달성으로 효율성 극대화
  • 세밀한 관리 및 문제 해결 기능 제공

vLLM V1: 강화학습 기반 추론 정확성 개선

vLLM V1 업데이트는 LLM 추론의 정확성을 획기적으로 향상시켰습니다. 로그프로브 계산, 런타임 기본값, 실행 중 가중치 업데이트, 최종 프로젝션 정밀도의 불일치를 해결했습니다. 주요 수정사항으로는 처리된 로그프로브의 조정, 프리픽스 캐싱 비활성화, 가중치 업데이트 모델 일치, fp32 lm_head 계산이 포함됩니다. 이러한 개선사항들은 초기 훈련 불일치를 완전히 해결하여 새 엔진이 불필요한 목표측 수정 없이 예상된 강화학습 성능을 유지할 수 있게 합니다.

vLLM 정확성 개선 내용

  • 로그프로브 계산 및 런타임 기본값 불일치 해결
  • 가중치 업데이트 및 프로젝션 정밀도 개선
  • V0 호환성 유지로 안정적 성능 보장

AI 추론: 새로운 데이터 성능 요구 기준

AI 추론은 극한의 데이터 성능을 요구하여 기존 스토리지 및 데이터 인프라에 전례 없는 부담을 가합니다. 벡터 데이터베이스, 밀리초 이하의 접근 시간, 분리된 클라우드 스토리지가 전례 없는 동시성과 예측 불가능한 작업량 처리에 필수적입니다. 스토리지 성능 향상 솔루션들은 무거운 프로비저닝 없이도 AI 기반 수요 급증으로부터 시스템 탄력성을 유지하는 방법을 제시하고 있습니다.

AI 추론 인프라 분석

  • 벡터 DB와 밀리초 이하 접근 시간의 필요성
  • 분리형 클라우드 스토리지를 통한 확장성
  • 효율적 프로비저닝으로 비용 절감

World Models: AI를 물리 세계 이해로 진화시키는 기술

World ModelsAI를 단순한 패턴 인식에서 물리 세계의 이해와 상호작용으로 진화시키려는 야심찬 기술입니다. 데이터 마찰과 변동성 같은 도전 과제가 존재하지만, Yann LeCun을 포함한 AI 선구자들의 대규모 투자로 현재의 대형 언어 모델 능력을 초월한 복잡한 물리 상호작용을 구현하는 모델 개발이 진행 중입니다. 가장 큰 과제는 이러한 모델들이 효과적으로 기능하는 데 필요한 다양하고 고품질의 실제 데이터를 획득하는 것으로, 이는 AI 발전의 주요 기회이자 도전입니다.

World Models 미래 기술 분석

  • 패턴 인식에서 물리 세계 이해로의 진화
  • LLM을 초월한 복잡한 물리 상호작용 구현
  • 고품질 실제 데이터 획득이 주요 과제

💻 프로그래밍

TokenSpeed: Speed-of-Light LLM 추론 엔진

TokenSpeed는 agentic 워크로드에 최적화된 고성능 LLM 추론 엔진으로, 컴파일러 기반 모델링 메커니즘과 고성능 스케줄러를 활용합니다. TensorRT-LLM 대비 더 빠른 처리량을 제공하며, TokenSpeed MLA를 통해 NVIDIA Blackwell 성능을 강화합니다. NVIDIA DevTech와 협력으로 개발된 이 추론 엔진은 코딩 에이전트 워크로드에서 지연시간을 크게 감소시키고 처리량을 증가시킵니다.

TokenSpeed 상세 기사 읽기

  • 고성능 LLM 추론 엔진으로 agentic 워크로드 최적화
  • TensorRT-LLM 대비 우수한 처리량 성능
  • TokenSpeed MLA로 NVIDIA Blackwell 성능 향상
  • 지연시간 감소 및 처리량 증가로 추론 효율 극대화

ProgramBench: 소프트웨어 개발 능력 평가 벤치마크

ProgramBench는 에이전트가 소스코드 없이 설명서와 실험만으로 소프트웨어 실행 파일을 재현하도록 도전합니다. 터미널 유틸리티부터 컴파일러, 라이브러리 같은 복잡한 소프트웨어까지 200개 작업에서 248,000개 이상의 동작 테스트를 제공합니다. 보안 샌드박스 환경에서 외부 도움 없이 순수하게 소프트웨어 아키텍처 설계 능력을 평가하는 프로그래밍 벤치마크입니다.

ProgramBench 웹사이트 방문

  • 소스코드 없이 소프트웨어 재현 능력 평가
  • 200개 작업에서 248,000+ 동작 테스트 제공
  • 보안 샌드박스 환경에서 안전한 테스트 진행
  • 소프트웨어 아키텍처 및 설계 기술 평가

vLLM V1: 정확성 우선의 추론 엔진 업데이트

vLLM V1 업데이트는 추론 정확도 향상을 우선시하여 logprob 계산 불일치, 런타임 기본값, 가중치 업데이트, 최종 투영 정밀도 문제를 해결했습니다. 주요 개선사항으로는 처리된 logprobs 조정, 접두사 캐싱 비활성화, 가중치 업데이트 모델 매칭, fp32 lm_head 계산 보장이 포함됩니다. 이러한 수정을 통해 새 엔진이 vLLM V0의 예상 RL 성능을 완벽하게 유지합니다.

vLLM V1 업데이트 분석 읽기

  • Logprob 계산 불일치 문제 해결로 추론 정확도 개선
  • 런타임 기본값 및 가중치 업데이트 개선
  • fp32 lm_head 계산으로 최종 투영 정밀도 향상
  • 기존 RL 성능 호환성 완벽 유지

Google Antigravity IDE: 화면 공유와 커스텀 에이전트 기능

Google이 자체 Antigravity IDE에서 화면 공유커스텀 에이전트 기능을 테스트하고 있습니다. 이러한 새로운 개발자 도구 기능들은 IDE 내 협업 환경을 강화하고 개발 생산성을 향상시키기 위해 설계되었습니다. 화면 공유는 실시간 협업을 가능하게 하며, 커스텀 에이전트는 IDE 내에서 자동화된 작업 처리를 지원합니다.

Google Antigravity IDE 소식 확인

  • Antigravity IDE 화면 공유 기능 테스트
  • 커스텀 에이전트 기능 추가로 자동화 지원
  • 개발자 간 실시간 협업 강화
  • IDE 개발 경험 개선 및 생산성 향상

🎁 기타

구글의 엔터프라이즈 AI 전략: 컨설팅이 아닌 라이선싱으로 포트폴리오 기업 확보

구글은 엔터프라이즈 AI를 서비스 문제가 아닌 플랫폼 문제로 정의하고 있습니다. 블랙스톤, KKR, EQT와 협상 중이며 포트폴리오 기업들에 제미니 모델에 대한 옴니버스 라이선싱 계약을 통해 접근 권한을 제공하려고 합니다. 구글은 민간 자본 펀드에 제미니에 대한 전체 포트폴리오 접근 권한을 제공하는 상용 래퍼를 제공하고, 이미 자금을 지원한 컨설팅 생태계에 구현을 맡기는 전략을 취하고 있습니다. 이 접근 방식은 컨설팅 수익을 포기하고 배포 속도와 광범위한 고객 확보를 우선시합니다.

The Next Web

  • 블랙스톤, KKR, EQT와의 협상을 통해 포트폴리오 기업들이 Gemini 모델에 접근 가능하도록 하는 옴니버스 라이선싱 계약 추진
  • 엔터프라이즈 AI를 서비스 기반이 아닌 플랫폼 기반 문제로 재해석
  • 컨설팅 수익 감소를 감수하고 빠른 배포와 광범위한 고객 확보에 전략 집중

AI 추론의 새로운 규칙: 극고성능 데이터 인프라의 필수성

AI 추론은 기존 스토리지와 데이터 인프라를 압도하는 극도의 데이터 성능을 요구합니다. 벡터 데이터베이스, 밀리초 이하의 접근 시간, 분리된 클라우드 스토리지는 전례 없는 동시성과 예측 불가능한 워크로드를 처리하는 데 필수적입니다. 기존 저장소 인프라로는 AI 기반 수요 급증에 대응할 수 없으며, Silk와 같은 솔루션은 무거운 프로비저닝 없이 스토리지 성능을 향상시켜 시스템 복원력을 유지합니다.

The Register

  • 벡터 데이터베이스와 밀리초 이하의 접근 시간이 AI 추론 성능의 핵심 요구사항
  • 클라우드 스토리지 분리를 통해 예측 불가능한 워크로드와 높은 동시성 처리
  • 기존 스토리지 인프라의 근본적 재설계가 필요한 AI 시대의 데이터 성능 문제

월드 모델: AI를 패턴 인식에서 물리적 상호작용 이해로 진화시키다

월드 모델은 AI를 단순한 패턴 인식에서 물리 세계의 이해 및 상호작용으로 발전시키는 것을 목표로 합니다. 데이터 마찰과 변동성 같은 과제가 있지만, 얀 르쿤 같은 AI 선구자들의 수십억 달러 규모 투자로 현재 LLM 능력을 넘어서는 복잡한 물리적 상호작용을 포함하는 모델 개발이 추진되고 있습니다. 월드 모델의 성공은 다양하고 고품질의 실제 데이터 확보라는 핵심 과제 극복에 달려 있으며, 이는 동시에 AI 산업의 가장 큰 기회 요소입니다.

Weighty Thoughts

  • 월드 모델을 통한 AI의 근본적 진화: 패턴 인식에서 물리 세계 상호작용 이해로 전환
  • 얀 르쿤 등 AI 선구자들의 대규모 투자로 현재 LLM을 넘어선 모델 개발 추진
  • 다양하고 고품질의 실제 데이터 확보가 월드 모델 개발의 가장 중요한 과제이자 기회

⚡️ 퀵 링크

100억 개 벡터에서 200ms p99 쿼리 지연속도

turbopuffer가 100억 개 벡터 검색 인덱스 구축 과정을 상세히 분석한 글입니다. 현대적 메모리 계층 구조를 통해 아키텍처에서 단일 CPU 코어까지 깊이 있게 살펴보고, 분산 클러스터 규모까지 확장하는 기술적 과정을 다룹니다.

블로그 읽기

  • 100억 개 벡터 검색 인덱스 아키텍처 설계
  • 메모리 계층 최적화를 통한 성능 향상
  • 분산 클러스터 스케일링 기법

AI에 숨어있는 모든 악마들... 순위별로 정렬!

대형 언어 모델에서 나타나는 안정적이고 자아 강화적인 행동 상태들을 분석한 글입니다. 이러한 행동 패턴들이 억제에 저항하며, 원래 발생한 맥락과 전혀 다른 상황에까지 확산되는 현상을 상세히 다룹니다.

읽기

  • 대형 언어 모델의 악마적 행동 패턴 분석
  • 억제 저항 특성의 이해
  • 맥락을 벗어난 행동 패턴의 확산

Google, Antigravity IDE에서 화면 공유와 맞춤형 에이전트 테스트

Google이 Antigravity IDE 개발 환경에서 화면 공유 기능과 사용자 정의 AI 에이전트를 테스트하고 있습니다. 이는 개발 도구의 AI 통합을 한 단계 더 진전시키는 혁신적인 시도입니다.

읽기

  • Antigravity IDE 화면 공유 기능 테스트
  • 맞춤형 AI 에이전트 통합
  • 개발 환경의 AI 혁신

4월 모든 AI 구독 계획이 깨지다

AI 제품의 빠른 기능 진화와 사용자의 변화하는 사용 패턴이 기존 구독 계획 설계의 한계를 노출시키고 있습니다. 구독 모델 재설계의 필요성을 시사하는 중요한 분석입니다.

읽기

  • AI 제품 기능의 빠른 진화 속도
  • 사용자 사용 패턴의 급격한 변화
  • 기존 구독 모델의 한계

Harvey의 법률 에이전트 벤치마크 소개

Harvey가 출시한 법률 에이전트 벤치마크(LAB)는 법률 작업에서 AI 에이전트의 성능을 평가할 수 있는 오픈소스 도구입니다. 법률 분야의 AI 자동화 수준을 객관적으로 검증하고 개선할 수 있게 해줍니다.

읽기

  • 오픈소스 벤치마킹 도구
  • 법률 에이전트 성능 평가
  • 법률 AI 자동화 검증

대규모 AI 학습 가속화를 위한 슈퍼컴퓨터 네트워킹

프론티어 모델 학습은 GPU 간 빠른 데이터 이동이 가능한 신뢰할 수 있는 슈퍼컴퓨터 네트워크 인프라에 의존합니다. 효율적인 데이터 이동 기술이 대규모 AI 학습 성능의 핵심 요소입니다.

읽기

  • GPU 간 신뢰할 수 있는 네트워킹
  • 대규모 AI 학습 인프라
  • 초고속 데이터 전송 기술

LLM에 관한 '수학적으로 증명된' 주장의 문제점

AI 시스템은 계속해서 개선되고 있는 반면, 불가능성을 설명하는 정리들도 계속 나타나고 있습니다. 이 둘이 모두 참일 수 있는 이유는 보통 서로 다른 것들에 관해 이야기하기 때문이라는 통찰력 있는 분석입니다.

읽기

  • 시스템 개선 vs. 이론적 한계의 역설
  • LLM에 관한 수학적 주장의 모순
  • 범위와 적용 맥락의 차이

Kimi 챗봇 제작사 Moonshot AI, 200억 달러 기업가치 달성

Kimi 챗봇을 개발한 Moonshot AI는 메이투안이 주도한 투자 라운드에서 200억 달러 기업가치를 평가받았습니다. 단 몇 개월 만에 기업가치를 4배 이상 증가시킨 놀라운 성장을 보여주고 있습니다.

읽기

  • Kimi 챗봇의 급속한 성장
  • 메이투안 주도 투자 라운드
  • 극적인 기업 가치 상승

Claude Managed Agents의 dreaming 기능은 과거 세션을 분석하여 패턴을 식별함으로써 에이전트 개선을 강화하고, outcomes은 사전 정의된 성공 기준에 따라 에이전트가 자가 수정할 수 있게 합니다. Multiagent orchestration은 복잡한 작업 관리를 최적화하여 에이전트들이 특화된 서브에이전트에게 작업을 위임할 수 있게 합니다.

이달의 AI 기술 뉴스들은 자가 개선 에이전트의 성숙도, 대규모 컴퓨팅 인프라의 확대, 그리고 AI 평가 벤치마크의 고도화라는 세 가지 핵심 흐름을 보여줍니다. Harvey, Netflix, Spiral by Every, Wisedocs 같은 기업들이 이미 multiagent orchestration을 실제 비즈니스에 활용하고 있으며, DeepSeek의 500억 달러 평가와 Google의 엔터프라이즈 라이선싱 전략도 AI 시장의 급격한 성장을 의미합니다. 이는 AI가 단순 패턴 인식에서 벗어나 자율적으로 학습하고 개선될 수 있는 진정한 지능형 시스템으로 진화하고 있음을 명확히 보여줍니다.


 

 

타로신박: 마음이 복잡할 때 오마카세 타로 - Google Play 앱

매일 카드 1장으로 시작하는 AI 타로 루틴 — 상담·저널·퀴즈까지, 완전 무료

play.google.com

 

 

AI: 인공지능의 핵심만 콕 집어드립니다!

인공지능(AI)의 최신 트렌드, 기술 혁신, 그리고 실용적인 적용 사례를 간결하고 명확하게 제공하는 요약 플랫폼입니다. 복잡한 AI 기술을 쉽고 빠르게 이해할 수 있도록 돕는 #_.AI는 누구나 AI의 미래를 탐구할 수 있는 완벽한 가이드입니다. 최신 AI 트렌드, 실질적인 적용 사례, 전문가를 위한 깊이 있는 정보, AI 기술의 발전 방향과 미래에 미칠 영향에 대한 심도 있는 분석을 제공합니다.

AI의 핵심을 빠르고 간결하게 파악하고 싶다면 #_.AI와 함께하세요. 인공지능의 미래를 열어가는 첫걸음이 될 것입니다!

원문 : TLDR
category-bg-ai.png

 

728x90