본문 바로가기
하루5분.짧고 굵은 테크/#_.AI

AI 에이전트 시대 본격화: Gemini 3.5 Flash, Karpathy의 Anthropic 합류, OpenAI 컴퓨팅 보장 서비스

by t루핑_. 2026. 5. 21.

2026년 5월 20일, AI 업계에 획기적인 소식들이 연이어 터져 나왔습니다. Google의 새로운 Gemini 3.5 Flash 모델, Tesla 전 AI 부사장 Andrej Karpathy의 Anthropic 입사, 그리고 OpenAI의 장기 컴퓨팅 용량 보장 서비스 출시는 AI의 실용화 단계가 본격적으로 시작되었음을 보여줍니다. 에이전트 중심의 AI 워크플로우가 산업의 새로운 표준으로 자리잡아가고 있습니다.

💼 빅테크 & 스타트업

Gemini 3.5 Flash 공개, Google의 에이전틱 AI 모델 출시

Google이 에이전틱 워크플로우, 코딩, 장기 작업 실행에 최적화된 Gemini 3.5 Flash를 출시했습니다. 이번 출시에는 검색, 엔터프라이즈 도구, Android Studio, Google 개발자 플랫폼 전반에 걸쳐 Gemini 접근성이 대폭 확대되었으며, Google의 AI 생태계 통합이 가속화되고 있습니다.

5분 읽기

  • Gemini 3.5 Flash로 에이전틱 워크플로우 최적화
  • 검색, 엔터프라이즈 도구, Android Studio 등 다양한 플랫폼 통합
  • AI 제품의 접근성 확대로 사용자 경험 향상

Andrej Karpathy, Anthropic 합류 발표

Tesla와 OpenAI의 전 책임자 Andrej Karpathy가 Anthropic에 합류했습니다. Karpathy는 향후 몇 년간 대규모언어모델(LLM) 최전선에서의 경험이 특별히 중요하다고 언급했으며, 교육 활동은 나중에 재개할 계획이라고 밝혔습니다.

1분 읽기

  • 저명한 AI 연구자 Karpathy의 Anthropic 입사
  • LLM 연구 최전선에 집중하는 R&D 중심 전환
  • Anthropic의 기술력 강화 및 연구 역량 고도화

OpenAI, 장기 컴퓨팅 용량 확보 서비스 출시

OpenAI가 고객들이 AI 제품, 에이전트, 워크플로우를 구동할 컴퓨팅 리소스에 장기적으로 접근할 수 있는 Guaranteed Capacity 서비스를 공개했습니다. 고객은 1년, 2년, 3년의 약정 기간을 선택할 수 있으며, 약정 기간에 따라 차등 할인을 제공합니다.

3분 읽기

  • Guaranteed Capacity로 안정적인 컴퓨팅 리소스 확보
  • 1년~3년 약정으로 장기 비용 예측성 강화
  • 기업의 AI 제품 확장에 필요한 인프라 보장

Google I/O 2026, 에이전틱 Gemini 전략 공개

Google I/O 2026에서 Google은 Gemini 모델이 소비자 제품, 창의성 도구, 개발자 플랫폼 전반에 통합되는 방식을 상세히 설명했습니다. Google의 AI 시스템 전체에서 월별 토큰 사용량이 3.2조(3.2 quadrillion)를 넘어섰으며, 이는 Gemini의 광범위한 채택을 증명합니다.

19분 읽기

  • 에이전틱 Gemini 제품 통합 전략 발표
  • 월별 토큰 사용량 3.2조 달성으로 확대 입증
  • 소비자~개발자 전 영역에 걸친 AI 모델 확산

Oracle AI Database, 에이전트용 통합 메모리 솔루션

Oracle AI Database는 벡터 검색, 관계형 데이터, JSON, 그래프 데이터를 한 곳에서 관리하는 에이전트 통합 메모리 코어 역할을 합니다. 추가 벡터 스토어, 파이프라인, 동기화 작업 없이 AI 에이전트가 실시간 엔터프라이즈 데이터에 접근할 수 있어 개발 복잡성을 크게 줄입니다.

스폰서 콘텐츠

  • 벡터, 관계형, JSON, 그래프 데이터 통합 관리
  • AI 에이전트의 실시간 데이터 접근 지원
  • 복잡한 파이프라인 제거로 개발 생산성 향상

Warp의 Oz, 클라우드 에이전트 통합 관리 플랫폼

Warp이 공개한 Oz는 Claude Code, Codex, Warp Agent를 지원하는 다중 에이전트 통제 플랫폼입니다. 자동 멀티-에이전트 오케스트레이션, 통합 Agent Memory, 향상된 비용 제어 기능을 제공하며, 자가 호스팅 옵션 확대와 강화된 거버넌스로 엔터프라이즈 관리를 간소화합니다.

5분 읽기

  • 다중 에이전트 오케스트레이션 자동화
  • Claude Code, Codex, Warp Agent 통합 지원
  • 비용 제어 및 거버넌스 강화로 엔터프라이즈 관리 개선

OpenAI, AI 생성 콘텐츠 출처 추적 기술 도입

OpenAI가 AI 생성 이미지에 대해 C2PA 표준과 Google DeepMind의 SynthID 워터마킹 기술을 적용하여 콘텐츠 출처 추적을 강화했습니다. 이는 AI 투명성을 높이고 신뢰할 수 있는 AI 생태계 구축에 기여합니다.

6분 읽기

  • C2PA 표준SynthID 워터마킹 도입
  • AI 생성 이미지의 출처 추적 및 검증 강화
  • 투명한 AI 생태계 구축으로 신뢰성 제고

Index, 콘텐츠 소유자 수익화 플랫폼 출시

Index는 콘텐츠 소유자들이 AI 에이전트가 자신의 저작물을 어떻게 활용하는지 추적하고 수익을 창출할 수 있도록 돕는 새로운 플랫폼입니다. 크리에이터와 출판사가 AI 시대에 적절한 보상을 받을 수 있는 인프라를 제공하며, 크리에이터 경제의 새로운 비즈니스 모델을 제시합니다.

2분 읽기

  • AI 에이전트의 콘텐츠 활용 추적 및 투명성
  • 콘텐츠 소유자의 수익 창출 기회 제공
  • 크리에이터 경제를 위한 새로운 보상 인프라

TLDR, Senior Software Engineer, Applied AI 채용

TLDR의 Applied AI 팀은 모든 프로세스를 코드화하여 가독성 있게 만들고 워크플로우로 구성할 수 있도록 하는 역할을 합니다. 최신 AI 도구와 무제한 토큰 예산으로 빠르게 움직이는 소규모 팀에 합류하게 되며, 완전 원격 근무 환경에서 경쟁력 있는 연봉을 제공합니다.

채용 공고

  • Applied AI 팀 Senior Software Engineer 채용
  • 최신 AI 도구와 무제한 토큰 예산 제공
  • 연봉 $250K~$350K, 완전 원격 근무

🔬 과학 & 미래 기술

실시간 장시간 비디오 생성 기술 LongLive 1.0

NVIDIA의 LongLive 1.0은 장시간 비디오를 상호작용식으로 생성하는 프레임워크다. 순차 프롬핑과 스트리밍 어텐션, KV 캐시 최적화 기술을 통해 실시간 사용자 편집을 지원하며, 복잡한 비디오 생성 작업의 효율성을 획기적으로 개선하는 frontier 기술을 제시한다.

Real-Time Long Video Generation (GitHub Repo)

  • 상호작용식 장시간 비디오 생성 프레임워크
  • 순차 프롬핑으로 사용자 제어 가능
  • 스트리밍 어텐션과 KV 캐시 최적화로 실시간 편집 실현
  • 복잡한 영상 생성 작업의 효율성 극대화

OlmoEarth v1.1 - 계산 비용 3배 감축한 리모트 센싱 모델 패밀리

Allen AI의 OlmoEarth v1.1은 계산 비용을 최대 3배 감축하면서 원본 버전 수준의 성능을 유지하는 새로운 모델 패밀리다. 토큰 시퀀스 길이 최적화를 통해 리모트 센싱 데이터 처리 효율을 높이고, 지구 규모 매핑 비용을 획기적으로 낮춰 과학 연구와 개발자 접근성을 크게 향상시킨다.

OlmoEarth v1.1: A more efficient family of models

  • 계산 비용을 최대 3배 감축하며 성능 유지
  • 토큰 시퀀스 최적화로 리모트 센싱 데이터 처리 효율 극대화
  • 지구 규모 행성 매핑 비용 대폭 절감
  • 과학 연구 및 개발 접근성 향상

Cerebras에서 실행되는 1조 파라미터 Kimi K2.6 모델의 최고 속도 기록

1조 파라미터 규모의 Kimi K2.6 모델이 Cerebras 인프라에서 실행되며, Artificial Analysis 측정 기준 초당 약 1,000개의 토큰 처리 성능으로 현존 최고 속도의 frontier 모델 성능을 기록했다. 대규모 언어 모델의 처리 효율 분야에서 새로운 성능 기준을 수립했다.

Cerebras is now running Kimi K2.6

  • 1조 파라미터 규모의 초대형 언어 모델 실행
  • 초당 약 1,000 토큰 처리로 최고 속도 달성
  • Artificial Analysis 기준 최첨단 모델 성능 인증
  • 초대형 모델의 효율적 추론 기술 입증

💻 프로그래밍

Claude Code 활용: HTML의 놀라운 효과성

Claude Code에서 HTML의 풍부한 표현력이 Markdown보다 복잡한 정보를 효과적으로 전달하는 방법을 다룹니다. 레이아웃, 데이터 테이블, 인터랙티브 요소를 포함한 구조화된 문서로 가독성을 높이고, 스펙 작성, 디자인 프로토타이핑, 맞춤형 편집 인터페이스 구축 시 문맥 이해도를 향상시킵니다.

Claude 블로그

  • HTML의 풍부한 표현력으로 Markdown보다 복잡한 정보를 효과적으로 전달
  • 레이아웃, 데이터 테이블, 인터랙티브 요소로 구조화된 문서 작성
  • 스펙 작성, 디자인 프로토타이핑, 맞춤형 편집 인터페이스 구축에 활용

실시간 장형 영상 생성 (NVIDIA LongLive)

NVIDIA LongLive 1.0은 스트리밍 어텐션과 KV-캐시 최적화 기술을 활용한 인터랙티브 장형 영상 생성 프레임워크입니다. 순차 프롬프팅과 실시간 사용자 안내 편집을 지원하여 고품질 동영상 콘텐츠 생성을 효율화합니다.

GitHub 저장소

  • 스트리밍 어텐션과 KV-캐시 최적화로 효율적인 장형 영상 생성
  • 순차 프롬프팅을 통한 유연한 콘텐츠 제어
  • 실시간 사용자 안내 편집으로 대화형 영상 생성 지원

OlmoEarth v1.1: 더 효율적인 모델 패밀리

OlmoEarth v1.1은 계산 비용을 최대 3배까지 감소시키면서 성능을 유지하는 원격감지 데이터 처리 모델 라이브러리입니다. 토큰 시퀀스 길이 최적화와 방법론적 개선을 통해 개발자들이 행성 규모의 매핑을 더 저렴하게 구현하고 원격감지 분야의 과학 연구를 향상시킵니다.

Hugging Face 블로그

  • 계산 비용을 최대 3배 감소시키면서 성능 유지
  • 토큰 시퀀스 길이 최적화로 원격감지 데이터 효율적 처리
  • 개발자 친화적인 비용 효율 솔루션으로 과학 연구 지원

Ettin 리순서 모델 패밀리 소개

Hugging Face에서 6개의 새로운 최고 성능 CrossEncoder Ettin 리순서 모델을 공개했습니다. ModernBERT 인코더 기반의 이 라이브러리는 17M부터 1B 파라미터까지 다양하며, Flash Attention 2를 통해 속도와 정확성을 모두 향상시키고 레거시 모델들을 상당히 능가합니다.

Hugging Face 블로그

  • 17M~1B 파라미터 범위의 6개 고성능 CrossEncoder 모델
  • Flash Attention 2로 속도와 정확성 동시 향상
  • MTEB와 NanoBEIR 벤치마크에서 기존 모델들 능가

AI 에이전트용 데이터베이스 통합 솔루션 (Oracle AI Database)

Oracle AI Database는 벡터 검색, 관계형, JSON, 그래프 데이터를 하나의 통합 메모리 코어로 제공합니다. 개발자들이 추가 벡터 스토어, 파이프라인, 동기화 작업 없이 라이브 엔터프라이즈 데이터 위에서 AI 에이전트의 추론을 수행하도록 지원하는 개발자 도구입니다.

Oracle 공식 사이트

  • 벡터 검색, 관계형, JSON, 그래프 데이터 통합 관리
  • 추가 벡터 스토어와 파이프라인 제거로 개발 복잡도 감소
  • 라이브 엔터프라이즈 데이터 위에서 에이전트 추론 수행

클라우드 에이전트 통합 관리 플랫폼 (Oz)

Oz는 Claude Code, Codex, Warp Agent를 지원하는 멀티 플랫폼 클라우드 에이전트 제어 플랫폼입니다. 자동 멀티 에이전트 오케스트레이션, 크로스 플랫폼 Agent Memory, 향상된 비용 제어 및 거버넌스 기능으로 개발자들의 에이전트 관리와 배포를 간소화합니다.

Warp 블로그

  • Claude Code, Codex, Warp Agent 멀티 플랫폼 지원
  • 자동 멀티 에이전트 오케스트레이션으로 관리 효율화
  • 크로스 플랫폼 Agent Memory와 향상된 비용 제어

📊 디자인 & 데이터 사이언스

Claude Code에서 HTML의 놀라운 효율성

HTML의 풍부한 표현력을 활용하여 복잡한 정보를 마크다운보다 효과적으로 전달하는 방법을 설명합니다. Claude Code는 HTML을 통해 레이아웃, 데이터 테이블, 인터랙티브 요소를 구조화하여 다양한 소스의 맥락을 효율적으로 수집하고, 스펙 작성, 디자인 프로토타이핑, 커스텀 편집 인터페이스 개발에 활용됩니다.

Claude.com

  • 레이아웃과 데이터 테이블, 인터랙티브 요소를 통한 복잡한 정보 시각화
  • UX/UI 디자인 프로토타이핑 및 커스텀 편집 인터페이스 개발에 활용
  • 읽기 쉬운 문서 구조화로 스펙 공유 및 상호작용 능력 향상

영어 이외의 언어권을 위한 AI 구축

다국어 AI 학습 데이터와 휴먼 이밸류에이션을 통해 영어 중심의 기계 번역 데이터의 한계를 극복하고, 문화적 뉘앙스를 반영한 AI 모델 개발을 지원하는 Welo Data의 솔루션입니다. 155개 이상의 지역에서 네이티브 전문가에 의해 검증된 AI 학습 데이터 파이프라인을 제공하여 보안 가이드라인 준수와 문화적 현지화를 보장합니다.

Welo Data

  • 155개 이상 지역의 다국어 AI 학습 데이터 및 휴먼 이밸류에이션 제공
  • 네이티브 전문가를 통한 문화적 뉘앙스 포착 및 번역 기반 오류 방지
  • 보안 가이드라인의 언어 간 일관성 유지 및 데이터 품질 보증

🎁 기타

미국 자선활동의 제3의 물결

인공지능 기술의 발전이 향후 수백억 달러 규모의 새로운 자선 기금 창출을 촉발할 것으로 예상되고 있습니다. 이 심층 분석은 AI 시대의 부의 증가가 자선활동의 새로운 패러다임을 형성하고, 디지털 경제 확대에 따른 재분배 패턴의 변화를 다룹니다.

전체 글 읽기

  • AI 기술 발전으로 인한 신규 부의 창출이 자선활동을 재정의
  • 향후 수백억 달러 규모의 새로운 자선 기금 증가 예상
  • 디지털 경제 확대에 따른 부의 재분배 패턴 급변
  • 차세대 필렌트로피의 기회와 도전 과제 분석

⚡️ 퀵 링크

WHOOP, Stripe, DoorDash가 AI로 고객 피드백을 활용하는 방법 (스폰서)

Unwrap은 AI를 활용해 고객 피드백을 자동으로 분류하고, 실시간 감정 알림을 제공하며, MCP를 통한 인사이트 쿼리를 지원합니다. TLDR 구독자는 무료 체험을 받을 수 있습니다.

Unwrap 무료 체험 신청

  • AI 기반 고객 피드백 자동 분류 및 분석
  • 실시간 감정 분석 및 알림 기능
  • MCP를 통한 인사이트 쿼리 지원

Google I/O 2026에서 Gemini 모델이 소비자 제품, 창작 도구, 개발자 플랫폼 전반에 통합되고 있으며, AI 시스템 전반의 월별 토큰 사용량이 3.2천조를 초과했습니다.

AI 개발사들의 이러한 발표는 AI가 단순한 대화형 도구에서 실제 업무를 자율적으로 수행하는 에이전트로 진화하고 있음을 명확히 보여줍니다. 더욱 강력한 모델과 신뢰할 수 있는 컴퓨팅 자원의 조합은 기업들이 대규모 AI 시스템을 안정적으로 구축하고 운영할 수 있는 기반을 마련하게 될 것입니다.


 

타로신박: 마음이 복잡할 때 오마카세 타로 - Google Play 앱

매일 카드 1장으로 시작하는 AI 타로 루틴 — 상담·저널·퀴즈까지, 완전 무료

play.google.com

 

AI: 인공지능의 핵심만 콕 집어드립니다!

인공지능(AI)의 최신 트렌드, 기술 혁신, 그리고 실용적인 적용 사례를 간결하고 명확하게 제공하는 요약 플랫폼입니다. 복잡한 AI 기술을 쉽고 빠르게 이해할 수 있도록 돕는 #_.AI는 누구나 AI의 미래를 탐구할 수 있는 완벽한 가이드입니다. 최신 AI 트렌드, 실질적인 적용 사례, 전문가를 위한 깊이 있는 정보, AI 기술의 발전 방향과 미래에 미칠 영향에 대한 심도 있는 분석을 제공합니다.

AI의 핵심을 빠르고 간결하게 파악하고 싶다면 #_.AI와 함께하세요. 인공지능의 미래를 열어가는 첫걸음이 될 것입니다!

원문 : TLDR

 

728x90