Microsoft의 새로운 MAI 모델 7종 출시, MiniMax의 1M 토큰 컨텍스트 모델, OpenAI의 Codex 역할별 플러그인 등 AI 기술이 빠르게 진화하고 있습니다. 한편 Anthropic이 IPO를 준비하면서 기업들의 높은 AI 비용 부담에 대한 우려가 표면화되고 있습니다. 이번 주 AI 업계는 기술 혁신과 시장의 현실적 과제가 충돌하는 가운데 중요한 전환점을 맞이하고 있습니다.
🚀 빅테크 & 스타트업
Microsoft, 새로운 7개 MAI 모델 출시
Microsoft가 개발자들이 모델 가중치를 직접 튜닝할 수 있는 새로운 MAI 모델 7개를 출시했습니다. Frontier Tuning 기법을 활용하여 특정 워크플로우에 맞게 AI를 적응시키며, Mayo Clinic과 협력하여 임상 전문성과 AI 역량을 결합한 의료용 AI 모델을 개발하고 있습니다. 초기에는 Mayo 내에서 배포한 후 Azure Foundry를 통해 광범위하게 배포할 계획입니다.
- 개발자가 모델 가중치를 직접 튜닝 가능한 7개 신규 MAI 모델
- Frontier Tuning으로 특정 워크플로우 최적화
- Mayo Clinic과 의료용 AI 모델 협업, Azure Foundry 배포
MiniMax, 1M-token 컨텍스트 M3 모델 출시 및 가중치 공개 예정
MiniMax가 1M-token 컨텍스트 윈도우를 갖춘 M3 모델을 출시했으며, 향후 10일 내 모델 가중치와 기술 보고서를 공개할 예정입니다. 최첨단 코딩 능력, 네이티브 멀티모달 지원, 1M-token 컨텍스트를 결합한 첫 오픈웨이트 모델이며, MiniMax Code, 토큰 요금제, API를 통해 접근 가능합니다. 표준 API 요금은 백만 입력당 $0.60, 백만 출력당 $2.40입니다.
- 코딩·멀티모달·장문맥을 통합한 첫 오픈웨이트 모델
- 10일 내 모델 가중치 및 기술 보고서 공개
- 512,000토큰 최소 보장, 경쟁력 있는 API 가격
OpenAI, Codex 새로운 기능 및 역할별 플러그인 6개 출시
OpenAI가 Codex의 새로운 기능을 발표하고 데이터 분석, 창의적 제작, 영업, 제품 디자인, 주식 투자, 투자 은행 등 6가지 역할별 플러그인을 출시했습니다. 이러한 플러그인들은 다양한 업무 분야에서 Codex의 활용을 확대할 수 있도록 설계되어 전문가부터 일반 사용자까지 업무 효율성을 높일 수 있게 합니다.
- 데이터 분석, 창의 제작, 영업, 디자인, 투자 분야 지원
- 역할별 맞춤형 플러그인으로 업무 효율성 향상
- Codex 기능 확장으로 적용 범위 확대
오픈 모델과 클로즈드 모델, 서로 다른 지수 곡선을 따른다
많은 기업들이 오픈 모델로의 전환을 원하지만, 현재 오픈 모델은 분포 밖의 작업에서는 아직 충분하지 않습니다. 그러나 결국 성능 격차를 따라잡을 것으로 예상됩니다. 오픈 모델 생태계는 폐쇄형 AI 연구소의 독과점보다 훨씬 더 다양하고 많은 수의 모델들로 구성될 것이며, 장기적으로 오픈 모델 경제의 총 시장 가치는 OpenAI와 Anthropic의 누적 가치를 훨씬 초과할 것으로 전망됩니다.
- 오픈 모델이 현재는 분포 밖 작업에서 제약이 있지만 결국 따라잡을 것
- 오픈 모델 생태계가 클로즈드 모델보다 훨씬 더 다양할 것
- 오픈 모델 경제의 시장 가치가 주요 AI 기업을 초과할 것으로 예상
Perplexity, 하이브리드 로컬-클라우드 AI 추론 시스템 공개
Perplexity가 2026 Computex에서 하이브리드 로컬-클라우드 추론 시스템을 공개했습니다. 이 시스템은 쿼리를 지능적으로 온디바이스 모델과 클라우드 기반 모델 사이에 분배하여, 가벼운 작업에는 온디바이스 모델을, 복잡한 추론에는 클라우드 모델을 활용합니다. 회사의 이전 Personal Computer 에이전트를 기반으로 하며 엣지 컴퓨팅과 클라우드 AI의 이점을 결합합니다.
- 온디바이스 모델과 클라우드 모델 간 지능형 쿼리 라우팅
- 가벼운 작업은 로컬, 복잡한 추론은 클라우드에서 처리
- Personal Computer 에이전트 기반의 발전된 하이브리드 아키텍처
Anthropic, IPO 앞두고 기업의 높은 AI 비용 문제에 직면
Anthropic이 IPO를 신청했으나 기업의 높은 AI 비용에 대한 우려가 커지고 있습니다. 주요 고객인 기업들이 AI 투자에 회의적이며, 조사에 따르면 40%의 기업이 비용 절감 효과가 10% 미만이라고 응답했습니다. Anthropic이 OpenAI를 초과하여 기업 고객을 확보하는 등 강한 성과를 보이고 있음에도 불구하고, 더 저렴한 모델이나 오픈소스 대안으로의 전환 위험이 존재합니다.
- IPO 추진 중 기업의 높은 AI 비용 우려 심화
- 40%의 기업이 10% 미만의 비용 절감만 경험
- 저렴한 모델·오픈소스 전환으로 인한 매출 감소 위험
Anthropic, Project Glasswing을 15개국 이상 150개 조직으로 확대
Anthropic이 보안 취약점 발견 프로그램인 Project Glasswing(내부명 Mythos)을 15개국 이상의 150개 추가 조직으로 확대했습니다. 새로운 파트너들은 접근 권한을 얻기 전에 보안 요구사항을 충족해야 합니다. 출시 이후 Project Glasswing 파트너들은 10,000개 이상의 높음 또는 심각 수준의 보안 취약점을 발견했으며, Apple, Nvidia, Microsoft, CrowdStrike, Palo Alto Networks 등이 주요 파트너입니다.
- Project Glasswing을 15개국 이상 150개 조직으로 확대
- 10,000개 이상의 높음/심각 수준 보안 취약점 발견
- Apple, Nvidia, Microsoft 등 주요 기업 파트너십
GitHub의 AI 에이전트 전략, 급증하는 코드 배포에 대응
GitHub는 소프트웨어의 중심 플랫폼으로서 코딩 에이전트로 인한 코드 배포 급증에 직면하고 있습니다. 올해 코딩 활동이 1,400% 증가함에 따라 인간 개발자의 속도를 기준으로 설계된 인프라에 큰 부담이 가해지고 있습니다. GitHub COO Kyle Daigle과의 인터뷰를 통해 회사 내 AI의 변화, 그의 AI 활용 방식, AI 시대가 플랫폼에 미치는 영향 등을 다루고 있습니다.
- 올해 코딩 활동 1,400% 증가로 기존 인프라 부담 증가
- AI 에이전트에 대응하는 플랫폼 기술 개발 진행
- Kyle Daigle COO의 AI 시대 플랫폼 전략 공개
TinyFish, 텍스트 프롬프트를 라이브 데이터셋으로 변환하는 Bigset 출시
TinyFish가 텍스트 프롬프트를 웹의 구조화된 데이터셋으로 변환하는 오픈소스 시스템 Bigset을 출시했습니다. 이 도구는 사용자가 자연어 명령어만으로 실시간 웹 데이터에서 필요한 구조화된 데이터를 자동으로 생성할 수 있게 합니다. 데이터 수집과 처리 자동화를 통해 데이터 엔지니어링 작업을 단순화합니다.
- 자연어 프롬프트를 라이브 웹 데이터셋으로 자동 변환
- 오픈소스 Bigset 시스템 공개
- 구조화된 데이터 생성으로 데이터 엔지니어링 자동화
🔬 과학 & 미래 기술
비주얼 AI 혁신: 편집 가능한 코드 생성 시대의 도래
비주얼 AI는 최종 픽셀 이미지 생성에서 편집 가능한 소스코드 생성으로 발전하고 있다. HTML/CSS와 Blender 스크립트 같은 구조화된 형식의 코드 네이티브 생성을 통해 생성 후 지속적인 반복과 피드백이 가능해진다. 이는 설계 및 3D 모델링 업계의 워크플로우를 근본적으로 혁신하는 frontier 기술로, 정적 이미지 대신 적응형이고 편집 가능한 디지털 아티팩트를 창출하게 될 것이다.
- 비주얼 AI의 출력 형식이 픽셀 기반에서 편집 가능한 소스코드로 전환
- HTML/CSS와 Blender 스크립트 등 구조화된 코드 형식으로 생성되어 정밀한 수정 가능
- 설계, 3D 모델링 업계의 워크플로우를 근본적으로 변화시키는 frontier 기술
- 정적 이미지 대신 적응형이고 반복 수정 가능한 디지털 아티팩트 생성 방식으로 전환
월 어텐션: AI 장문맥 추론을 강화하는 새로운 메커니즘
월 어텐션(Wall Attention)은 persistent memory tokens를 활용하여 정보를 효율적으로 조직하고 장문맥 추론 능력을 개선하는 새로운 어텐션 메커니즘이다. AI 모델의 context window를 최적화하여 대규모 정보 처리 능력을 크게 향상시키는 이 기술은 대규모 언어 모델의 추론 능력 향상을 위한 중요한 연구 성과다.
- Persistent wall memory tokens로 정보를 효율적으로 조직하고 구조화
- 장문맥(long-context) 추론 능력을 높이는 새로운 어텐션 메커니즘 제시
- AI 모델의 context window 효율성 개선으로 더욱 복잡한 작업 처리 가능
- 대규모 언어 모델 기술의 frontier 확장을 위한 연구 성과
💻 프로그래밍
Codex 새로운 기능 출시
OpenAI가 Codex의 새로운 기능과 역할별 플러그인을 발표했습니다. 데이터 분석, 창의적 제작, 영업, 제품 디자인, 주식 투자, 투자 은행 등 6가지 분야에 특화된 플러그인을 통해 개발자와 기업들이 코드 생성 기능을 더욱 효과적으로 활용할 수 있게 되었습니다.
- 데이터 분석, 창의 제작, 영업 등 역할별 맞춤형 플러그인 출시
- Codex 코드 생성 기능의 실무 응용 범위 확대
- 다양한 비즈니스 워크플로우 자동화 지원
AI 추론 도용 방지 기술
Vercel이 노출된 API 엔드포인트를 악용한 AI 추론 도용 공격 방지 방법을 공개했습니다. 기존의 레이트 제한만으로는 부족하며, BotID 분석을 통해 모든 AI 요청을 검증하는 보안 접근법을 제시했습니다. 이는 개발자들이 대규모로 API 엔드포인트를 보호해야 하는 현대적 과제를 다룹니다.
- 노출된 API 엔드포인트를 통한 AI 추론 도용 위험
- 기존 레이트 제한의 한계와 개선 방안
- BotID 분석 기반의 요청 검증 보안 기법
Wall Attention 메커니즘
Wall Attention은 장문맥 추론을 개선하는 혁신적인 attention 메커니즘입니다. 정보를 지속성 있는 "wall" 메모리 토큰 주위로 구성하여 모델의 장기 의존성 처리 능력을 향상시킵니다. GitHub 레포지토리로 공개되어 개발자들이 직접 활용할 수 있습니다.
- 장문맥 추론 성능 대폭 개선
- 영구적 "wall" 메모리 토큰 기반의 주의 메커니즘
- 오픈소스 라이브러리로 제공되는 프레임워크
에이전트 프레임워크 메모리 구현 현황
Mem0의 조사에 따르면, Claude Code, Codex, Copilot, OpenClaw, Hermes, Bedrock AgentCore, Windsurf, Devin 등 주요 에이전트 프레임워크에서 동일한 메모리 구현의 한계가 발견되었습니다. 개발자들이 에이전트 도구를 선택할 때 고려해야 할 중요한 기술적 제약사항들을 분석했습니다.
- 제한된 로컬 저장소와 약한 키워드 기반 검색 메커니즘
- 에이전트 프레임워크 스코핑 및 staleness 처리의 약점
- 57-71% 범위의 크로스 유저 메모리 오염율 발견
🎨 디자인 & 데이터 사이언스
Visual AI의 새 경계 - 코드 기반 생성 시대
비주얼 AI의 패러다임이 최종 픽셀 출력에서 편집 가능한 소스 코드 생성으로 전환되고 있습니다. HTML/CSS와 Blender 스크립트 같은 구조화된 포맷으로 산출물을 생성하면 후속 피드백과 반복 수정이 용이해져, 디자인과 3D 모델링 워크플로우를 근본적으로 혁신합니다. 이 접근법은 일관성 있는 3D 구조와 상호작용 에셋이 중요한 산업에 큰 가치를 제공하며, 비주얼 AI는 정적 이미지 생성에서 적응형의 편집 가능한 디지털 산출물 창조로 진화하고 있습니다.
- 비주얼 AI의 핵심 변화: 최종 픽셀 대신 편집 가능한 소스 코드 생성
- HTML/CSS, Blender 스크립트 등 구조화된 표현 포맷으로 정확한 수정 가능
- 디자인과 3D 모델링의 연속적 반복 및 피드백 프로세스 혁신
- 일관성 있는 3D 구조가 필요한 산업에 직접 적용 가능
TinyFish Bigset - 텍스트 프롬프트를 실시간 데이터셋으로 변환
TinyFish가 오픈소스 데이터 파이프라인 시스템 Bigset을 출시했습니다. 이 도구는 자연언어 텍스트 프롬프트를 웹 실시간 데이터로부터 구조화된 데이터셋으로 자동 변환합니다. 이는 데이터 수집과 전처리 작업의 효율성을 크게 향상시키며, 데이터 엔지니어링과 ML 파이프라인 구축을 간소화하는 혁신적 솔루션입니다.
- 텍스트 프롬프트로 웹 실시간 데이터 기반 구조화 데이터셋 자동 생성
- 오픈소스 시스템으로 누구나 데이터 파이프라인 구축 가능
- 데이터 수집 및 전처리 작업의 시간과 리소스 절감
- ML 모델 학습용 고품질 데이터셋 확보 프로세스 간소화
메모리는 인공지능의 보조 도구가 아니라, 추론이 작동하는 현실 자체를 결정하는 계층이다. 기업 조직에서 같은 데이터가 영업, 제품, 법무, 엔지니어링, CEO의 관점에 따라 완전히 다른 의미를 가지므로, 시스템에 고정된 온톨로지는 미성숙한 프레임 안에 갇히게 된다.
Microsoft의 튜닝 기술, MiniMax의 장문맥 모델, OpenAI의 맞춤형 플러그인은 AI가 점차 실용적이고 도메인별 맞춤형 솔루션으로 진화하고 있음을 보여줍니다. 비주얼 AI의 코드 생성 전환과 하이브리드 로컬-클라우드 추론 같은 기술적 혁신도 계속되고 있습니다. 그러나 Anthropic의 비용 논란은 기업들이 이제 모델의 성능뿐 아니라 실질적인 비용 효율성과 ROI를 강하게 요구하기 시작했음을 의미합니다. AI 산업은 기술 경쟁에서 비용과 실제 도입 가능성이 핵심 요소가 되는 새로운 단계로 진입하고 있습니다.
타로신박: 마음이 복잡할 때 오마카세 타로 - Google Play 앱
매일 카드 1장으로 시작하는 AI 타로 루틴 — 상담·저널·퀴즈까지, 완전 무료
play.google.com
| AI: 인공지능의 핵심만 콕 집어드립니다! 인공지능(AI)의 최신 트렌드, 기술 혁신, 그리고 실용적인 적용 사례를 간결하고 명확하게 제공하는 요약 플랫폼입니다. 복잡한 AI 기술을 쉽고 빠르게 이해할 수 있도록 돕는 #_.AI는 누구나 AI의 미래를 탐구할 수 있는 완벽한 가이드입니다. 최신 AI 트렌드, 실질적인 적용 사례, 전문가를 위한 깊이 있는 정보, AI 기술의 발전 방향과 미래에 미칠 영향에 대한 심도 있는 분석을 제공합니다. AI의 핵심을 빠르고 간결하게 파악하고 싶다면 #_.AI와 함께하세요. 인공지능의 미래를 열어가는 첫걸음이 될 것입니다! 원문 : TLDR |
![]() |
