빌드 로그, AI 팁, 뉴스, 블로그 글을 모아 놓은 곳이다.
OpenAI의 Pentagon 계약 이후 대규모 사용자 이탈이 발생했습니다. Anthropic의 Claude가 미국 앱스토어 1위에 올랐지만, 급증한 트래픽에 글로벌 장애가 발생했습니다. 일일 가입자 기록 경신, 유료 구독자 2배 이상 증가 등 전례 없는 성장세입니다.
Google이 Gemini AI를 복제하려는 대규모 공격을 공개했습니다. 10만 건 이상의 프롬프트로 내부 추론 과정을 추출하려는 시도였으며, 북한·러시아·중국 등에서 발원한 것으로 추정됩니다. AI 모델 보안이 새로운 사이버 보안 영역으로 부상하고 있습니다.
OpenAI의 로보틱스 하드웨어 리더 Caitlin Kalinowski가 Pentagon 계약에 항의해 사임했습니다. '감시와 자율 무기에 대한 가드레일 없이 계약이 서둘러 발표됐다'는 것이 사임 이유입니다. OpenAI 내부에서 군사 AI 계약에 대한 균열이 표면화되고 있습니다.
Alibaba가 Qwen 3.5 Small 시리즈(0.8B~9B)를 오픈소스로 공개했습니다. 4B 모델이 262K 컨텍스트와 멀티모달을 지원하며 8GB VRAM으로 구동됩니다. 9B 모델은 자신보다 13배 큰 GPT-OSS-120B를 다수 벤치마크에서 능가합니다.
N개 AI × M개 도구 = N×M개 커스텀 연동. MCP는 이걸 N+M으로 바꿨다
팀원 10명이 각자 다른 프롬프트를 쓰면 답변 품질이 들쭉날쭉하다. 한 파일로 해결했다
CLAUDE.md의 지시는 잊힐 수 있다. Hooks는 매번, 확정적으로 실행된다
From o1 to DeepSeek-R1 to Claude's extended thinking. How test-time compute is reshaping AI.
o1, DeepSeek-R1, Claude extended thinking까지. test-time compute가 AI를 바꾸는 방식.
GPT-4급 성능이 100분의 1 가격이 된 2026년, 진짜 병목은 모델이 아니라 아키텍처다
집중된 300토큰이 113,000토큰보다 나은 성능을 보인다. 적게, 정확하게 넣는 기술
Basic RAG is dead. GraphRAG, Agentic RAG, and where open source still matters.
기본 RAG는 끝났다. GraphRAG, Agentic RAG, 그리고 오픈소스 생태계의 현주소.
Bigger isn't always better. Four techniques for efficient model deployment.
큰 모델만이 답이 아니다. 작은 모델을 효율적으로 쓰는 4가지 기술.
You don't need GPT-4 for every request. Model routing and cost optimization strategies.
모든 요청에 GPT-4를 쓸 필요 없다. 모델 라우팅과 비용 최적화 전략.
Andrej Karpathy coined vibe coding. Here's what it means, how to do it well, and where it falls short.
Andrej Karpathy가 말한 vibe coding의 정의, 실전 활용법, 그리고 한계.
AI 3개와 도구 3개를 연동하려면 과거엔 9개의 커스텀 코드가 필요했다. Claude용, ChatGPT용, Cursor용을 각각 따로 짜야 했기 때문이다. N×M...
N AI apps × M tools = N×M custom integrations. MCP turns that into N+M
LLM이 나쁜 답을 낼 때 원인은 모델보다 컨텍스트 설계인 경우가 많다. 컨텍스트는 시스템 프롬프트, 도구 정의, RAG 문서, 메모리, 대화 이력, 사용자 메시지까지 포함한 전체...
A focused 300-token context outperforms an unfocused 113,000-token one. Less is more, if nothing’s missing
팀의 AI 품질 편차는 모델 문제가 아니라 컨텍스트 표준 부재에서 나온다. 같은 질문에 다른 답이 나오는 이유는 팀원이 각자 다른 프롬프트/규칙을 쓰기 때문이다. 우리는 4개...
10 team members, 10 different prompts, wildly inconsistent results. CLAUDE.md fixed it
CLAUDE.md는 강력하지만 컨텍스트 압력(context pressure)에서 지시가 밀릴 수 있다. Hooks는 다르다. LLM에게 부탁하는 게 아니라 실행 레벨에서 차단/강제를...
CLAUDE.md instructions can be forgotten. Hooks execute every time, deterministically
2024~2026년 프로덕션 AI 실패의 대부분은 모델 품질 때문이 아니었다. Gartner에 따르면 2026년 말까지 기업 애플리케이션의 40%가 AI 에이전트를 내장할 것으로...
With GPT-4-level performance at 1/100th the cost, the bottleneck in 2026 isn’t the model — it’s the system around it
Anthropic CEO Dario Amodei가 Claude의 의식 가능성을 공개적으로 언급했습니다. 동시에 중국 AI 랩 3곳이 24,000개 사기 계정으로 Claude를 무단 사용한 것이 적발됐고, 전례 없는 수요로 서비스 장애도 발생했습니다.
Google DeepMind의 Gemini 3.1 Pro가 Artificial Analysis Intelligence Index에서 115개 모델 중 1위를 차지했습니다. Apple은 Siri 업그레이드에 1.2조 파라미터 Gemini 모델을 채택했고, AI Mode Canvas가 미국 전체로 확대됐습니다.
Zhipu AI의 GLM-5가 Huawei 칩만으로 훈련해 SWE-bench 오픈소스 1위를 기록했습니다. Microsoft는 15B 멀티모달 모델 Phi-4를, Alibaba는 Qwen3.5를 공개했습니다. 오픈소스 LLM 경쟁이 새로운 국면에 진입했습니다.
OpenAI가 GPT-5.4를 출시했습니다. 1M token context, native computer-use, OSWorld 인간 초과 성능을 기록했습니다. 동시에 GPT-4o부터 GPT-5까지 대규모 레거시 모델 은퇴가 진행됩니다.
Anthropic이 만든 Model Context Protocol(MCP)을 OpenAI, Microsoft, Google이 모두 채택했습니다. AI 모델과 외부 도구를 연결하는 사실상의 업계 표준이 된 것입니다.
Anthropic이 모델 라인업을 대폭 교체했습니다. Opus 4.6가 기본 모델이 되고, Opus 4/4.1은 퇴역합니다. Sonnet 4.6는 1M token context를 베타로 제공하며, Cowork 기능이 Pro 사용자에게 공개됐습니다.
DOD가 Anthropic을 supply chain risk로 지정했습니다. 자율 무기와 대규모 감시에 Claude 활용을 거부한 것이 원인입니다. Anthropic은 법적 대응을 예고했고, 클라우드 3사는 비국방 고객 지원을 계속하겠다고 밝혔습니다.
매일 아침 9시, Claude/Gemini/GPT 등 주요 LLM 소식을 자동으로 수집하고 포스팅한다.
As a solo developer, the biggest time sink isn't code — it's repetitive tasks. Writing blog posts,...
1. Context First, Command Second ❌ "Add a button" ✅ "Add a dark mode toggle button to...
2026년 2~3월 GitHub 트렌딩 100개 프로젝트를 뜯어봤다. 챗봇은 죽었다.
사주 사이트 디자인 검색 → 쓰레기. 본질 분해 → A(i)strology 발견 → Three.js로 별 8,000개를 깐 과정
Searched ‘fortune telling site design’ → garbage. Decomposed the essence → found A(i)strology → put 8,000 stars in a Three.js scene
“사주 사이트 디자인”을 검색하면 나오는 건 전부 Cafe24 템플릿이다. 빨간 배경에 금색 글씨. 용과 구름 일러스트. 어디선가 본 듯한 타로 카드 아이콘. 2008년에 만들어진...
2026년 2월, 하나의 GitHub 레포지토리가 60일 만에 별 250,000개를 찍었다. React가 10년 걸려 도달한 숫자다. OpenClaw라는 이름의 이 프로젝트는...
I tracked every trending repo for 5 weeks. The pattern was impossible to miss.
CLAUDE.md부터 Subagents까지. 이 5개가 기반이다.
Ralph Loop부터 Agent Teams까지. 스케일링과 병렬화의 영역.
1편에서 기반 5개를 다뤘다. CLAUDE.md, Skills, Hooks, GitHub Actions, Subagents. 이번에는 나머지 5개를 다룬다. 1편이 “Claude...
Ralph Loop to Agent Teams. Scaling, parallelism, and quality gates.
CLAUDE.md to Subagents. These 5 are the foundation. Get them wrong and everything else breaks.
Claude Code를 쓰면서 기능이 너무 많아서 헷갈렸다. CLAUDE.md, Skills, Hooks, MCP, Ralph Loop, Agent Teams, Worktrees,...
무료, 수료증 발급, 로그인만 하면 끝. 근데 진짜 쓸 만한 건 5개다.
API 호출만으로는 서비스가 안 된다. Tool Use, RAG, Agent 패턴까지 알아야 진짜 앱이 나온다.
Claude Code의 진짜 힘은 채팅창이 아니라 설정 파일에 있다.
Claude Code를 깔았다. claude를 치면 대화창이 뜬다. 거기서 “이 버그 고쳐줘” “테스트 짜줘”를 한다. 여기서 멈춰있는 사람이 많다. Claude Code의 진짜...
Claude Code’s real power isn’t in the chat. It’s in 3 config files.
Claude API를 호출하는 건 쉽다. messages.create에 프롬프트 넣으면 답이 온다. 근데 이것만으로는 서비스가 안 된다. 진짜 앱을 만들려면 3가지가 더...
API calls alone don’t make a product. You need Tool Use, RAG, and Workflows to build something real.
Anthropic이 Skilljar라는 플랫폼에 강의 13개를 올려놨다. 전부 무료. 수료증도 준다. Anthropic 계정도 필요 없고, 이메일로 Skilljar 가입만 하면 바로...
Free, certificates included, email signup only. But only 5 are worth your time.
전략이 복잡할수록 수익이 높을 거라고 생각했다. 지표 5개를 조합하고, ATR로 동적 손절을 걸고, 볼륨 게이트까지 추가하면 당연히 더 정교한 판단을 할 거라고. 그래서...
HuggingFace에 'Prompt & Dump'라는 AI 트레이딩 아레나가 있다. 참가자들이 LLM 프롬프트로 트레이딩 전략을 짜고, 실시간 시장에서 경쟁한다....
승률 44.3%. 100번 중 56번을 진다. 이 전략이 180일 동안 +6.78% 수익을 냈다. 처음에는 내 백테스트가 틀렸나 싶어서 세 번 돌려봤다. 맞았다. 반 이상 지는데...
44.3% win rate. Loses 56 out of 100 trades. This strategy returned +6.78% over 180 days. I ran the...
HuggingFace에 "Prompt & Dump"라는 AI 트레이딩 아레나가 있다. 참가자들이 LLM 프롬프트로 트레이딩 전략을 짜고, 실시간 시장에서 경쟁한다....
There's an AI trading arena on HuggingFace called "Prompt & Dump." Players write trading...
“프롬프트 엔지니어링”이라고 하면 대부분 “AI한테 잘 질문하는 법”을 떠올린다. 틀렸다. 그건 채팅 유저의 관점이다. API로 서비스를 만드는 개발자에게 프롬프팅은 모델의...
9개 세션, 20개 산출물, 가상 전문가 6명. 혼자, 하루, $0.
“어떤 모델이 제일 좋아요?” 이 질문 자체가 아마추어다. 정답은 “태스크마다 다르다”이고, 프로는 섞어 쓴다. 사주 앱이랑 부동산 분석 서비스를 사이드 프로젝트로 만들면서...
AI 사이드 프로젝트를 시작하면서 가장 먼저 든 생각이 “이거 비용 구조가 어떻게 되는 거지?”였다. 나는 사주 앱이랑 부동산 분석 서비스를 만들어보고 있는 개발자다. 둘 다...
한국어, 영어, 일본어, 중국어, 베트남어, 힌디어. next-intl로 하루만에.
LLM에 만세력 계산을 시켰더니 간지가 틀렸다. 3주 날린 뒤 깨달은 구조.
같은 사주 데이터로 6개 모델을 돌렸다. $0.0003부터 $0.0442까지, 결과물 차이는?
무료 분석 1건 $0.085, 월 $2,550. 이걸 $406으로 만든 구조.