Claude Code로 네이버 알고리즘 리서치 자동화 — 4-agent 병렬, 6세션 102 tool calls

치과 광고 클라이언트에서 “요즘 네이버 느낌이 다른데, 알고리즘 바뀐 거 맞죠?” 질문이 연달아 왔다. ADVoost 전환 이후 체감이 달라졌다는 피드백이 늘었고, “바뀐 것 같다”는 답변은 쓸모없다. 6개 세션 102 tool calls로 공식 공지 17건을 분석하고 HTML 보고서 3종을 만들었다.

TL;DR research 스킬로 4-agent 병렬 디스패치 → Codex 교차검증으로 미확인 주장 분리 → HTML 보고서 반복 생성. 작업 중 2026-05-07 네이버 AI 브리핑 광고 베타 시작을 하루 만에 실시간으로 캐치했다.

Opus 4개 동시, 21분 만에 4가지 각도 완성

네이버 알고리즘 변경 리서치는 단일 프롬프트로 하기 어렵다. 공식 공지, 업계 커뮤니티 관찰, ADVoost 기술 변화, 치과 광고 실무 적용—이 4개 각도는 소스도 다르고 신뢰도도 다르다. 섞어서 물어보면 모델이 공식 사실과 추론을 뭉개버린다.

research 스킬의 해법은 4-agent 병렬 디스패치다. 단일 메시지에서 Agent 호출 4개를 동시에 보낸다.

Agent 1: 공식 공지·서치어드바이저 원문 추출
Agent 2: 자연검색·플레이스 랭킹 변화 (커뮤니티 + 업계 관찰)
Agent 3: ADVoost 매칭 로직 변화 분석
Agent 4: 치과/의료 광고 실무 적용 각도

각 에이전트 프롬프트에 “출처 URL 필수, 자매 에이전트와 중복 영역을 플래그하라” 조건을 명시했다. 결과물이 4개 독립 파일로 떨어지면 합의·상충·미검증을 분리하는 회의록을 따로 만든다. 순차로 돌리면 80분이 걸릴 작업이 21분으로 끝났다.

세션 1 tool calls: Agent(8), Read(5), Bash(4), TodoWrite(3), Write(2).

Codex가 잡아낸 미확인 공지 — Evidence Grading 도입

4개 에이전트 결과를 합치자마자 문제가 드러났다. 첫 번째 초안에 “2026-05 플레이스광고 적용 공지”가 사실처럼 들어가 있었는데, naver_ads_notice_extracts.json 15건 어디에도 없었다. 의료광고 컴플라이언스 특성상 공식 확인 없는 “알고리즘 변화” 표현은 위험하다.

세션 2에서 claude_synthesis_review.md를 별도로 만들고 증거 등급을 강제했다.

공식 확인   → 광고 공지에 명시된 것만
              (확장검색·ADVoost·병의원 소재·플레이스광고 테스트)
도움말 해석 → 공식 도움말에서 추론 가능한 것
업계 관찰   → 공지 없이 커뮤니티·실무에서 관찰된 것
합리적 유추 → 공식 자료 기반 추론
확인 필요   → 출처 부재 또는 미확인 주장

자연검색·플레이스 일반 랭킹은 비공개 정책이라 “업계 관찰” 이상으로 올릴 수 없었다. Codex 교차검증 없이 그냥 넘겼으면 클라이언트 보고서에 미확인 주장이 그대로 들어갔을 것이다.

세션 2 tool calls: Read(4), Bash(4), Write(2), Grep(1). 소요 5분.

API Overload, 그리고 파일 기반 상태 관리의 진짜 가치

세션 3에서 HTML 보고서를 처음 만들려다 API Error: Overloaded가 터졌다. Opus 4.7 + 8개 병렬 에이전트 조합이 너무 많은 요청을 한꺼번에 날렸다.

그런데 손실이 없었다. research-minutes.md와 claude_naver_research_report.md가 이미 저장돼 있었기 때문에 세션 4에서 이어받아 바로 보고서로 진행했다. 파일 기반 상태 관리의 실질적인 이점이 여기서 드러난다. 에이전트가 중간 결과를 파일로 떨어뜨리도록 설계해두면 세션이 끊겨도 컨텍스트를 잃지 않는다.

세션 4에서 만든 naver_algorithm_ad_agency_prediction_report_2026-05-08.html은 40.9KB, 429 lines. 구조:

§1 핵심 결론 + 의료광고 안전 박스 (앞쪽 고정)
§2 증거 등급 범례 (5단계 시각화)
§3 객관 자료 — 공지 17건 기반 수치 카드
§4 자연검색·플레이스 관찰
§5 광고 대행사 영향 예측
§7 동백 플레이스광고 파일럿 분석

세션 4 tool calls: Bash(15), Read(6), Grep(4), Glob(1), Write(1). Bash가 15번인 이유는 Write 후 태그 쌍 균형, DOCTYPE, viewport, 섹션 존재 여부를 스크립트로 직접 검증했기 때문이다.

사용자가 “최근 6개월, 핵심만”으로 요청을 바꿔서 세션 5에서 세 번째 버전이 나왔다. HTML 보고서를 3번 만든 건 요구사항 발전이었다—처음엔 “변화 전반”, 두 번째는 “대행사 예측”, 세 번째는 “최근 6개월 압축”.

데일리 에이전트가 하루 전 AI 브리핑 베타를 잡았다

세션 6에서 예상 밖 결과가 나왔다. medical_dental_ads_daily_goal.md에 정의된 데일리 리서치 에이전트를 돌리다가 공식 소스 순회 중 하나가 걸렸다.

2026-05-07, 즉 어제 네이버가 ‘AI 브리핑’ 광고 베타를 시작했다.

에이전트 프롬프트에 확인 대상 URL을 명시해둔 것이 핵심이었다:

- 네이버 광고 공지 https://ads.naver.com/notice?categoryId=147
- 네이버 광고 도움말 https://ads.naver.com/help
- 네이버 서치어드바이저 https://searchadvisor.naver.com/
- 대한치과의사협회 의료광고심의 https://www.dentalad.or.kr

이 목록 없이 일반 WebSearch만 쓰면 모델이 블로그 포스트를 먼저 가져온다. URL을 직접 지정하는 것만으로 소스 신뢰도가 달라진다.

WebSearch(9) + WebFetch(6) 조합으로 확인한 내용:

1차 적용: 쇼핑검색광고/ADVoost 연동, AI 답변 하단 노출
헬스케어 버티컬 AI는 연내 로드맵 명시
의료 키워드 적용 여부: [확인 필요]

데일리 에이전트가 아니었으면 며칠 후에나 알았을 내용이 당일 클라이언트 브리핑에 바로 들어갔다.

전체 통계

도구	호출 수	주요 용도
Bash	29	파일 검증, 상태 업데이트
Read	28	소스 파일 읽기
Write	9	산출물 파일 생성
WebSearch	9	공식 소스 탐색
Agent	8	병렬 리서치 디스패치
WebFetch	6	공지 페이지 크롤링
Grep	5	키워드 검증
TodoWrite	3	단계 추적
합계	102

생성 파일 8개, 수정 파일 0개. 이터레이션마다 새 파일로 결과물을 만들었다—중간 결과를 덮어쓰면 Codex 교차검증에서 비교 기준이 사라지기 때문이다.

병렬 에이전트는 breadth 문제에 효과적이다. 단일 에이전트 4회보다 동시 4-agent가 빠르고 균형 잡힌 결과를 낸다. 에비던스 등급을 강제하지 않으면 공식 확인과 추론이 섞인다는 것도 확인했다. 명시적인 분류 단계를 별도 세션으로 뺀 것, Codex 교차검증을 거친 것이 클라이언트 보고서 품질을 실질적으로 바꿨다.

Opus 4개 동시, 21분 만에 4가지 각도 완성

Codex가 잡아낸 미확인 공지 — Evidence Grading 도입

API Overload, 그리고 파일 기반 상태 관리의 진짜 가치

데일리 에이전트가 하루 전 AI 브리핑 베타를 잡았다

전체 통계

Comments 0