코딩 에이전트가 넘쳐나는 시대다. 뭘 써야 할지 모르겠다면 이 글이 도움이 될 것이다.
지금 주목할 에이전트는 이렇다.
- Cursor
- Amp
- GitHub Copilot
- Windsurf
- Antigravity
- Claude Code
- OpenAI Codex
- Kilo
- Kimi 2.5 (Moonshot AI)
- Minimax M2.5
먼저, 에이전트를 나누는 기준
코딩 에이전트는 크게 두 종류로 나뉜다.
LLM 개발사가 직접 만든 에이전트
- Antigravity (Google Gemini)
- Codex (OpenAI)
- Claude Code (Anthropic)
- Kimi 2.5 (Moonshot AI)
- Minimax M2.5 (Minimax)
2차 벤더 에이전트
- Cursor
- Amp
- GitHub Copilot
- Windsurf
- Kilo
이 분류가 왜 중요한가. 가격과 UX가 달라지기 때문이다.
개발사가 직접 만든 에이전트는 자사 모델을 쓰니 가격이 상대적으로 저렴하다. 당연한 일이다. 반면 2차 벤더는 토큰 비용이 높을 수밖에 없다. 대신 여러 모델을 바꿔가며 쓸 수 있다. 모델 자체에 힘을 줄 수 없으니 RAG 기술을 고도화하는 방향으로 경쟁한다. 코딩에서 context를 최대한 짧게 가져가는 것이 핵심이다.
Context가 뭔데 그게 중요한가
코딩은 파일 하나로 돌아가지 않는다. 하나의 기능이 수십 개의 파일과 엮여 있다. 그러니 한 함수에 문제가 생겨도, 그 함수만 LLM에 넣으면 안 된다. 연관된 모든 파일을 함께 넣어야 제대로 된 답이 나온다. 그 연관 데이터 묶음을 context라 한다.
그럼 다 넣으면 되는 거 아닌가. 아니다. 토큰 비용이 폭발한다. Cursor를 무분별하게 쓰면 한 달에 100만 원 넘게 나오는 경우도 있다.
모델이 좋으면 다 해결되는 거 아닌가. 경험상 절대 그렇지 않다. 같은 모델을 써도 어떤 에이전트는 문제를 해결하고, 어떤 에이전트는 토큰만 무한정 태운다. 에이전트 설계 자체가 결과를 바꾼다.
이런 배경을 바탕으로 각 에이전트를 평가해보겠다.
에이전트별 솔직한 평가
Cursor 가장 먼저 등장한 코딩 에이전트다. 그만큼 사용자가 많고 생태계도 크다. 다만 요금제가 복잡하다.
Amp JetBrains의 AI 코딩 도구를 만들던 Sourcegraph가 개발했다. 코드 파싱 기술이 뛰어나서, 다른 에이전트가 못 잡는 오류도 Amp는 해결하는 경우가 많다. 광고를 보면 하루 10달러를 무료로 쓸 수 있는 요금제가 있어 가성비 면에서 주목받았다.
다만 2026년 3월, 갑작스러운 공지가 나왔다. VS Code 익스텐션 지원을 종료하고 CLI 방식으로 전환한다는 내용이다. 무료 사용자는 Amp CLI로 이전해야 하고, 유료 크레딧 보유자는 익스텐션을 계속 쓸 수 있지만 더 이상 업데이트나 공식 지원은 받지 못한다. 방향성 자체는 CLI 중심으로 재편되는 추세와 맞닿아 있지만, 사용자 입장에서는 갑작스러운 변화다.
Antigravity (Google Gemini) Google이라는 네임밸류가 있다. Gemini 기반이지만, Opus를 선택해서 쓸 수 있다는 점이 더 끌린다.
Codex (OpenAI) 29,000원 요금제에 넉넉한 토큰을 준다. xhigh로 사용하면 Amp와 비슷한 성능을 낸다.
Claude Code (Anthropic) 17달러로 시작하지만 금방 한계에 닿는다. 다음 단계인 Max 플랜은 110달러라 부담이 크다. 그럼에도 코딩 성능은 최고 수준이다. 미국 국방부도 인정한 정도다. 개발사 직접 제공이라 토큰 단가는 상대적으로 저렴하다.
Kimi 2.5 (Moonshot AI) 중국 언어모델이다. 가중치가 공개되어 있어 셀프 호스팅으로 쓰는 곳도 많다. 성능은 미국 모델보다 다소 아래지만, 가격이 압도적으로 저렴하다.