AI 비교하기AI 사용하기AI 최신정보AI 커뮤니티
우리의 비전이용약관개인정보처리방침문의하기
Anthropic
Anthropic

Claude Opus 4

비교
Model ID:claude-opus-4-20250514
2025-05-22
비교

Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.

API|비전심층 사고웹 검색파일|상용 모델
학습 완료일
2025-05-01

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량
1MIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)
$15IN$75OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기
출처:공식 문서OpenRouter

AI 성능 평가

Arena 종합 점수
1424
±4
집계일 2026-05-01
종합 순위
73위
36,941 투표수
Arena 능력별 점수
한국어 능력
1380±2353위
복잡한 질문
1456±658위
전문 지식
1446±1474위
지시 이행
1443±737위
대화 기억
1437±862위
창의력
1429±938위
코딩 실력
1498±840위
수학 능력
1419±1276위
Arena 직군별 점수
문학·창작
1429±743위
생활·사회과학
1438±876위
엔터·미디어
1420±846위
경영·금융
1412±890위
의학·보건
1445±1375위
법률·행정
1435±1271위
소프트웨어·IT
1466±661위
수학·통계
1424±1375위
출처:Arena Intelligence
종합
AA Intelligence Index
39%↓1%
ForecastBench
61%↑1%
추론·수학
AA Math Index
73%↓1%
GPQA Diamond
80%↓3%
HLE
12%↓7%
MMLU-Pro
87%↑6%
AIME 2025
73%↓1%
MATH-500
98%↑5%
코딩
AA Coding Index
34%↓2%
LiveCodeBench
64%↓2%
TAU2
73%↓11%
TerminalBench
31%↓3%
SciCode
40%↓3%
언어·지시
IFBench
54%↓9%
AA-LCR
34%↓29%
환각률 (HHEM)
12%↑2%
사실 일관성 (HHEM)
88%↓2%
출력 속도
일반 모드
34tok/s↓48
출력 시작 1.33s
추론 모드
38tok/s↓54
출력 시작 7.55s
출처:Artificial AnalysisForecastBenchVectara HHEM
AnthropicAnthropic