Anthropic

Claude Opus 4

Name: Anthropic Claude Opus 4
Author: Anthropic

비교

Model ID:claude-opus-4-20250514

2025-05-22

비교

Claude Opus 4는 2025년 5월에 출시된 Anthropic의 획기적인 코딩 및 에이전트 모델로, 복잡한 장시간 작업에서 지속적인 성능의 새로운 기준을 세웠습니다. SWE-bench(72.5%)와 Terminal-bench(43.2%)에서 선두를 기록하며, 수천 단계의 에이전트 워크플로를 성능 저하 없이 수 시간 동안 연속 처리할 수 있습니다. 하이브리드 모델로서 즉각적인 응답과 깊은 사고를 위한 확장 사고 모드를 모두 지원하며, 병렬 도구 사용과 향상된 지시 기억 능력을 갖추고 있습니다.

API|비전심층 사고웹 검색파일|상용 모델

학습 완료일

2025-05-01

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

1MIN128KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

$15IN$75OUT

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

출처:공식 문서 OpenRouter

AI 성능 평가

Arena 종합 점수

1424

±4

집계일 2026-05-01

종합 순위

73위

36,941 투표수

Arena 능력별 점수

한국어 능력

1380±2353위

복잡한 질문

1456±658위

전문 지식

1446±1474위

지시 이행

1443±737위

대화 기억

1437±862위

창의력

1429±938위

코딩 실력

1498±840위

수학 능력

1419±1276위

Arena 직군별 점수

문학·창작

1429±743위

생활·사회과학

1438±876위

엔터·미디어

1420±846위

경영·금융

1412±890위

의학·보건

1445±1375위

법률·행정

1435±1271위

소프트웨어·IT

1466±661위

수학·통계

1424±1375위

출처:Arena Intelligence

종합

AA Intelligence Index

39%↓1%

ForecastBench

61%↑1%

추론·수학

AA Math Index

73%↓1%

GPQA Diamond

80%↓3%

HLE

12%↓7%

MMLU-Pro

87%↑6%

AIME 2025

73%↓1%

MATH-500

98%↑5%

코딩

AA Coding Index

34%↓2%

LiveCodeBench

64%↓2%

TAU2

73%↓11%

TerminalBench

31%↓3%

SciCode

40%↓3%

언어·지시

IFBench

54%↓9%

AA-LCR

34%↓29%

환각률 (HHEM)

12%↑2%

사실 일관성 (HHEM)

88%↓2%

출력 속도

일반 모드

34tok/s↓48

출력 시작 1.33s

추론 모드

38tok/s↓54

출력 시작 7.55s

출처:Artificial Analysis ForecastBench Vectara HHEM

Anthropic

AI 성능 평가

Arena 종합 점수

1424

±4

집계일 2026-05-01

종합 순위

73위

36,941 투표수

Arena 능력별 점수

한국어 능력

1380±2353위

복잡한 질문

1456±658위

전문 지식

1446±1474위

지시 이행

1443±737위

대화 기억

1437±862위

창의력

1429±938위

코딩 실력

1498±840위

수학 능력

1419±1276위

Arena 직군별 점수

문학·창작

1429±743위

생활·사회과학

1438±876위

엔터·미디어

1420±846위

경영·금융

1412±890위

의학·보건

1445±1375위

법률·행정

1435±1271위

소프트웨어·IT

1466±661위

수학·통계

1424±1375위

종합

AA Intelligence Index

39%↓1%

ForecastBench

61%↑1%

추론·수학

AA Math Index

73%↓1%

GPQA Diamond

80%↓3%

HLE

12%↓7%

MMLU-Pro

87%↑6%

AIME 2025

73%↓1%

MATH-500

98%↑5%

코딩

AA Coding Index

34%↓2%

LiveCodeBench

64%↓2%

TAU2

73%↓11%

TerminalBench

31%↓3%

SciCode

40%↓3%

언어·지시

IFBench

54%↓9%

AA-LCR

34%↓29%

환각률 (HHEM)

12%↑2%

사실 일관성 (HHEM)

88%↓2%

출력 속도

일반 모드

34tok/s↓48

출력 시작 1.33s

추론 모드

38tok/s↓54

출력 시작 7.55s