앤트로픽, 미소스급 ‘페이블 5’ 출시…“위험시 하위 모델 자동 전환”

 

미소스급 AI 모델, 안전장치와 함께 공개

최강 성능을 자랑하는 새로운 인공지능 모델이 일반 사용자에게 선보였습니다. 이번 모델의 가장 큰 특징은 위험한 질문이 감지되면 자동으로 안전한 하위 모델로 전환되는 보안 시스템입니다.

◆ 안전 우선 설계
강력한 성능만큼 오용 가능성도 높아져, 엄격한 분류 시스템을 적용했습니다. 사용자가 사이버 보안, 생물학, 화학 관련 위험 질문을 하거나 모델을 복제하려는 시도가 포착되면 즉시 오퍼스 4.8 모델로 자동 전환됩니다. 잘못 감지할 확률은 5% 미만으로 매우 정확합니다.

같은 시기에 사이버 보안 전용 모델도 함께 출시되었습니다. 이 버전은 동일한 기반 기술을 사용하지만 보안 테스트 목적으로 안전장치를 일부 완화했으며, 정부 및 특정 협력사에게만 제공됩니다.

◆ 압도적인 성능 입증
각종 평가에서 현존하는 모든 모델을 제치고 1위를 차지했습니다. 특히 복잡하고 긴 작업일수록 타 모델과의 격차가 더욱 벌어졌습니다.

코딩 능력 테스트에서는 80.3%를 기록하며 이전 최고 모델(77.8%)을 넘어섰고, 터미널 벤치마크에서도 88%로 기존 1위였던 GPT-5.5(83.4%)를 크게 앞질렀습니다.

새롭게 도입된 프론티어코드 평가에서는 29.3%를 기록했는데, 이는 오퍼스 4.8(13.4%)과 GPT-5.5(5.7%)를 두 배 이상 초과하는 수치입니다.

법률(13.3%), 바이오, 사이버 보안(78%), 건강(66%) 등 전문 분야 테스트에서도 모두 압도적인 차이로 정상을 차지했습니다.

◆ 실제 활용 사례
한 결제 서비스 기업은 팀 전체가 2개월 걸릴 대규모 코드 작업을 이 모델을 활용해 단 하루 만에 완료했습니다.

별도 도구 없이 순수 시각 능력만으로 포켓몬스터 게임을 스스로 클리어하는 데도 성공했습니다. 이전 모델들은 복잡한 보조 장치를 사용해도 플레이에 어려움을 겪었던 것과 대조적입니다.

신약 개발 분야에서는 숙련된 전문가 수준으로 단백질 설계 과정을 자동 처리했으며, 일부 가설은 실제 연구실 실험을 통해 사실로 확인되기도 했습니다.

◆ 보안 및 안전성 검증
모델의 기만 행위나 악용 협력 등 부정적 행동은 이전 모델과 비슷하게 낮은 수준으로 확인됐습니다. 1000시간 이상의 외부 보안 테스트 프로그램에서도 일반적인 보안 우회 방법은 발견되지 않았습니다.

모든 사용 기록은 30일간 보관되며, 이는 사이버 공격 방어와 오탐지 개선 목적으로만 활용됩니다. 학습에는 절대 사용하지 않습니다.

◆ 이용 방법 및 가격
현재부터 22일까지 유료 구독자에게 추가 비용 없이 제공됩니다. 23일부터는 높은 컴퓨팅 자원 소모로 인해 별도 크레딧 충전 방식으로 전환되며, 향후 인프라가 확충되면 다시 구독 요금제에 포함될 예정입니다.

비용은 이전 미소스급 모델 대비 절반 수준으로 낮아졌습니다. 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러이지만, 오퍼스 4.8(5달러/25달러)보다는 2배 비쌉니다.

댓글 남기기