본문 바로가기
플러스AI

딥시크(DeepSeek) 모델 종류와 성능 특징 | V3 R1 R1-Distill

by 플러스AI 2025. 1. 29.

2023년에 설립된 중국의 AI 스타트업, 딥시크(DeepSeek)가 AI 기술 분야에서 빠르게 주목받고 있습니다. 딥시크의 모델 종류와 성능 특징 알아봅니다. 딥시크-V3, R1, R1-Distill 시리즈가 각각 어떻게 다른지 살펴봅니다.

 

 

※ 본문 중에 나오는 기술적 용어에 대해서는 단락 하단에 따로 간단한 설명을 부기하니 참고하세요

주요 모델과 성능

 

딥시크 썸네일

 

1. DeepSeek-V3

- 6,710억 개의 매개변수를 가진 대규모 언어 모델입니다. 이는 메타의 라마 3.1(405B)보다 약 1.5배 큰 규모입니다.

- 128,000개의 토큰을 처리할 수 있는 뛰어난 컨텍스트 이해 능력을 갖추고 있습니다.

- Math-500 테스트에서 90.2점을 기록하며 경쟁 모델들을 압도했습니다.

 

2. DeepSeek-R1

- 추론에 특화된 모델로, OpenAI의 o1 모델과 비슷하거나 일부 벤치마크에서 더 뛰어난 성능을 보입니다.

- AIME 2024 수학 벤치마크에서 79.8%의 성공률을 달성했습니다.

- Codeforces에서 2,029 Elo 등급을 받아 96.3%의 인간 경쟁자를 능가했습니다.

 

3. DeepSeek-R1-Distill 시리즈

- 1.5B부터 70B까지 다양한 크기의 경량화 모델을 제공합니다.

- DeepSeek-R1-Distill-Qwen-32B 모델은 OpenAI-o1-mini를 능가하는 성능을 보입니다.

 

✅ 용어설명

DeepSeek-V3 (딥시크-브이3): 중국 AI 기업 딥시크가 개발한 6,710억 개의 매개변수를 가진 대규모 언어 모델

Math-500 테스트 (수학-500 테스트): 수학 능력을 평가하는 벤치마크 테스트로, 500개의 고난도 수학 문제로 구성

DeepSeek-R1 (딥시크-알1): 딥시크가 개발한 추론에 특화된 AI 모델로, 복잡한 문제 해결 능력이 뛰어남

AIME 2024 수학 벤치마크 (미국 수학 초청 시험 2024 벤치마크): 미국 수학 올림피아드 예선 시험을 기반으로 한 AI 모델의 수학 능
력 평가 지표

OpenAI의 o1 모델 (오픈AI의 오원 모델): OpenAI가 개발한 고급 추론 능력을 가진 AI 모델

Codeforces에서 2,029 Elo 등급 (코드포스에서 2,029 엘로 등급): 프로그래밍 대회 플랫폼인 Codeforces에서의 높은 실력 등급을 나타냄

DeepSeek-R1-Distill 시리즈 (딥시크-알1-디스틸 시리즈): DeepSeek-R1의 지식을 더 작은 모델로 전달한 경량화 모델 시리즈

DeepSeek-R1-Distill-Qwen-32B 모델 (딥시크-알1-디스틸-큐웬-32비 모델): DeepSeek-R1의 지식을 Qwen 아키텍처 기반 32B 크기 모델로 전달한 버전

OpenAI-o1-mini (오픈AI-오원-미니): OpenAI의 o1 모델의 경량화 버전

 

딥시크의 LLM 특징

 

- 오픈소스로 공개되어 있어 누구나 사용하고 수정할 수 있습니다.

- 코딩, 번역, 에세이 작성, 수학 문제 해결 등 다양한 작업을 수행할 수 있습니다.

- 비용 효율적인 훈련 방식을 사용하여 상대적으로 적은 비용으로 개발되었습니다.

- MoE(Mixture of Experts) 아키텍처를 사용하여 효율성을 높였습니다.

 

딥시크의 LLM은 일부 벤치마크 테스트에서 OpenAI의 GPT 모델들과 비슷하거나 더 나은 성능을 보여주며, 중국 AI 기술의 발전을 보여주는 대표적인 사례로 주목받고 있습니다.

 

기술적 혁신


1. MoE(Mixture-of-Experts) 아키텍처

- 각 작업에 필요한 370억 개의 매개변수만 활성화시켜 컴퓨팅 자원을 효율적으로 사용합니다.

- 이를 통해 비슷한 규모의 모델보다 훨씬 낮은 비용으로 운영이 가능합니다.

 

2. 강화학습(RL) 기반 학습

- DeepSeek-R1-Zero는 지도학습 없이 순수 강화학습만으로 개발되었습니다.

- 이 과정에서 체인 오브 소트(Chain-of-thought) 탐색, 자기 검증, 반성(reflection) 등 다양한 추론 패턴을 자연스럽게 습득했습니다.

 

3. 하이브리드 학습 방식

- DeepSeek-R1은 강화학습과 지도학습(SFT)을 결합한 하이브리드 접근 방식을 사용했습니다.

- 이를 통해 모델의 일관성과 유용성이 크게 향상되었습니다.

 

✅ 용어설명

LLM (대규모 언어 모델): 대량의 텍스트 데이터로 학습된 거대한 인공신경망 모델을 의미

MoE(Mixture of Experts) 아키텍처 (전문가 혼합 아키텍처): 여러 '전문가' 네트워크를 조합하여 효율적으로 작업을 처리하는 AI 모델 구조

강화학습(RL) (Reinforcement Learning): AI가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 기계학습 방법

DeepSeek-R1-Zero (딥시크-알1-제로): 지도학습 없이 순수 강화학습만으로 개발된 DeepSeek의 AI 모델

체인 오브 소트(Chain-of-thought) 탐색 (사고의 연쇄 탐색): AI가 복잡한 문제를 단계별로 해결해 나가는 추론 방식

자기 검증 (Self-verification): AI가 자신의 답변을 스스로 검토하고 수정하는 능력

반성(reflection): AI가 과거의 실수를 분석하고 개선하는 능력

지도학습(SFT) (Supervised Fine-Tuning): 레이블이 지정된 데이터를 사용하여 AI 모델을 미세 조정하는 학습 방법

 

오픈소스 전략과 영향

 

1. 모든 모델의 오픈소스 공개

- 딥시크는 개발한 모델들을 MIT 라이선스 하에 오픈소스로 공개합니다.

- 이를 통해 개발자들이 자유롭게 모델을 수정하고 상용화할 수 있습니다.

 

2. AI 기술의 민주화

- 오픈소스 전략은 많은 사용자들이 자신의 필요에 맞게 모델을 조정할 수 있는 기회를 제공합니다.

- 이는 AI 기술의 접근성을 높이고 새로운 혁신을 촉진합니다.

 

3. 글로벌 AI 경쟁에서의 위치

- 딥시크의 성공은 중국이 글로벌 AI 환경에서 중요한 역할을 하고 있음을 보여줍니다.

- 오픈소스 커뮤니티의 중심이 중국으로 이동하고 있다는 평가도 있습니다.

 

 

 

 

함께 보면 좋은 글

 

딥시크(DeepSeek)와 주요 플랫폼 비교 | OpenAI O1, Google AI Gemini, Microsoft Azure AI

 

딥시크(DeepSeek)와 주요 플랫폼 비교 | OpenAI O1, Google AI Gemini, Microsoft Azure AI

2023년에 설립된 중국의 AI 스타트업, 딥시크(DeepSeek)가 AI 기술 분야에서 빠르게 주목받고 있습니다. 본 글에서는 딥시크 세 번째 편으로 주요 AI 플랫폼인 OpenAI O1, Google AI Gemini, Microsoft Azure AI와 딥

plusai.tistory.com

퍼플렉시티(Perplexity) 프로, "딥시크(DeepSeek)를 품다"

 

퍼플렉시티(Perplexity) 프로, "딥시크(DeepSeek)를 품다"

검색할 것이 있어 퍼플펙시티(Perplexity)에 접속했다. 그런데, 뜨아! 질문 창 하단에 '딥시크 R1을 시도해 보세요'라는 문구가 뜨는 게 아닌가? 이거 뭐지? 딥시크(DeepSeek)? 딥시크가 퍼플에 들어왔어

gongyu.tistory.com

중국의 AI 혁신 기업 딥시크(DeepSeek)

 

중국의 AI 혁신 기업 딥시크(DeepSeek)

중국의 AI 스타트업 딥시크가 최근 공개한 대규모 언어 모델(LLM)이 전 세계 AI 업계의 이목을 집중시키고 있습니다. 특히 딥시크-V3와 R1은 성능과 효율성 면에서 기존 AI 업계를 위협하는 수준에

plusai.tistory.com

중국 AI 딥시크(DeepSeek), "사이버 공격으로 신규 등록 중단"

 

중국 AI 딥시크(DeepSeek), "사이버 공격으로 신규 등록 중단"

미국 AI 시장을 달군 중국 AI 기업 딥시크(DeepSeek)가 디도스(DDoS)로 추정되는 사이버 공격을 당했다는 소식입니다. 2025년 1월 27일 딥시크는 대규모 악의적 사이버 공격을 받았으며, 이로 인해 신규

gongyu.tistory.com

디도스(DDoS) 공격 | 뜻 역사 작동원리 사례 예방책

 

디도스(DDoS) 공격 | 뜻 역사 작동원리 사례 예방책

최근 중국 AI 기업 딥시크가 저비용 고효율성으로 AI업계를 위협하는 강자로 떠오름과 동시에 디도스 공격으로 추정되는 사이버 공격을 받았다는 소식이 전해졌습니다. 디도스(DDoS) 공격이 무엇

haroohana.tistory.com

강화학습과 지도학습 뜻과 특징 사례 응용분야

 

강화학습과 지도학습 뜻과 특징 사례 응용분야

인공지능 학습법에서 등장하는 강화학습과 지도학습, 둘은 어떻게 다를까요? 각각 어떤 뜻이며 어떤 특징을 갖고 있는지, 접근방식은 어떻게 다른지 살펴봅니다. 덧붙여 응용분야, 사례도 함께

plusai.tistory.com