DeepSeek 이후, 한국 오픈소스 AI 생태계는 무엇을 갖춰야 할까

harheem

05 Feb 2026 • 16 min read

모델 공개를 넘어, 작동하는 생태계로

2025년 이후 글로벌 오픈소스 AI 생태계에서 가장 큰 변화는 모델 성능 향상만으로 설명하기 어렵습니다. 더 중요한 변화는 오픈소스가 AI 시스템 설계의 기본 전제로 자리 잡기 시작했다는 점입니다.

DeepSeek R1 이후 중국 사례에서 확인할 수 있듯이, 모델은 더 이상 완결된 결과물로만 다뤄지지 않습니다. 이제 모델은 재사용하고, 조합하고, 배포할 수 있는 엔지니어링 구성 요소에 가깝게 인식되고 있습니다. Hugging Face의 「The Future of the Global Open-Source AI Ecosystem: From DeepSeek to AI+」도 이 흐름을 비슷한 관점에서 설명합니다.

이 글에서 가져올 수 있는 핵심 인사이트는 네 가지입니다.

오픈소스는 선택 가능한 옵션을 넘어, 시스템 설계의 기본 전제가 되고 있습니다.
DeepSeek 모멘트의 본질은 단일 모델의 성능 돌파보다 생태계 전환에 가깝습니다.
경쟁의 단위는 모델 하나에서 모델, 데이터, 평가, 배포, 하드웨어를 포함한 전체 체인으로 이동하고 있습니다.
중국의 AI 전략은 AGI 경쟁만을 향하기보다, 산업 전반에 AI를 적용하는 AI+ 전략과 연결되어 있습니다.

요약하면, DeepSeek 이후의 AI 경쟁은 “가장 강한 모델을 누가 만들었는가”만으로 설명하기 어려워졌습니다. 오픈소스를 기반으로 실제로 작동하는 AI 시스템 전체를 누가 구축하고 운영할 수 있는지가 더 중요한 질문이 되고 있습니다.

이 전환은 일회성 사건으로 끝나지 않았습니다. 모델, 도구, 데이터, 배포 인프라가 서로 연결되면서 생태계가 스스로 움직이기 시작한 상태 변화에 가깝습니다.

한국 역시 비슷한 방향의 전환을 시도하고 있습니다. 그 중심에 있는 정책적 실험이 독자 AI 파운데이션 모델 개발 프로젝트, 즉 독파모라고 볼 수 있습니다. 독파모는 글로벌 수준의 파운데이션 모델을 국내에서 확보하고, 결과물을 오픈 웨이트(open-weight) 형태로 공개해 생태계 전반의 재사용을 촉진하려는 시도입니다.

이 프로젝트는 소버린 AI와 오픈소스 확산이라는 두 목표를 동시에 다루고 있습니다. 다만 이 두 목표가 항상 자연스럽게 맞물리는 것은 아닙니다. 독자성을 확보하려는 정책 목표와 오픈소스 생태계의 핵심 작동 원리인 재사용·조합 사이에는 긴장이 생길 수 있습니다.

한국 오픈소스 AI 생태계의 현재

1. 모델 공개에서 재사용으로 이어지는 흐름

최근 1~2년 사이 한국의 주요 AI 기업들은 오픈소스 전략을 더 명확하게 드러내기 시작했습니다. NAVER는 HyperCLOVA X SEED 계열을 통해 비교적 작은 규모의 모델을 공개했고, 공개 이후 다운로드와 파생 모델 생성을 유도했습니다.

이 흐름은 오픈소스 모델의 성공 지표가 달라지고 있음을 보여줍니다. 과거에는 최초 공개 시점의 성능, 리더보드 순위, 특정 벤치마크 점수가 주목받았습니다. 이제는 공개된 모델이 얼마나 자주 재사용되는지, 얼마나 많은 파생 모델과 실험을 만들어 내는지가 더 중요해지고 있습니다.

LG AI Research, SK Telecom, Upstage 등도 각기 다른 방식으로 모델과 아티팩트를 공개하고 있습니다. 이 과정에서 한국어 중심의 오픈소스 자산이 점진적으로 축적되고 있습니다. 개별 기업의 성과를 넘어, 국내 언어와 도메인에 특화된 모델 풀이 형성되고 있다는 점에서 의미가 있습니다.

다만 모델 공개만으로 생태계가 만들어지지는 않습니다. 공개된 모델이 실제로 재사용되려면 문서, 예제 코드, 라이선스, 평가 기준, 배포 환경이 함께 준비되어야 합니다. 결국 오픈소스 생태계의 경쟁력은 모델 파일 자체보다 모델을 둘러싼 사용 경험에서 결정될 가능성이 큽니다.2. 독파모를 통한 경쟁 구조와 컴퓨팅 자원 집중

물론 이러한 민간 주도의 움직임만으로 대규모 파운데이션 모델을 지속적으로 개발하기에는 한계가 존재합니다. 이 지점에서 독파모는 중요한 촉매 역할을 수행합니다. 독파모는 평가 경쟁을 통해 소수의 정예 팀을 선정하고, 대규모 GPU 자원과 데이터 접근 권한을 집중 지원함으로써, 국내에서도 from‑scratch 학습이 가능한 환경을 실험하고 있습니다.

이 과정에서 정부는 성능, 활용 가능성, 파급 효과를 종합적으로 평가 기준에 포함시켜, 단순한 벤치마크 경쟁을 넘어 실제 배포 가능성을 강조하고 있습니다. 이는 중국의 “AI+” 전략과 유사하게, 모델을 산업과 공공 영역에 연결하려는 시도로 해석할 수 있습니다.

2. 독파모를 통한 컴퓨팅 자원 집중

민간 기업의 자발적 공개만으로 대규모 파운데이션 모델을 지속적으로 개발하기에는 한계가 있습니다. 특히 from-scratch training, 즉 처음부터 대규모 모델을 학습하는 과정에는 막대한 GPU 자원, 데이터 접근성, 장기적인 연구 인력이 필요합니다.

이 지점에서 독파모는 중요한 촉매 역할을 합니다. 독파모는 평가 경쟁을 통해 일부 팀을 선정하고, 대규모 GPU 자원과 데이터 접근 기회를 집중적으로 지원합니다. 이를 통해 국내에서도 대규모 모델 학습이 가능한 환경을 실험하고 있습니다.

중요한 점은 독파모가 단순한 벤치마크 경쟁에 머물러서는 안 된다는 것입니다. 모델 성능은 중요하지만, 실제 활용 가능성, 배포 가능성, 생태계 파급 효과도 함께 봐야 합니다. 중국의 AI+ 전략이 모델을 산업과 공공 영역의 실제 워크플로에 연결하는 방향으로 움직이고 있다는 점을 고려하면, 한국 역시 모델 개발 이후의 연결 구조를 더 적극적으로 설계해야 합니다.

독파모의 성과는 “좋은 모델을 만들었는가”만으로 평가하기 어렵습니다. 공개된 모델이 연구자, 스타트업, 공공기관, 기업 개발자에게 실제로 재사용되는지까지 봐야 합니다.

3. 한국어 평가 벤치마크의 확장

한국 오픈소스 AI 생태계의 강점 중 하나는 한국어 특화 평가 체계가 점차 자리를 잡고 있다는 점입니다. KoBEST, KMMLU, Open Ko-LLM Leaderboard와 같은 벤치마크와 리더보드는 영어 중심 평가를 단순히 번역하는 데 그치지 않고, 한국어 추론, 지식, 문화적 맥락을 측정하려는 시도를 보여줍니다.

이러한 평가 체계는 장기적으로 중요합니다. 모델을 개선하려면 무엇을 잘하고 무엇을 못하는지 볼 수 있어야 합니다. 특히 공공, 금융, 의료, 제조, 법률처럼 로컬 맥락이 중요한 분야에서는 일반적인 영어 벤치마크만으로 품질을 판단하기 어렵습니다.

한국어 평가 인프라는 한국어 모델의 지속적인 개선을 가능하게 하는 기준선이 될 수 있습니다. 다만 평가 자체도 생태계의 일부로 운영되어야 합니다. 벤치마크가 고정된 점수판에 머무르면 모델이 특정 문제 유형에 과적합될 수 있습니다. 평가 데이터의 품질, 공개 방식, 업데이트 주기, 도메인 다양성까지 함께 관리해야 합니다.

아직 남아 있는 구조적 한계

1. 독자성 기준과 오픈소스 재사용 간의 충돌

독파모에서 가장 논쟁적인 지점은 독자성 판단 기준입니다. 정부는 오픈소스 활용 자체를 인정하면서도, 최소한 가중치 초기화 이후의 학습 과정은 국내에서 수행되어야 한다는 기준을 제시하고 있습니다.

기술 주권 관점에서는 이해할 수 있는 기준입니다. 국내에서 핵심 학습 역량을 확보하고, 외부 모델 의존도를 낮추려는 목적이 있기 때문입니다. 하지만 오픈소스 생태계의 작동 방식과는 충돌할 수 있습니다.

오픈소스 AI 생태계의 핵심은 재사용과 조합입니다. 이미 공개된 모델, 데이터셋, 학습 레시피, 평가 도구, 배포 프레임워크를 활용해 더 빠르게 실험하고 개선하는 방식으로 발전합니다. 독자성 기준이 지나치게 좁게 해석되면, 오픈소스가 가진 가장 큰 장점인 누적과 확장의 효과가 약해질 수 있습니다.

따라서 필요한 것은 오픈소스 활용을 막는 기준이 아니라, 어떤 수준의 재사용이 허용되고 어떤 부분부터 독자적 기여로 인정할 수 있는지에 대한 명확한 기준입니다. 이 기준이 분명해야 기업과 연구기관이 장기적인 전략을 세울 수 있습니다.

2. 대기업 중심 구조의 한계

현재 한국의 오픈소스 AI 활동은 대기업과 일부 스타트업에 상대적으로 집중되어 있습니다. 이 구조는 초기 속도 측면에서는 장점이 있습니다. 자본, 인력, 인프라를 갖춘 조직이 빠르게 모델을 공개하고 실험을 주도할 수 있기 때문입니다.

하지만 생태계가 지속 가능하려면 참여자의 폭이 더 넓어져야 합니다. 연구기관, 대학 연구실, 중소 개발팀, 개인 연구자, 독립 개발자가 모델을 실험하고, 개선하고, 배포할 수 있어야 합니다. 오픈소스 생태계의 힘은 소수 조직의 공개보다 다양한 참여자의 반복적 재사용에서 나옵니다.

이를 위해서는 세 가지가 필요합니다.

접근 가능한 컴퓨팅 자원
재사용하기 쉬운 모델과 데이터 문서
실험 결과를 공유하고 평가받을 수 있는 공개 인프라

중국 사례에서 확인할 수 있듯이, 장기적인 확장성은 단일 프로젝트의 성과보다 도구 체인, 데이터, 평가, 배포 인프라가 유기적으로 연결되는 구조에서 나옵니다. 한국은 아직 이 체인의 일부 링크를 강화하는 단계에 있습니다.

모델 공개에서 끝나는 것이 아니라, 다음과 같은 체인이 이어져야 합니다.

모델 → 파생 모델 → 평가 → 배포 → 하드웨어 → 거버넌스

이 체인이 연결되어야 한국 오픈소스 AI 생태계가 단기 이벤트를 넘어 지속 가능한 구조로 발전할 수 있습니다.

3. 글로벌 파급력의 제한

한국 오픈소스 모델은 주로 한국어와 국내 활용에 초점을 맞추고 있습니다. 이는 분명한 장점입니다. 글로벌 모델이 놓치기 쉬운 한국어 표현, 문화적 맥락, 로컬 도메인 지식을 다룰 수 있기 때문입니다.

하지만 동시에 한계도 있습니다. 글로벌 개발자 커뮤니티에서 재사용되려면 한국어 성능만으로는 부족할 수 있습니다. 문서, 라이선스, 예제, 다국어 확장성, 글로벌 플랫폼에서의 접근성이 함께 필요합니다.

로컬 최적화와 글로벌 확장성은 서로 충돌하는 목표가 아닙니다. 한국어에 강한 모델이면서도, 국제 개발자들이 이해하고 재사용할 수 있는 형태로 공개될 수 있습니다. 이를 위해서는 모델 카드, 학습 데이터 설명, 평가 결과, 사용 예제, 제한 사항을 영어와 한국어로 함께 제공하는 방식도 고려할 수 있습니다.

한국어 중심 자산을 유지하면서 글로벌 오픈소스 생태계와 연결되는 전략이 필요합니다. 그래야 한국 모델이 국내 활용을 넘어 글로벌 담론 안에서도 의미 있는 위치를 확보할 수 있습니다.

결론

한국 오픈소스 AI 생태계는 초기 체인을 만들기 시작했습니다. 모델 공개, 평가, 배포, 정책 지원으로 이어지는 구조가 형성되고 있습니다. 독파모는 이 흐름에서 컴퓨팅 병목을 단기적으로 완화하고, 국내 모델 개발 역량을 가시화하는 역할을 하고 있습니다.

하지만 앞으로의 과제는 더 분명합니다.

첫째, 독자성과 오픈소스 재사용의 경계를 더 명확하게 정의해야 합니다. 정책 기준이 예측 가능해야 기업과 연구기관이 장기적인 연구 개발 전략을 세울 수 있습니다.

둘째, 대기업 중심 구조를 넘어 더 넓은 참여 모델을 설계해야 합니다. 대학, 연구기관, 중소 개발팀, 개인 연구자가 참여할 수 있어야 생태계가 두꺼워집니다.

셋째, 한국어 중심 자산을 유지하면서도 글로벌 오픈소스 생태계와의 연결성을 강화해야 합니다. 한국어 모델이 국내 문제 해결에 머무르지 않고, 글로벌 개발자에게도 재사용 가능한 자산이 되어야 합니다.

DeepSeek 이후의 글로벌 흐름은 최고 성능 모델 하나만으로 경쟁력이 만들어지지 않는다는 점을 보여줍니다. 실제로 작동하는 오픈소스 시스템, 그리고 그 시스템을 지속적으로 개선하는 생태계가 더 중요해지고 있습니다.

한국도 이제 모델 개발 능력만이 아니라 생태계 운영 능력을 시험받는 단계에 들어섰습니다. 독파모는 그 출발점이 될 수 있습니다. 이 실험이 단기 성과에 그칠지, 지속 가능한 오픈소스 AI 체인으로 발전할지는 앞으로의 정책 정합성과 생태계 설계에 달려 있습니다.