플레이광주 > 웹진 『플광24』 > [김피디의 불펀한 생각 7화] ‘소버린 AI’ 시대, 광주는 무엇을 준비해야 하는가

웹진 『플광24』


[김피디의 불펀한 생각 7화] ‘소버린 AI’ 시대, 광주는 무엇을 준비해야 하는가

김태관| |댓글 0 | 조회수 135

1. 데이터센터가 능사는 아니다


최근 광주는 'AI 중심도시'를 자처하며 대규모 데이터센터 유치, AI반도체 산업단지 조성 등 인프라 구축에 박차를 가하고 있다. 정부의 '국가 AI 컴퓨팅 인프라 고도화 계획'(2024)이나 대통령실 하정우 AI수석이 제시한 ‘소버린 AI’ 전략이 지역으로 확산하는 맥락에서, 이러한 노력은 겉보기에 유의미해 보인다. 그러나 소버린 AI의 본질은 단순한 장비나 시설 유치가 아니다.


소버린 AI란, 외국 기술이나 플랫폼에 의존하지 않고 자국 또는 조직이 독립적으로 AI 시스템을 개발·운영·통제하는 디지털 자율권을 확보하는 것을 말한다(프랑스 국립정보사회위원회 CNIL, 2023). 이는 하드웨어를 소유하는 것을 넘어, 어떤 데이터를 어떤 가치 기준으로 학습시키고, 어떤 문화적 문맥을 이해하는 AI를 만들 것인지에 대한 ‘철학적 선택’이다. 다시 말해, 소버린 AI를 위한 국가적 자산이 GPU나 서버라면, 지역이 확보해야 할 자산은 ‘데이터의 의미망’이다.


단지 데이터센터가 있다는 이유로 AI 도시가 되는 것이 아니라, 지역의 언어, 문화, 정체성, 맥락이 AI에 ‘학습’되고 ‘내재화’될 수 있어야 비로소 소버린 AI 도시라 할 수 있다.


 


2. 진짜 AI 주권은 '누가 무엇을 가르치느냐'의 문제다


AI는 ‘패턴’을 학습하는 기술이다. 그런데 그 패턴은 데이터를 통해 구성되며, 그 데이터는 결국 인간의 경험, 언어, 문화, 역사로부터 온다. 지금까지의 글로벌 AI 모델은 영어권 데이터, 그것도 북미 문화 중심의 정보로 구성됐다. 이로 인해 ‘동해’를 ‘일본해’로 표기하거나, 한국사를 부정확하게 서술하는 사례들이 반복됐다(OpenAI ChatGPT 사례, 2023). 이런 편향은 단순한 기술 오류가 아닌, 주권과 정체성의 문제로 직결된다.


하정우 수석은 “AI는 특정 국가나 언어에 최적화되어야 한다”며, 네이버의 HyperCLOVA X를 ‘한국어-한국문화 특화형 LLM(Local LLM)’로 제시한 바 있다. 실제 HyperCLOVA X는 라마3(LLaMA3)와 동급 파라미터 규모 기준에서 한국어 성능에서 앞선 결과를 내고 있으며(네이버클라우드, 2024), 정부는 이를 기반으로 ‘AI 주권 확보형 기술’로 분류하고 있다(과기정통부, 2024).


여기서 주목할 점은, 기술적 우위보다 더 중요한 것은 ‘가르칠 데이터가 우리 것으로 채워졌는가’이다. 지역의 언어, 사투리, 역사, 기억, 사회적 감정이 담긴 데이터가 없으면, 지역은 그저 학습 대상이 아닌 ‘타자의 관점으로 소비되는 지역’이 될 수밖에 없다.


3. 광주는 이미 데이터 강국이다. 그러나 구조화된 적은 없다


광주는 한국 현대사의 중요한 교차점이자, 풍부한 로컬 아카이브를 지닌 도시다. 5·18 기록물(유네스코 세계기록유산), 시민사회 아카이브, 지역 언론 축적 데이터, 구술사, 공동체 미디어 콘텐츠, 예향의 문화유산까지, 잠재적 AI 학습 데이터는 차고 넘친다. 하지만 이 방대한 비정형 정보는 지금까지 디지털 자산화된 적이 거의 없다. 구조화되지 않은 데이터는 AI에겐 ‘보이지 않는 존재’일 뿐이다.


AI에 지역 맥락을 학습시키려면, 로컬 데이터를 정제하고, 메타데이터를 부여하고, API 연결 가능한 형태로 전환해야 한다. 광주는 로컬 데이터센터 유치보다, ‘로컬 프롬프트 엔지니어’, ‘문화 기반 LLM 튜너’, ‘지방 아카이브 큐레이터’ 같은 새로운 직업군을 육성해야 할지도 모른다. 지역의 고유성과 기억을 AI에 가르치는 일은 기술자의 일이 아니라, 기록자, 작가, 미디어 제작자, 지역 연구자들이 함께 해야 할 작업이다.


광주가 AI 중심도시를 넘어서 '소버린 AI 실험 도시'로 도약하기 위해서는, 바로 이 '로컬 데이터의 자산화'와 '문화적 문맥의 구조화'에서 출발해야 한다.


4. 로컬은 기술 소비자가 아니라 '맥락 생산자'가 되어야 한다


AI 시대, 지역의 역할은 단순한 기술 수혜자가 아니라, 디지털 시대의 맥락을 설계하는 ‘지식 주권자’가 되는 것이다. 한국 정부는 AI 산업을 위한 인프라 구축에 100조 원 투자를 선언했고, 소버린 AI 전략도 '선택과 집중'을 통한 대표 기업 육성을 천명했다. 하지만 이러한 전략은 지역의 자율성과 문화적 기여가 동반될 때 비로소 균형을 이룬다.


유럽연합은 ‘AI는 인간 중심이어야 한다’는 철학을 앞세우고, 각국 언어에 최적화된 LLM(OpenEuroLLM)을 개발 중이다. 일본은 정부가 AI 솔루션의 ‘1호 구매자’가 되어 스타트업을 육성하고 있으며, 캐나다는 오픈소스 AI 인프라에 공공투자를 확대하고 있다. 이 모든 전략은 기술뿐 아니라 ‘가치’와 ‘정체성’을 AI에 이식하는 과정이다.


광주는 어떤가. 데이터센터는 어디에 들어설지를 고민하지만, ‘그 데이터가 무엇이냐’는 질문은 묻지 않는다. 지금 필요한 것은 ‘광주다움’을 설명할 수 있는 지역 기반 프롬프트, 공공 기록의 디지털 전환, 지역어에 최적화된 음성인식/생성 모델, 지역민의 삶을 반영하는 윤리적 AI 정책 등이다.


‘AI 중심도시’라는 슬로건은 기술적 첨단을 상징하는 문장이 아니다. 그것은 ‘지역이 스스로 이야기하고, 그 이야기를 기계가 이해할 수 있도록 만드는 도시’일 때에만 진실이 된다. 소버린 AI 시대, 광주가 해야 할 일은 물리적 장비를 들여오는 것이 아니라, 지역의 기억과 언어를 디지털 주권의 자산으로 전환하는 일이다. 그것이 진짜 AI 중심도시로 가는 첫걸음이다.


 

0 댓글


카카오톡 채널 채팅문의