
27/07/2024
AI의 민주화: 혁신을 모두의 손에 쥐다
필진: 김진형 카이스트 명예교수
컴퓨터의 출현과 인공지능(AI) 연구가 시작된 지 어언 70년이 지났다. AI 기술은 그동안 많은 변화를 겪으며 혁신적인 성과를 창출했다. AI는 컴퓨터로 하여금 지능적인 업무를 수행하게 하는 기술이다. 물론 컴퓨터가 발명된 이후에 본격적으로 연구가 시작되었다. 초기에는 AI의 구축이 쉽다고 생각했으나, 많은 시행착오를 거쳤다. 사람의 인지 작용을 흉내 내는 기술에서부터 최적화를 이루는 기술을 거쳐, 이제는 자동화 기술의 핵심으로 자리 잡고 있다.
AI는 과학적 연구에서 많은 성과를 이뤘고, 산업적 성과에서도 눈부신 결과를 보여주고 있다. 하루가 다르게 멋진 AI 서비스가 출현하며, 그에 따라 백만장자가 되는 스타트업 창업자들이 속속 나타난다. 이제 우리의 일상생활에서 AI의 영향을 받지 않는 것은 없다고 해도 과언이 아니다. 심지어 범용 AI(AGI)의 등장이 가까워졌다는 주장도 자주 들린다. AGI는 특정 업무만 수행하는 좁은 AI가 아닌, 다양한 업무를 인간 수준이나 그 이상으로 수행하는 AI로, 이 분야 연구의 궁극적 목표다. AGI 연구개발을 민간 투자를 받아 수행하는 실리콘밸리의 생태계가 부럽기만 하다.
물론 기대와 함께 우려도 커지고 있다. AI는 단순한 기술이 아니기 때문이다. 이 강력한 기술이 악용되는 것이 우려된다. 일부 독재정권에서는 AI 시스템으로 국민을 억압하고 통제하려 한다. 또한 기술이 너무 복잡해서 잘 사용하려는 의도가 있어도 관리 능력이 부족하여 인류에게 해를 끼칠 가능성도 있다. 국가나 기업 간의 기술 경쟁이 심화되어, 완성되지도 않았고 검증되지 않은 기술을 현장에 배치할 가능성도 농후하다. 그리고 컴퓨터 바이러스처럼 처음부터 나쁜 의도로 AI를 만드는 사람도 있을 수 있다.
기술의 발전이 빠르고, 세상의 변화가 강력하여 대부분의 평범한 사람들이 소외되는 것은 아닌가? 심지어 AI가 인류가 수천 년 동안 이루어 놓은 문명을 일시에 무너뜨리고, 인류의 생존을 위협하는 것은 아닌가 하는 걱정도 든다. 새로운 AI 기술이 나올 때마다 너무나 강력한 기술이기 때문에 규제가 필요하다는 여론이 호응을 얻고 있다. 바티칸의 교황청에서도 경고를 발했고, 유럽연합에서는 규제를 위한 법을 통과시켰다.
이렇게 강력하고 동시에 무서운 AI의 발전 원동력은 무엇일까? 어떤 연구 철학이 지난 70년간 AI의 발전을 이끌어왔을까? 돌이켜보면 가장 중요한 원동력은 '생각하는 컴퓨터를 만들어보자'라는 환상적인 목표와 구호였다. 이에 더해, 지식을 널리 공유하려는 기술의 민주화 의식이 중요한 원동력이었다고 생각한다. 원래 지식인들은 자신이 아는 것을 공유하고 싶어 한다. 그래서 학회에 모이고, 연구 논문으로 자기의 발견과 연구 결과를 동료들과 공유하고 토론한다. 이러한 지식 커뮤니티의 문화가 인류의 과학기술 문명 발전을 촉진하는 촉매 역할을 했다. 종교 개혁과 산업 혁명 시기 서구의 과학기술 연구자들이 이루어 놓은 지식의 공개, 공유 생태계는 감동적이다.
공개 소프트웨어 운동은 소프트웨어를 공개하고 공유하여 누구나 사용하게 하고, 이를 더욱 개선하는데 어떠한 제약도 주지 말자는 운동이다. 따라서 공개 소프트웨어 운동은 논문을 통해 지식을 공개하는 것 이상이다. 소프트웨어의 아이디어뿐만 아니라 소스 코드를 완전히 공개하여 누구나 내가 만든 것을 즉시 사용해 보고, 완전 복제할 수 있도록 허용한다. 많은 노력으로 개발되어 경제적 가치가 큰 소스 코드와 수집에 많은 노력이 필요한 훈련 데이터 등 모든 것을 공유하자는 운동이다. 민주화를 넘어서 사회주의 냄새까지 난다.
지금의 디지털 문명은 공개 소프트웨어에 힘입은 바가 크다. 인터넷을 구축하고 운영하는 모든 소프트웨어가 공개되었고, 스마트폰과 PC도 공개된 운영체제 소프트웨어로 구동된다. 인터넷 상의 정보 공유 체제인 웹도 표준화되고, 소스코드는 공개되어 있다. 누구나 이를 설치하여 정보를 얻고, 전자 상거래에 참여할 수 있다. 따져보면 인터넷 경제는 공개 소프트웨어의 덕분이다.
70년 전 컴퓨터 소프트웨어 기술이 일천했고 AI가 겨우 발걸음을 뗄 때였지만, 이러한 공개소프트웨어의 철학은 이 분야 연구에서 강력하게 대두되었다. 그 이유는 AI가 무서운 기술이 될 수 있다는 두려움에서 시작되었다고 본다. 비록 시작은 미미했지만 그 목표는 창대했기 때문에 AI 기술의 수준을 모르는 보통 사람들에게는 AI 연구 자체가 공포를 불러일으킬 수 있었다. 그래서 AI라는 이름으로 수행되는 모든 연구에서는 소프트웨어까지 '완전' 공개하자는 철학이 자리 잡았다. AI를 연구하는 연구원들은 아무리 설익은 아이디어라도 '공개'하는 것이 관례가 되었다. 공개소프트웨어 운동에 앞장섰던 리차드 스톨만이 MIT AI 연구실의 연구원이었던 사실은 이러한 초기 AI 연구계의 모습을 잘 보여준다.
개인적으로도 미국에서 공부할 때 공개 소프트웨어 덕분에 많은 혜택을 받았다. 소스 코드를 읽고 기술을 배우며, 이를 수정하여 나의 아이디어를 실험했다. 이러한 관행은 연구의 속도를 촉진하고 깊이를 더할 수 있었다. 학위를 마치고 귀국한 후에도 오픈 소스의 혜택을 많이 보았다. 특히 인터넷의 활성화는 오픈 소스의 가치를 더욱 크게 했다. 빛의 속도로 과학기술 아이디어가 교류될 수 있다는 것은 큰 축복이다.
AI 개발의 본류가 기계 학습으로 전환되면서부터는 학습 알고리즘보다는 학습용 데이터가 더욱 중요하게 되었다. 학습용 데이터를 연구자들이 십시일반 모아 공유하자는 운동이 AI 발전에 큰 동력을 제공하였다. 학습이 완료된 신경망, 즉 AI 모델을 공개하고 공유하는 것은 기계 학습 커뮤니티의 관행이 되었다. 이때부터는 공개 소프트웨어라는 말보다는 훈련이 끝난 AI 모델을 공유하는 AI의 민주화라는 말이 더욱 많이 쓰이게 되었다.
AI의 민주화를 촉진하는 여러 가지 아이디어도 많이 개발되었다. 그 중 연합학습이라는 데이터 공유 플랫폼 아이디어는 멋지다. 데이터가 커다란 경제적 가치를 제공함에 따라, 또 데이터 프라이버시가 중요함에 따라 데이터 소유권에 관심들이 높다. 특히 개인의 건강 정보는 예민하다. 남의 데이터는 사용하고 싶지만 내 데이터는 주고 싶지 않다. 그런 경우 내 데이터를 공개하지 않으면서도 내 데이터를 남들과 공유할 수 있다면 AI 발전에 큰 공헌을 하면서도 나의 재산권은 지킬 수 있다. 학습 알고리즘이 데이터 소유주의 사이트를 방문하여 학습만 하고 나오도록 한다. 즉, 데이터를 복제하는 것이 아니라 학습만 하고 나오는 것을 외부에 허용하는 아이디어다.
AI의 민주화가 사회와 경제에 미치는 영향은 매우 지대하다. 기술의 공개와 개방은 AI에 대한 두려움을 줄여주고 젊은이들에게 도전하고자 하는 의욕을 북돋아 준다. AI의 민주화는 기술 발전의 속도를 가속화하고, 다양한 분야에서 혁신을 촉진한다. 또 그 기술을 특정 전문가나 대기업에 국한되지 않고, 일반 대중과 중소기업을 포함한 다양한 사용자들이 접근할 수 있게 한다. 지구 오지에 사는 젊은이도 공개된 AI 기술을 이용하여 새로운 서비스를 만들고, 이를 이용해 창업할 수 있다. 범지구적인 인터넷 환경은 이런 창업기업을 글로벌 기업으로 성장하게 한다.
AI의 민주화를 통해 이러한 변화는 우리 모두에게 혜택을 줄 것이다. 이것은 단지 기술의 문제를 넘어서, 사회적 정의와 평등의 문제이기도 하다. 우리의 미래를 더욱 공평하고 혁신적인 사회로 만들어 갈 것이다. AI의 민주화, 다 같이 노력해야 한다.
By Jin Hyung Kim, Emeritus Professor at KAISTIt has been nearly 70 years since the advent of computers and the beginning of artificial intelligence (AI) research. AI technology has undergone signif...