본문 바로가기

[AI랑 산다] #1 인공지능 역사로 알아보는 핵쉬운 용어사전

2020-06-22 전혜정 연구위원

제4차 산업혁명 시대, ‘더 나은 삶’을 위한 필수조건으로 우리 삶에 깊숙이 자리 잡은 인공지능은 수많은 발전단계를 거쳐 지금의 모습을 갖췄습니다.

인공지능이라고 하면 가까이 와닿지 않는다는 분이 많을 텐데요. ‘AI랑 산다’ 시리즈에서는 인공지능을 알고 싶지만 어려워서 다가가 힘들었던 인공지능을 좀 더 쉽게 알려드리고자 합니다.

인.알.못(인공지능 잘 알지 못하는 사람)도 쉽게 배워보는 인공지능의 발전단계와 관련 용어, 지금 함께 만나볼까요?

인공지능(Artificial Intelligence)이란?

인공지능은 ‘기계로 구현한 지능’을 의미합니다.

AI 그래픽 이미지

인공지능에 대한 정확한 정의에 대해서는 의견이 다양하지만, 인공지능은 1956년 미국 다트머스 대학(Dartmouth College)에서 열린 한 컴퓨터 과학 워크숍에서 최초로 등장했습니다. 이를 처음 사용한 존 매카시(John McCarthy)는 “인간의 학습 능력과 지능의 특징들을 정확하게 기술하면 이것을 모방할 수 있는 기계를 만들 수 있다”라고 인공지능을 정의했습니다.

영화 이미테이션게임 포스터

l 인공지능 아이디어를 고안한 앨런 튜링의 일대기를 그린 영화 ‘이미테이션 게임’, 출처 : 네이버 영화 https://bit.ly/2YIWizj

이렇게 시작된 인공지능은 초기에 퍼즐이나 게임을 푸는 것처럼 기본 원리만 정확하게 기술해 프로그램화할 수 있으면 수많은 문제를 풀 수 있을 것으로 여겨졌습니다. 영화 ‘이미테이션 게임’의 앨런 튜링(Alan Turing)이 독일의 암호 이니그마를 해결하는 방법을 찾은 것이 그 사례이죠. 그 외에도 하노이의 탑, 미로 탐색 등의 알고리즘들이 연구되었습니다.

1997년 IBM 딥블루 VS 개리 카스파로프 체스 게임하는 모습

l 1997년 IBM 딥블루 VS 개리 카스파로프 체스 게임, 출처 : https://bit.ly/37SWnol

이러한 방법을 꾸준히 진행해서 마침내 IBM의 딥블루라는 인공지능 기술이 1997년 인간 마스터와의 체스 게임에서 승리를 했지만, 대부분은 이러한 방법으로 풀 수 있는 문제가 한정된다는 초기 인공지능 기술의 한계가 드러나면서 인공지능에 대한 환상이 깨지고, 인공지능 개발에 1차 시련이 오게 됩니다.

Step 1. 전문가 시스템

1980년대에는 사람처럼 기본 원리를 프로그램화하는 것에 한계를 느끼며 사람의 지능을 프로그램화하는 방법을 시도하게 됩니다.

전문가 시스템은 ‘네이버 지식인’처럼 전문가가 알고 있는 지식을 규칙화해서 프로그램 코드로 구현함으로써, 전문가가 지닌 전문 지식과 경험, 노하우 등을 통해 전문가와 동일한 또는 그 이상의 문제 해결 능력을 갖출 수 있도록 만들어진 시스템이라고 정의할 수 있습니다.

전문가들의 의견이 서로 다를 수 있고, 한 사람의 의견도 상황에 따라 다를 수 있으므로 규칙에 확률 값을 반영하는 기술인데요. LG전자는 전문가 시스템을 활용해 퍼지, 카오스 등의 인공지능 기술을 개발했습니다.

카오스 이론 기반 금성 카오스 에어컨(1994년) 연표

l 카오스 이론 기반 금성 카오스 에어컨(1994년)

LG전자는 인공지능 개발 초기부터 이러한 인공지능 기술을 다양한 제품에 적용해 고객에게 편리성을 제공하고자 노력해 왔죠.

그러나 전문가들의 지식을 프로그램화하는 전문가 시스템 작업은 전문가, 프로그래머, 전문가의 지식을 이해하고 프로그래머에게 설명할 수 있는 코디네이터 등이 팀을 구성해서 장기간 작업을 해야 가능한 기술입니다. 이러한 한계로 인해서 전문가 시스템은 많이 활용되지 못하고 인공지능 기술은 두 번째 겨울을 맞이하게 됩니다.

Step 2. 머신러닝(Machine Learning)

‘머신러닝(Machine Learning)’은 2000년대에 들어서 시작된 인공지능을 구현하는 방법의 하나로 빅데이터를 스스로 분석하고, 그 내용을 바탕으로 결론을 도출하는 기술입니다.

4차 산업혁명 그래픽 이미지

인공지능 기술과 상관없이 컴퓨터 시스템이 꾸준히 발전하면서 시스템을 개발하거나 운영하는 과정에서 수많은 데이터들이 생성됐습니다. 인공지능 개발자들은 이 속에서 전문가와 같은 고급 지식이 아니더라도, 데이터로부터 사람 수준의 간단한 지능을 구현할 방법을 고민하게 되었고, 데이터에 사람이 생각하는 정답을 매겨서 계산하고, 사람의 생각과 차이가 나는 오류를 줄여가는 방법으로 수정하고, 이러한 과정을 반복함으로써 사람의 생각과 유사하게 만들 수 있을 것이라는 방법을 생각했습니다.

이러한 과정을 ‘학습’이라고 부르고, 학습 결과로 얻어진 지능을 실제 응용에 적용하는 이 기술을 바로 ‘머신러닝’이라고 부릅니다.

<머신러닝의 2단계 방법>

일반적으로 머신러닝의 방법은 2가지로 나눠집니다.
1 단계 – 사람이 정답을 판단하기 위해서 봤던 트레이닝 데이터의 특징들을 추출
2 단계 – 다양한 특징들을 기반으로 판단

머신러닝 2단계 방법 설명 도표

예를 들어서 고양이를 판단하는 경우에 1단계에서 얼굴 모양, 다리의 개수, 눈의 개수, 눈·코·입의 구조, 귀의 모양 등의 특징을 추출하고 나서, 2단계에서 얼굴의 둥근 모양, 다리가 4개, 눈이 2개 눈·코·입이 삼각형 모양, 귀는 삼각형 모양 등의 특징을 기준으로 ‘고양이’라고 판단하는 것입니다.

음성으로 노래 부르면 자동으로 악보로 변환해주는 CYON 아카펠라뮤직폰(2006년)

l 음성으로 노래 부르면 자동으로 악보로 변환해주는 CYON 아카펠라뮤직폰(2006년)

과거부터 현재까지 다양한 제품에서 활용되고 있는 음성 인식, 영상 인식 등이 머신러닝으로 작용합니다. LG전자도 머신러닝 기술을 바탕으로 음성 인식 휴대폰, 스마트폰 제스처 샷 등을 개발해 제품에 적용했습니다.

Step 3. 딥러닝(Deep Learning)

2010년 이후부터 급성장을 하는 ‘딥러닝(Deep Learning)’은 컴퓨터 지능을 한 차원 더 높인 개념으로 머신러닝의 한 방법입니다.

딥러닝의 기본 원리는 1980년대에 이미 나왔습니다. 딥러닝의 기본은 머신러닝의 많은 방법 중 인간의 뇌세포 구조와 유사한 방법인 뉴럴 네트워크 구조(ANN, Artificial Neural Network)를 이용하는 방법입니다.

알파고에서 사용된 뉴럴 네트워크 구조

l 알파고에서 사용된 뉴럴 네트워크 구조, 출처 : deepmind 웹페이지 https://bit.ly/37C3IIt

감각 기관으로부터 받아들여진 정보들이 서로 연결된 세포들을 통해서 최종 판단을 내리는 것처럼, 센서들로부터 받아진 정보들을 세포처럼 서로 연결된 네트워크 구조를 통해서 학습하고 판단하는 것입니다.

그러나 이러한 학습을 위해서는 무수히 많은 양의 데이터가 필요하고, 그 데이터를 처리할 수 있는 많은 계산이 필요하기 때문에 당시에는 적용이 어려웠습니다. 그런데 2010년대에 들어와 게임 산업이 발전하게 되면서 원활한 게임을 위한 단순 계산을 빠르게 할 수 있는 하드웨어인 GPU가 출시되며 인공지능 분야에서도 이 를 이용해 복잡한 계산을 할 수 있게 되었습니다. 이와 더불어 기술 관점에서도 성능을 높일 수 있는 새로운 계산 방법들이 연구되어 한층 더 빠르게 발전했습니다.

<머신러닝의 3가지 학습 방법>인지과학 분야에서 사람의 학습을 몇 가지 방법으로 구분하고 있습니다. 머신러닝에서도 이러한 방법론을 적용하여 크게 3가지 학습 방법으로 구분해서 이야기하고 있습니다.
머신러닝의 3가지 학습 방법


① 지도 학습 (Supervised Learning)
: 정답을 알고 있는 엄마가 아이에게 말을 가르치는 것처럼, 정답을 기반으로 오류를 줄여서 학습하는 방법.
아이가 2만 번을 반복하고 엄마가 정답을 알려주면서 언어가 학습된다는 말이 있는 것처럼, 반복 학습을 통해서 오류를 줄여가면서 점점 더 정답에 가까워지게 됩니다.

② 비지도 학습 (Unsupervised Learning)
: 정답을 모르더라도 유사한 것들과 서로 다른 것들을 구분해서 군집을 만들 수 있는 학습하는 방법.
사람이 성장하게 되면 정답을 모르더라도 서로 유사한 데이터들끼리 모아서 군집을 만드는 지능이 생기게 됩니다. 아이가 자라면서, 처음 보는 장난감도 엄마의 화장품이나 맛있는 음식과 다르다는 것을 구분할 수 있게 되고, 많은 사람이 말하더라도 엄마의 목소리를 구분해 낼 수 있는 것과 같은 방법입니다.
최근에는 지도 학습과 비지도 학습을 섞어서 데이터에 정답을 유추해 나가는 방법의 기술들도 많이 나오고 있으며, 이를 반지도 학습(Semi-Supervised Learning)이라고 합니다. 군집을 학습한 후에, 군집의 일부 데이터만 사람이 정답을 매겨주면, 그 군집 전체를 사람이 매긴 정답으로 볼 수 있다는 원리입니다.

③ 강화 학습 (Reinforcement Learning)
: 보상과 벌칙과 함께 여러 번의 시행착오를 거쳐 스스로 학습하는 방법.
아무리 엄마가 있더라도 정답을 알려주기가 어려운 것들이 있습니다. 아이가 스스로 일어서는 방법, 스스로 걷는 방법 등이 그 예가 될 것입니다. 스스로 넘어져 가면서 여러 번의 시행착오 끝에 자기에게 맞는 방법을 습득하게 되는 것입니다. 이러한 시행착오에는 2가지 방법이 있습니다. 이제까지 알아낸 방법 중에 가장 적합한 방법을 시도하는 것과 새로운 방법을 시도해 보는 방법입니다. 일어서는 방법, 걷는 방법도 이제까지 해본 방법 중에 가장 맞는 방법을 시도해보고, 새로운 방법도 시도해 해서 점점 더 자신에게 맞는 방법을 찾아가는 것입니다.
기존의 지도학습, 비지도 학습과 달리 보상과 벌칙이 반영된 다음 데이터가 필요하기 때문에 반복 시행을 통해서 데이터를 스스로 만들어가면서 학습해야 합니다. 따라서 일반적으로 많은 학습 시간이 필요해 컴퓨터 시뮬레이션 기반으로 빠르게 반복함으로써 이러한 학습시간의 한계점을 극복해 가고 있습니다.

알파고 바둑두는 모습 그래픽 이미지

우리나라의 바둑기사 이세돌을 이긴 딥마인드의 알파고가 강화학습을 적용한 대표적인 사례입니다. 시뮬레이션으로 서로 바둑을 두고, 이긴 쪽의 학습 결과를 복사해서 다시 바둑을 두는 과정을 반복함으로써 인간보다 훨씬 더 많은 경험을 통해서 실력을 높여나가는 방법입니다.

이러한 인공지능 기술들의 관계를 도식화하면 다음과 같습니다.

인공지능 기술 관계 도식

오랜 시간 동안 발전하며 이제는 우리 삶에서 너무 익숙해진 인공지능. 앞으로 인공지능이 만들어 갈 우리의 미래 모습은 과연 어떨지 기대되지 않으신가요?

다음 시간에는 우리 생활 속에서 만나는 인공지능의 다양한 기술과 제품을 만나보겠습니다.

LG전자 씽큐홈 가상 이미지