#1 머신러닝이란?
1959년에 Arthur Samuel 이 정의한 Machine learning 은 다음과 같습니다.
"Field of study that gives computers the ability to learn without being explicitly programmed”
프로그램을 명시적으로 짜 놓는 것이 아닌, 컴퓨터가 스스로 학습할 수 있는 능력을 부여하는 연구분야
쉽게 말하면, 일일히 가르쳐주는것이 아니라 컴퓨터가 스스로 학습하고 유추할 수 있도록 해주는 것입니다.
물고기를 잡아주는게 아닌, 잡는 법을 알려주는 것과도 흡사하죠.
예시를 한 번 들어보겠습니다.
아이를 키우다 보면 언어를 습득하는 과정을 다음과 같이 관찰할 수 있습니다.
빠빵(자동차)이라는 단어에 대해 습득하는 과정입니다.
1) 먼저, 아빠의 자동차를 빠빵이라고 부른다는 것을 처음 배웁니다. 이 때는 아빠의 자동차가 빠빵이라는 단어와 1:1 대응이 되는 유일한 예시입니다.
2) 자라나며 비슷하게 생긴 다른 물체들도 빠빵이라고 부른다는 사실을 배웁니다. 조금씩 다르게 생긴 다양한 예시들을 접하면서 자동차의 핵심 특징을 익힙니다.
3) 이제 어떤 자동차를 봐도 빠빵이라고 부를 수 있게 됩니다. 커다란 빠빵, 하얀 빠빵, 노란 빠빵 등... 하위 분류도 할 수 있게 됩니다. 빠빵을 그려보라고 하면 이제 그릴 수 있게 됩니다.
여기서 아이가 하는 일을 기계가 대신한다고 가정하면 바로 기계학습 (Machine learning) 이 되는 것입니다.
물론 기계학습을 온전히 포괄할 만한 예시는 아닙니다. (이 예시가 최선입니까??)
기계학습은 위의 예시보다 훨씬 더 다양한 모델과 목적이 존재합니다.
#2 기본 개념과 종류
위의 예시에서 A는 빠빵이다. B도 빠빵이다. C는 빠빵이 아니다... 등등 수많은 정보를 부모로부터 듣게 됩니다.
이를 데이터(data) 라고 하며 input (A, B, C....) 값과 output (O, X) 값의 집합으로 이루어져 있습니다.
각각의 A, B, C 값 (input)에 대해 이것이 빠빵인지(O) 아닌지(X) 를 판단(output) 하는 기능을 함수(function) 이라고 할 수 있으며, 함수가 어떤 꼴을 갖느냐에 따라 적절한 러닝 모델(learning model) 을 선택하는 것 또한 중요합니다. 가끔 머신러닝과 딥러닝의 차이를 잘 모르거나 혼용하여 사용되는 경우도 있는데, 딥러닝(deep learning)이란 머신러닝의 한 종류로 인간의 뇌와 흡사한 '인공신경망(artificial neural networks)' 를 러닝 모델로 사용하는 머신러닝 패러다임을 의미합니다.
1) 지도 학습 (supervised learning)
위의 예시처럼 각각의 input 값과 그에 대응하는 output 값을 모두 알려주는 방식을 일컫습니다. 학습 목적에 따라 classification(분류) 과 regression(회귀) 으로 나눌 수 있습니다.
데이터셋으로 학습된 알고리즘을 통해 미지의 결과값을 정확하게 예측해내는 것이 목적입니다.
2) 비지도 학습 (unsupervised learning)
output (Y) 값을 알려주지 않은 (un-labeled data) 데이터를 보고 스스로 학습하는 방식을 일컫습니다. 데이터가 무작위로 분포되어 있을 때 비슷한 것들끼리 묶는 군집화 (clustering) 모델이 대표적입니다.
데이터의 숨겨진 특징이나 수평적, 수직적 구조를 발견하고 분석하는 데 사용됩니다.
3) 강화 학습 (reinforcement learning)
앞서 말한 지도 학습이나 비지도 학습과는 조금 다른 성격으로, 데이터가 주어졌을 때(state) 어떠한 행동(action) 을 취하고 그에 따른 보상(reward)을 얻으면서 학습을 진행합니다. 학습의 최종목표는 보상(reward)을 최대화하는 것입니다.
주어진 동적 환경(dynamic environment)에서의 최선의 선택을 찾기 위한 다양한 분야에 응용되고 있습니다. 구글의 알파고(Alpha-go)도 바로 이 강화 학습을 통해 바둑을 습득한 것으로 알려져 있습니다.
- http://www.techjini.com/blog/machine-learning/ [본문으로]
'지식 & 정보 > 전공 이야기' 카테고리의 다른 글
Ab initio(제 1원리) 계산의 종류와 특징 - Hartree Fock 과 DFT (0) | 2020.02.19 |
---|---|
계산화학의 현재와 미래 (5) | 2020.02.15 |
특이점이 오고 있을까? AI와 수확 가속의 법칙 (0) | 2020.02.15 |
댓글