Notice
Recent Posts
Recent Comments
관리 메뉴

GIS & Spatial Analysis in KOREA

Machine Learning(기계학습)이란? 본문

Machine Learning/Machine Learning Basic

Machine Learning(기계학습)이란?

Borin78 2018. 8. 29. 08:00

[Machine Learning]

#Data Analysis #Spatial Data Analysis #Big Data #Machine Learning #AI #Data Visualization

#데이터 분석 #공간데이터 분석 #빅데이터 #기계학습 #머신러닝 #인공지능 #데이터 시각화



[ Machine Learning(기계학습)이란? ]



   Alphago와 이세돌 9단의 세기의 바둑 대결 이 후 인공지능에 대한 관심이 폭발적으로 늘어나면서 인공지능의 핵심으로 알려진 Machine Learning과 Deep Learning에 대한 검색도 엄청나다. Google Trend를 이용해 최근 몇 년 동안 IT 기술 중 이슈였던 몇몇 키워드(Big Data, Machine Learning, Artificial Intelligence(AI), Deep Learning) 검색량을 비교해본 결과 2017년 여름을 기점으로 Big Data 검색량을 Machine Learning 검색량이 뛰어 넘었다.



   그러나, 지역적으로 살펴보니 현재 스페인어를 사용하는 콜롬비아, 스페인, 페루, 멕시코 등의 국가들은 Big Data, 북미 지역과 북유럽은 Machine Learning, 동북아시아(한국, 일본, 중국, 대만) 지역은 Deep Learning, 개발도상국가 및 아프리카 지역은 Artificial Intelligence 검색량이 높은 지역적 특징을 보이고 있다.



   앞으로 몇 번에 걸쳐 Machine Learning에 대해 이야기 해보려고 한다. Machine Learning이란 인공지능(Artificial Intelligence)의 한 분야로 인간이 학습하는 방식과 유사하게 컴퓨터가 알고리즘과 프로그램을 이용해 학습하고, 학습한 내용을 기반으로 새로운 정보를 도출하거나 의사결정 하는 것을 의미한다. 


   역사적으로는 1950년대 인공신경망(Artificial Neural Network, ANN)이 출현하면서 알고리즘이 발전하기 시작했으나, 1980년 후반 이 후 상당히 오랜 기간 정체기를 겪어야 했다. 그러나 인간의 뇌를 흉내내면서 돌파구를 찾기 시작했고, 2016년 3월 Google DeepMind의 Alphago와 이세돌 9단의 세기의 바둑 대결 이 후 관심이 집중되었다. 최근 Deep Learning(딥러닝)이나 Ensemble(앙상블) 방법과 같이 정확성을 향상시킬 수 있는 새로운 Machine Learning 방법론과 하드웨어 성능의 발전으로 복잡한 알고리즘이나 방대한 데이터를 신속히 처리할 수 길이 활짝 열렸다. (Deep Learning - 신경망 모형의 한 종류로 다수의 은닉층을 가지고 있는 모형 / Ensemble - Bagging, Boosting, Random Forest 등과 같이 다수의 모형을 결합하여 하나의 모형을 만드는 방법)


  Machine Learning학습 방법에 따라 ① Supervised Learning(지도 학습) / ②Unsupervised Learning (비지도 학습) 으로 구분할 수 있다. 두 방식의 가장 큰 차이점은 Output(결과값)이 주어진 데이터를 이용해 학습하는지 여부다.


① Supervised Learning: Input(입력값)과 Output(출력값)을 가지고 있는 데이터를 이용한 학습을 통해 경험하지 못한 데이터나 미래의 데이터에 관한 예측을 하는 것을 의미 Classification(분류), Regression(회귀) 분석에 활용된다. 대표적으로 아래와 같은 알고리즘들이 있다.


        • k-nearest Neighbors Model, k-NN

        • Naïve Bayses Model

        • Support Vector Machine, SVM

        • Decision Tree Model

        • Artificial Neural Network, ANN

        • Ridge Regression Model

        • Lasso Regression Model

② Unsupervised Learning: Output(출력값)은 알 수 없는 데이터나 구조를 알 수 없는 데이터를 컴퓨터가 스스로 학습해 데이터 내부의 패턴과 관계를 찾아내는 학습 알고리즘이다. 대표적으로 아래와 같은 알고리즘들이 있다.


        • Principal Component Analysis, PCA

        • Non-negative Matrix Factorization, NMF

        • k-means Clustering Model

        • Density-based Spatial Clustering of Applications with Noise, DBSCAN

   Machine Learning과 유사한 개념으로 Data Mining이 있는데 많은 부분에서 중복된다. Data Mining에서는 Machine Learning 방법을 사용하고 있으며, Machine Learning에서도 Data Mining에서 사용하는 Unsupervised Learning 방법들과 모델의 정확도를 높이기 위해 다른 방법들도 같이 사용한다. 굳이 둘의 차이점을 이야기하자면 Machine Learning은 예측에 주 목적이 있고, Data Mining은 데이터 속에 숨겨진 성질들을 찾는데 있다.


- 끝 -



Comments