학습목표
- Machine Learning 개념을 이해 할 수 있다.
- Machine Learning 의 종류 및 과정을 알 수 있다.
- 기계학습과 관련된 기본 용어를 알 수 있다.
머신러닝이란?
머신러닝/딥러닝은 기존 데이터를 이용하여 아직 일어나지 않는 미지의 일을 예측하기 위해 만들어진 기법
학습을 통해 기계가 스스로 규칙을 만들어낸다.
데이터와 결과를 이용하여 특성과 패턴(모델을)을 찾아내고(학습) 찾아낸 모델을 이용하여 새로운 데이터에 대한
결과(값,분포)를 예측(추론)하는 것
머신러닝, 딥러닝 차이점
머신러닝 지도 학습
지도 학습(Supervised Learning)
- 데이터에 대한 Label(명시적인 답)이 주어진 상태에서 컴퓨터를 학습시키는 방법
- 분류(Classification)와 회귀(Regression)로 나위어진다.
분류(Classification)
- 미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것
- 속성 값을 입력, 클래스 값을 출력으로 하는 모델
- 붓꽃(iris)의 세 품종 중 하나로 분류, 암 분류 등
- 이진분류, 다중 분류 등이 있다.
희귀(Regression)
- 연속적인 숫자를 예측하는 것
- 속성 값을 입력, 연속적인 실수 값을 출력으로 하는 모델
- 어떤 사람의 교육수준, 나이, 주거지를 바탕으로 연간 소득 예측
- 예측 값의 미묘한 차이가 크게 중요하지 않다.
머신러닝 비지도 학습
비지도 학습(Unsupervised Learning)
- 데이터에 대한 Label(명시적인 답)이 없는 상태에서 컴퓨터를 학습습시키는 방법.
- 데이터의 숨겨진 특징, 구조, 패턴을 파악하는데 사용.
- 데이터를 비슷한 특성끼리 묶는 클러스터링(Clustering)과 차원축소(Dimensionality Reduction)등이 있다.
머신러닝 강화 학습
강화 학습(Reinforcement Learning)
- 지도학습과 비슷하지만 완전한 답(Lable)을 제공하지 않는 특징이 있다.
- 기계는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습
- 주로 게임이나 로봇을 학습시키는데 많이 사용
머신러닝 활용분야
- 기존 솔루션으로 많은 수동 조정과 규칙이 필요한 문제
- 전통적인 방식으로 전혀 해결 방법이 없는 복잡한 문제
- 새로운 데이터에 적응해야하는 유동적인 환경
- 대량의 데이터에서 통찰을 얻어야 하는 문제