1. 머신러닝이란
in Data on Machine Learning
파이썬을 이용한 머신러닝, 딥러닝 실전개발 입문
파이썬을 이용한 머신러닝, 딥러닝 실전개발 입문 책과 강의를 바탕으로한 코드 리뷰 및 정리입니다. 자세한 내용은 책과 강의를 참고해주세요.
4. 머신러닝
4-1. 머신러닝이란
머신러닝
수많은 데이터를 학습시켜 거기에 있는 패턴을 찾아내는 것. 찾은 패턴을 기반으로 데이터를 분류하거나 미래를 예측하는 것.
머신러닝의 종류
1) 지도학습 (Supervised Learning)
Input : data + 답
Output : 다른 data의 답 예측
2) 비지도학습 (Unsupervised Learning)
Input: data
Output : 다른 data의 규칙성
ex) 클러스터 분석 (Cluster analysis), 주성분분석 (PCA), 벡터양자화 (Vector quantization), 자기조직화 (Self organization) 등
3) 강화학습 (Reinforcement learning)
Input : data 일부
Output : data를 기반으로 한 최적의 답
행동의 주체 (ex. 고양이) 가 환경을 관찰하여 이를 기반으로 의사결정을 내려 행동.(ex. 스위치를 누름) 환경(ex. 자동으로 먹이주는 기계)이 변화하면서 행동의 주체가 어떤 보상 (ex. 사료)을 받게됨. 이를 기반으로 행동의 주체는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습하게 됨.
머신러닝의 과정
머신러닝 응용분야 소개
- Classification
- Clustering
- Recommendation
- Regression
- Dimensionality Reduction
Overfitting
train data가 학습되어 있지만 학습되지 않은 새로운 데이터에 대해 제대로 된 예측을 못하는, 즉 배운것만 해결하는 상태를 의미.
- 데이터가 너무 적은 경우
- 모델에 비해 문제가 복잡한 경우