3 jenis utama pembelajaran mesin (machine learning) yang perlu diketahui oleh setiap data scientist, yaitu:
1. Supervised Learning (Pembelajaran Terawasi)
Model dilatih menggunakan data yang sudah diberi label (labelled data).
Dibagi menjadi dua kategori:
Classification (Klasifikasi)
Tujuan: Mengklasifikasikan data ke dalam kategori tertentu.
Contoh algoritma:
Logistic Regression
Decision Trees
Random Forest
XGBoost
K-Nearest Neighbors
Support Vector Machines
Regression (Regresi)
Tujuan: Memprediksi nilai kontinu.
Contoh algoritma:
Linear Regression
Elastic Net (GLM)
Decision Trees
Random Forest
XGBoost
K-Nearest Neighbors
Support Vector Machines
Neural Networks
2. Unsupervised Learning (Pembelajaran Tak Terawasi)
Model dilatih menggunakan data yang tidak memiliki label (unlabelled data).
Tujuannya untuk menemukan pola atau struktur tersembunyi dalam data.
Clustering (Pengelompokan)
Contoh algoritma:
K-Means Clustering
DBSCAN
Hierarchical Clustering
Other Unsupervised Techniques
PCA (Principal Component Analysis)
Association (misalnya: Market Basket Analysis)
3. Reinforcement Learning (Pembelajaran Penguatan)
Model belajar dengan berinteraksi dengan lingkungan, menerima umpan balik (feedback) berupa reward atau punishment, dan memperbaiki tindakannya dari waktu ke waktu.
Terdiri dari komponen:
Environment (Lingkungan)
Agent (Model)
Actions
Rewards
States
Contoh algoritma:
Q-Learning
R-Learning
TD-Learning (Temporal Difference)