Pengantar Sains Data
SEMESTER GANJIL
2025/2026

Data Smoothing
Time Series

"Teknik membersihkan data dari noise untuk mengungkap pola sinyal guna meningkatkan akurasi prediksi."

TIM PENYUSUN
FK
Farhan Kholid
MA
M. Ali Akbar
FI
Fahmi Idris

Definisi Time Series

Sekumpulan titik data yang direkam pada interval waktu tertentu secara berurutan dan kronologis.

Kunci Utama: Data ini memiliki Autokorelasi. Data hari ini sangat dipengaruhi oleh data hari kemarin.
Urutan Tidak Boleh Diacak.
BBCA.JK
9,250.00
Sales Q4
Rp 12.5M
Server Temp
42.5°C
DEKOMPOSISI

Bedah Komponen Data (Y_t)

Yt = T + S + C + I

1. Trend (T)

Arah jangka panjang data (naik/turun/stagnan).

2. Seasonal (S)

Pola berulang pada periode tetap.

3. Cyclic (C)

Gelombang siklus ekonomi tak pasti.

4. Irregular (I)

Noise/Error. Target smoothing.

Analogi Tuning Radio

Definisi Teknis

Apa itu Data Smoothing?

Metode statistik untuk menghilangkan variasi acak (noise) dari dataset. Tujuannya adalah memperhalus kurva agar pola fundamental (Trend/Seasonal) terlihat jelas.

Visualisasi

Mempermudah otak manusia melihat pola arah di tengah grafik yang "gerigi" (noisy).

Prediksi

Data bersih menghasilkan model forecasting yang lebih akurat (mencegah overfitting).

Metode 1

Simple Moving Average (SMA)

Metode dasar: rata-rata aritmatika dari k data terakhir. Memberikan bobot yang SAMA rata untuk setiap data dalam window.

SMAt = Σ Xi / k

Bedah Logika

  • Bobot Setara: Data H-1 dianggap sama pentingnya dengan data H-5. (Naif)
  • Filter Efektif: Bagus untuk membuang noise frekuensi tinggi.
SIMULASI WINDOW (k)
3
Wait...
Metode 2

Weighted Moving Average (WMA)

Memperbaiki kenaifan SMA dengan memberikan Bobot (w) berbeda. Data terbaru diberi bobot terbesar.

WMAt = Σ (wi ċ Xi) / Σ wi

Logika Pasar: Harga saham kemarin lebih relevan memprediksi hari ini dibanding harga bulan lalu.

PERBANDINGAN BOBOT

SMA (Rata)
33%
33%
33%
WMA (Bertingkat)
10%
30%
60%
H-3
H-2
Now
Metode 3

Single Exponential Smoothing

Solusi elegan menggunakan satu parameter Alpha (α) untuk menurunkan bobot data lama secara eksponensial (melengkung).

St = αXt + (1-α)St-1

Peran Alpha (α)

Alpha Kecil (0.1)
Sangat halus, tapi Lagging. Mirip SMA window besar.
Alpha Besar (0.9)
Sangat responsif, tapi Noisy. Mengikuti data terbaru.
SENSITIVITAS ALPHA (α)
0.2
Wait...

Advanced Methods

Untuk data yang memiliki pola Tren (Naik/Turun) dan Musiman.

Double Exp (Holt's)

Menambahkan persamaan kedua untuk memuluskan Tren (Slope/Kemiringan) agar forecast tidak flat.

Level: Lt = αYt + (1-α)(Lt-1 + Tt-1)
Trend: Tt = β(Lt - Lt-1) + (1-β)Tt-1
Forecast: Yt+h = Lt + hTt
Simulasi Tren Linear

Triple Exp (Winters)

Metode terlengkap. Menambahkan persamaan ketiga untuk pola Musiman (Repetisi).

Season: St = γ(Yt-Lt) + (1-γ)St-m
Forecast: Yt+h = Lt + hTt + St+h-m
*Formula disederhanakan untuk presentasi
Seasonal Pattern Captured

Evaluasi Akurasi (MSE & MAPE)

Lower Score = Better Model
MSE Score
0.00
MAPE Score
0.0%
Smooth (0.1)Reactive (0.9)
MSE Formula (Hukuman Berat)
Σ(Aktual - Forecast)2 / n
MAPE Formula (Persentase)
Σ(|Error| / Aktual) / n

Strategi Pemilihan Metode

Visual Pola Karakteristik Metode Terbaik Alasan
Datar / Stasioner Single Exp / SMA Hanya perlu meratakan noise di sekitar rata-rata (Level).
Memiliki Tren Double Exp (Holt) Membutuhkan komponen Slope (Tt) agar forecast tidak tertinggal.
Musiman (Berulang) Triple Exp (Winter) Wajib menangkap pola repetisi periodik (St).

Python Code

Simulasi implementasi library Pandas.

1 Load Data
2 Hitung SMA
3 Hitung EWM (Exp)
4 Plot Grafik
import pandas as pd
import matplotlib.pyplot as plt
# 1. Load Data
df = pd.read_csv('data.csv', index_col='Date')
# 2. SMA (Window=5)
df['SMA'] = df['Close'].rolling(window=5).mean()
# 3. Exponential (Alpha=0.2)
df['EXP'] = df['Close'].ewm(alpha=0.2).mean()
# 4. Visualization
df.plot(); plt.show()
Output Figure ×
Ready...

Terima Kasih

"Good Smoothing leads to
Great Forecasting."

Slide 1 / 13