Analisis Autokorelasi Variabel Data Monitoring Marketing ... text.pdfAnalisis Autokorelasi Variabel...
Transcript of Analisis Autokorelasi Variabel Data Monitoring Marketing ... text.pdfAnalisis Autokorelasi Variabel...
Analisis Autokorelasi Variabel Data Monitoring Marketing
(Time Series) di CV Solofood Indonusa
Artikel Ilmiah
Peneliti:
Yordan Hiswari (672015256)
Radius Tanone, S.Kom., M.Cs.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Desember 2018
Lembar Persetujuan
Analisis Autokorelasi Variabel Data Monitoring Marketing
(Time Series) di CV Solofood Indonusa
Artikel Ilmiah
Peneliti :
Yordan Hiswari (672015256)
Telah Disetujui Untuk Diuji:
Tanggal :........................................
Radius Tanone, S.Kom., M.Cs.
Pembimbing
Pernyataan
Artikel Ilmiah berikut ini :
Judul : Analisis Autokorelasi Variabel Data Monitoring
Marketing (Time Series) di CV Solofood Indonusa
Pembimbing : Radius Tanone, S.Kom., M.Cs.
adalah benar hasil karya saya :
Nama : Yordan Hiswari
NIM : 672015256
Saya menyatakan tidak mengambil sebagian atau seluruhnya dari hasil karya
orang lain kecuali sebagaimana yang tertulis pada daftar pustaka.
Pernyataan ini dibuat dengan sebenar-benarnya sesuai dengan ketentuan yang
berlaku dalam penulisan karya ilmiah.
Salatiga, 12 Desember 2018
Yordan Hiswari
1
I. Pendahuluan
Perkembangan Teknologi Informasi saat ini dapat dirasakan oleh banyak
orang. Salah satunya, pemanfaatan teknologi informasi juga dapat dirasakan
oleh perusahaan untuk berbagai kepentingan. Perusahaan CV Solofood Indonusa
merupakan salah satu perusahaan yang bergerak dibidang bakery. Dalam
sebulan omset yang dihasilkan oleh perusahaan ini dapat mencapai angka
tertentu. Dalam menjalankan proses bisnisnya, perusahaan melakukan penjualan
roti dalam skala yang besar. Skala yang dimaksud adalah berdasarkan jumlah
produk dan jangkauan penjualan. Untuk kategori roti sendiri diproduksi dan
dijual dengan jenis yang bervariasi. Sedangkan untuk jangkauan penjualan,
daerah yang dijadikan target meliputi seluruh pulau Jawa. Dalam menjalankan
proses bisnisnya, berbagai pencatatan penjualan yang meliputi jumlah capaian
target perhari, perminggu dan perbulan dapat dianalisa oleh perusahaan. Hal
serupa juga dapat dilakukan pada analisa area jangkauan dari penjualan produk.
Data-data perusahaan ini membentuk data time series, yaitu data yang runtun
oleh waktu.
Dalam data perusahaan, data time series terdiri dari 7 variabel yaitu,
bulan, Q-NETT, Retur, Kiriman Lalu, BS (Bad Stock), Barang Bawaan Baru, dan
Kehilangan. Selama ini, permasalahan terbesar yang terjadi dalam perusahaan
adalah melesetnya jumlah kiriman barang dengan jumlah barang yang terjual,
sehingga perlu diperkirakan jumlah kiriman pada bulan yang akan datang agar
perusahaan tidak terus merugi. Dalam hal ini, perlu diperkirakan prediksi untuk
variabel Q-NETT (barang yang terjual), Retur (barang yang kembali), dan BS
(barang rusak/ kadaluarsa).
Dalam melakukan analisa, data yang diolah begitu besar karena jumlah
produk dan area jangkauan penjualan semakin besar dari waktu ke waktu. Selain
itu, adanya data time series perusahaan yang selama ini belum maksimal
dianalisa. Proses analisa yang biasa-biasa saja tidak dapat dilakukan lagi,
misalnya saja untuk melakukan analisa prediksi keuntungan pada area jangkauan
baru atau pemasaran produk baru di waktu tertentu. Akan sulit jika hanya
menggunakan perhitungan manual atau menggunakan tools seperti excel.
Disamping itu, perusahaan sangat perlu melakukan perhitungan prediksi atas
penjualan agar dapat menyesuaikan situasi dan lokasi pemasaran dan perusahaan
tidak merugi. Melihat permasalahan yang ada, maka pengembangan data yang
semakin bertambah dari waktu ke waktu dapat dimaksimalkan dengan
memanfaatkan teknologi seperti machine learning. Machine learning atau
pembelajaran mesin merupakan pendekatan dalam AI yang banyak digunakan
untuk menggantikan atau menirukan perilaku manusia untuk menyelesaikan
masalah atau melakukan otomatisasi. Sesuai namanya, Machine Learning
mencoba menirukan bagaimana proses manusia atau makhluk cerdas belajar dan
men-generalisasi[1].
Rumusan masalah pada penelitian ini adalah bagaimana membantu
proses pengolahan data menggunakan metode autokorelasi di CV Solofood
Indonusa dengan data time series, yaitu data-data yang nilai variabelnya
berurutan menurut waktu. Selain itu, bagaimana membantu perusahaan
2
memprediksi penjualan di masa yang akan datang dilihat dari variabel Q-NETT,
Retur, dan BS. Adapun tujuan dan manfaat dari penelitian ini yaitu membantu
perusahaan dalam melakukan analisa terhadap data dengan jumlah yang besar
dengan data time series menggunakan bahasa pemrograman Python dan
membantu perusahaan memprediksi hasil penjualan di masa yang akan datang
dengan mengacu pada hasil prediksi ketiga variabel, Q-NETT, Retur, dan BS.
Data yang dianalisa berupa data penjualan dan area penjualan setiap hari,
minggu dan bulan dalam beberapa tahun terakhir.
II. Tinjauan Pustaka
Penelitian terdahulu yang berkaitan dengan penelitian data time series
berjudul βAnalisis Data Time Series Menggunakan Model Exponential
Generalized Autoregressive Conditional Heteroscedasticity (EGARCH) (1,1)β.
Tujuan dari penelitian ini adalah untuk mendapatkan model EGARCH yang
terbaik dan untuk meramalkan data mingguan harga saham PT. Tambang Batu
Bara Bukit Asam Tbk. dari Januari 2009 sampai Februari 2016. Model terbaik
yang diperoleh untu data tersebut adalah model ARIMA (1,1,0) dan EGARCH
(1,1). Hasil ramalan untuk empat periode berikutnya sangat baik dan semua nilai
berada di dalam interval konfidensi 95%[2].
Penelitian lainnya berjudul βMetode Cochrane-Orcutt untuk Mengatasi
Autokorelasi pada Regresi Ordinary Least Squaresβ. Penelitian ini membahas
dalam pemodelan kuadrat terkecil biasa (OLS), salah satu asumsi penting adalah
variabel eror yang tidak berkorelasi atau tidak memiliki autokorelasi. Tujuan dari
penelitian ini adalah menyelidiki metode Cochrane-Orcutt untuk solusi
autokorelasi dalam regresi OLS dan diterapkan pada data perbankan. Hasilnya
menunjukkan bahwa metode Cochrane-Orcutt dapat digunakan sebagai solusi
autokorelasi dalam regresi OLS dan diterapkan pada data perbankan[3].
Penelitian lain berjudul βTime Series Analysis Using Copula Gauss and
AR(1)-N.GARCH(1,1)β. Prediksi menggunakan Copula ini dibangun atas tiga
hal penting yaitu fungsi distribusi marjinal, fungsi kernel, dan fungsi Copula.
Dalam hal ini, digunakan Copula Gaussian untuk menghubungkan data yang
berkorelasi dengan waktu dan dengan himpunan data lainnya (dalam hal ini data
return harga saham SP100 dan SP600)[4].
Penelitian lainnya berjudul βForecasting Electric Vehicles Sales with
Univariate and Multivariate Time Series Models: The Case of Chinaβ.
Penelitian ini menyajikan analisis spektrum tunggal (SSA) sebagai model
univariate time series dan model autoregresif vektor (VAR) sebagai model
multivariate. Hasil empiris menunjukkan bahwa secara memuaskan SSA
mengindikasi tren yang berkembang dan memberikan hasil yang masuk akal.
Model VAR, yang terdiri ddari parameter eksogen yang terkait dengan pasar
setiap bulan, dapat secara signifikan meningkatkan akurasi prediksi[5].
Berbeda dengan penelitian sebelumnya, dalam penelitian ini hanya akan
menganalisis grafik dari olahan data time series menggunakan bahasa
pemrograman Python (Anaconda) lalu dilihat korelasi tiap variabelnya atau pola
3
yang terdapat pada data time series menggunakan metode autokorelasi untuk
prediksi penjualan di masa yang akan datang. Data time series diolah
menggunakan bahasa pemrograman Python (Anaconda) sehingga menghasilkan
grafik-grafik yang dapat dianalisis perubahannya dari bulan ke bulan.
Kemudian, korelasi tiap variabelnya akan diperhitungkan dengan menggunakan
metode autokorelasi dan dilihat pola data yang terdapat pada tiap variabel lalu
dilakukan prediksi. Variabel-variabel yang akan dianalisis ini diharapkan dapat
membantu perusahaan dalam memprediksi jumlah barang yang akan dikirim
sehingga dapat menekan barang retur dan barang BS (Bad Stock) sehingga
perusahaan tidak merugi.
- Machine Learning
Machine Learning adalah serangkaian teknik yang dapat membantu
dalam menangani dan memprediksi data yang sangat besar dengan cara
mempresentasikan data-data tersebut dengan algoritma pembelajaran. Machine
learning dapat membuat komputer memprogram diri mereka sendiri. Jika
pemrograman adalah pekerjaan untuk membuat otomasi, maka Machine
Learning mengotomatisasi proses otomasi. Pada dasarnya Machine Learning
membiarkan data melakukan pekerjaan[6].
- Data Time Series
Data time series merupakan suatu deskripsi masa lampau dan digunakan
untuk meramalkan masa depan, artinya kita berharap masa depan dapat
dijelaskan dengan informasi yang ada pada masa lampau. Kalau memang hal
ini yang terjadi, kita dapat menawarkan suatu model matematik yang mampu
merepresentasikan proses terjadinya data time series tersebut. Kemudian, kita
gunakan model matematik ini untuk membuat suatu ramalan tentang masa
depan[7]. Dalam pemodelan time series, sebagian data yang diketahui dapat
digunakan untuk meramalkan sisa data berikutnya sehingga memungkinkan
orang untuk mempelajari ketepatan peramalan[8].
- Python (Anaconda)
Python adalah bahasa pemrograman multiplatform yang open source,
yang terinterpretasi oleh typing dinamis dan kuat serta memiliki library yang
banyak juga seperti struktur data, multithreading, files, dan jaringan[9].
Keuntungan utama yang ditawarkan oleh bahasa pemrograman Python adlaah
memiliki alat simulasi python gratis. Memang, bahasa yang Open source, dapat
diimplementasikan dengan mudah seperti membuat model client-server untuk
dites, dan pemrograman dengan menggunakan web browser[10].
- Autocorrelation
Autokorelasi dapat didefinisikan sebagai korelasi antara nilai-nilai
pengamatan yang terurut dalam waktu. Autokorelasi sering terjadi pada deret
waktu (time series) karena suatu pengamatan dalam jenis data ini biasanya
dipengaruhi oleh data sebelumnya[11]. Autokorelasi berkaitan dengan
hubungan antara nilai-nilai yang berurutan dari variabel yang sama. Dengan
demikian terlihat adanya perbedaan antara autokorelasi dengan korelasi yang
mana sama-sama mengukur derajat keeratan hubungan. Korelasi mengukur
4
derajar keeratan hubungan di antara dua variabel yang berbeda, sedangkan
autokorelasi mengukur derajat hubungan di antara nilai-nilai yang berurutan
pada variabel yang sama atau pada variabel itu sendiri[12].
III. Metodologi Penelitian
Penelitian ini menggunakan 8 langkah model pengembangan menurut
Sugiyono (2008:289) yang ditunjukkan pada Gambar 1[13] berikut ini:
Tahapan Penelitian pada Gambar 1 dapat dijelaskan sebagai berikut:
1. Potensi dan Masalah
Penelitian selalu dibuat karena adanya potensi permasalahan yang
terjadi di lapangan. Berdasarkan wawancara yang dilakukan dengan
direktur utama dari perusahaan CV Solofood Indonusa, Bapak Widi
Nugraha, diketahui permasalahan terbesar yang terjadi di perusahaan
adalah mengenai keterbatasan pengelolaan data yang sangat besar. Hal
tersebut menghambat penganalisaan terharap variabel-variabel yang ada
Potensi dan Masalah
Pengumpulan Data
Desain Produk
Revisi Desain
Uji Coba Pemakaian
Revisi Produk
Validasi Desain
Gambar 1. Metode Penelitian[13]
Uji Coba Produk
5
pada data karena sejauh ini perusahaan masih menggunakan tools dari
Ms.Office yaitu Ms.Excel. Pembuatan data saja memakan waktu yang
sangat lama sehingga perusahaan tidak dapat menganalisa dan
memahami dengan baik data yang telah dibuat. Penelitian ini digunakan
untuk membantu perusahaan CV Solofood Indonusa dalam mengelola
data yang sangat besar dan menganalisa variabel yang ada dan hubungan
antar variabel pada data.
2. Pengumpulan Data
Pengumpulan data dilakukan dengan cara wawancara dengan
direktur utama perusahaan CV Solofood Indonusa, membaca berbagai
literatur, jurnal, dan browsing internet mengenai topik yang diangkat
dalam penelitian ini.
3. Desain Produk
Langkah-langkah mengelola data monitoring marketing dan
menganalisa menggunakan metode autokorelasi dapat ditunjukkan pada
gambar berikut ini:
Berikut ini merupakan penjelasan dari tahap-tahap desain produk:
a. Penelitian ini mengelola data perusahaan yang sangat besar
menggunakan bahasa pemrograman Python (Anaconda) dengan
menyesuaikan format .csv sehingga didapatkan hasil pengelolaan
data dalam bentuk grafik.
b. Pada tahap selanjutnya, grafik yang muncul dipelajari hubungan
antar variabelnya dan pola tiap variabelnya sehingga dapat
disesuaikan dengan permasalahan pada perusahaan, misal
penekanan kiriman penjualan agar perusahaan tidak merugi
banyak.
c. Tahap ini dilakukan hitungan pada data time series menggunakan
metode autokorelasi pada tiap variabelnya, kemudian dilihat
polanya.
4. Validasi Desain
Pada tahap validasi desain dilakukan suatu penilaian pada analisa
yang telah dibuat, apakah sesuai dengan kenyataannya yang terjadi di
perusahaan. Kemudian dilakukan penyesuaian pada teori-teori yang ada.
Mengelola data dengan Anaconda (Python)
Mempelajari Hubungan antar Variabel melalui Grafik Hasil Pengelolaan Data
Melihat pola pada data time series menggunakan Metode Autokorelasi
Gambar 2. Tahap-Tahap Desain Produk
6
5. Revisi Desain
Setelah hasil analisa selesai divalidasi, maka akan terlihat kelemahan
dari analisa yang sudah dibuat, sehingga perlu diubah/ direvisi.
Kemudian hasil analisa akan diperbaiki lagi.
6. Uji Coba Pemakaian
Setelah dilakukan revisi desain, maka akan dilakukan uji coba hasil
analisa dengan menyelesaikan permasalahan nyata pada perusahaan
7. Revisi Produk
Revisi produk akan dilakukan apabila dalam uji coba pemakaian
ditemukan lagi kelemahan-kelemahan dari hasil analisa yang perlu
diperbaiki agar hasil analisa dapat disempurnakan lagi.
8. Uji Coba Produk
Tahap terakhir adalah uji coba produk atas revisi produk yang
terakhir kali dilakukan. Dari hasil analisa yang telah melalui banyak
tahap revisi, diharapkan dapat membantu perusahaan dalam mengamati
keluar masuknya barang.
Pengolahan data time series dalam bentuk .csv dengan bahasa
pemrograman Python diawali seperti Gambar 3.
Pada Code 1 ditunjukkan pengolahan data diawali dengan import
packages: numpy, pandas, matplotlib, dan seaborn. Import numpy digunakan
untuk operasi vektor dan matriks, import pandas berperan sebagai spreadsheet
yang memiliki fitur seperti SQL namun tidak memiliki GUI, import matplotlib
digunakan untuk memvisualisasikan data agar lebih rapi, dan import seaborn
digunakan untuk memvisualisasikan data statistik berdasarkan matplotlib (high-
level interface). Setelah melakukan import packages, dilakukan import data
seperti pada Code 2.
Pada Code 2 ditunjukkan import data .csv dengan .read_csv(). Lalu
dilakukan pengecekan beberapa baris awal dengan .head(). Skriprows dilakukan
untuk skip baris pertama (nama variabel) untuk menunjukkan data yang pertama.
Code 1. Import Packages
Code 2. Import Data
7
Pada Code 3 dapat dilihat output dari import data yang menunjukkan
variabel-variabel pada data time series. Kemudian dapat digunakan .info() untuk
mengecek tipe data, jumlah baris, dan lain sebagainya seperti pada Code 4.
Pada Code 4, dapat dilihat info dari data time series yang sudah diimport
menggunakan .info(), yaitu jumlah kolom: 7, jumlah baris: 60, nama-nama
variabel: bulan, Q-NETT, Retur, Kiriman Lalu, BS, Barang Bawaan Baru,
Kehilangan, dan tipe data: float. Kemudian untuk menamai kolom (Data
Wrangle) dengan nama-nama variabel perlu memanggil DataFrame (df) seperti
coding pada Code 5 berikut ini.
Pada Code 5 dilakukan penamaan kolom dengan perintah df.columns dan
setiap kolom dinamai sesuai variabel tiap datanya, sedangkan df.head()
dilakukan untuk memeriksa kembali hasilnya. Berikut outputnya dapat dilihat
pada Code 6.
Code 3. Output Import Data
Code 4. Output .info()
Code 5. Data Wrangle
8
Pada Code 6, terlihat Output dari Data Wrangle, yaitu hasil dari
penamaan kolom tiap variabel data: month, Q-NETT, Retur, Kiriman Lalu, BS,
Barang Bawaan Baru, dan Kehilangan.
Selanjutnya, dilakukan Exploratory Data Analysis (EDA) atau yang biasa
disebut analisis data eksploratif, yaitu metode eksplorasi data menggunakan
teknik aritmatika sederhana dan grafis dengan cara seperti Code 7.
Pada Code 7, .plot() digunakan untuk menjadikan 7 plot baris menjadi 1
gambar (satu untuk setiap kolom, yaitu βmonthβ, βQ-NETTβ, βreturβ, βkiriman
laluβ, βBSβ, βbarang bawaan baruβ, βkehilanganβ). Figsize, linewidth, dan fontsize
digunakan untuk menetapkan ukuran gambar, lebar garis dan ukuran font
masing-masing plot. Untuk membuat plot menjadi lebih akurat, label pada
sumbu x ditentukan menjadi βYearβ, dan ukuran font menjadi 20.
Pada data time series, sering ditemukan korelasi antar variabel. Ukuran
yang biasa digunakan dalam korelasi adalah koefisien autokorelasi. Pola data
dan juga komponen seperti tren dan musiman dapat di pelajari menggunakan
autokorelasi. Berikut rumus koefisien autokorelasi[14]:
ππ =β (ππ‘βοΏ½Μ οΏ½)(ππ‘βπβοΏ½Μ οΏ½)π
π‘=π+1
β (ππ‘βοΏ½Μ οΏ½)2ππ‘=1
, k= 0, 1, 2, β¦
(1)
Keterangan:
ππ = koefisien autokorelasi
οΏ½Μ οΏ½ = mean dari data observasi
ππ‘ = observasi pada periode waktu t
ππ‘βπ = observasi k (periode waktu sebelumnya)
Selanjutnya mengidentifikasi pola data tren dan musiman pada data time
series. Pada pola data tren, korelasinya berturut-turut tinggi, koefisien
autokorelasinya jauh dari nol namun berangsur-angsur turun mendekati nol.
Code 7. Exploratory Data Analysis (EDA)
Code 6. Output Data Wrangle
9
Sedangkan pada pola data musiman, koefisien autokorelasi akan meningkat
pada lag waktu musiman. Pola data tren dapat dicari dengan rumus sebagai
berikut[15]:
οΏ½ΜοΏ½ = π + ππ‘ (2)
Keterangan:
οΏ½ΜοΏ½ = data time series yang akan diperkirakan
π‘ = variabel waktu
π πππ π = konstanta dan koefisien
π πππ π dapat dicari menggunakan rumus:
π = οΏ½Μ οΏ½ β ππ‘Μ (3)
οΏ½Μ οΏ½ =β π¦
π dan π‘Μ =
β π‘
π
(4)
π =β π‘π¦β
β π‘ β π¦
π
β π‘2β(β π‘)2
π
(5)
Sedangkan untuk pola data musiman dapat dicari dengan metode rata-
rata sederhana. Pertama, mencari nilai rata-rata data time series tiap bulannya,
lalu dicari besaran presentase terhadap total jumlah nilai rata-rata (total jumlah
nilai rata-rata dipresentasekan menjadi 100). Indeks pola data musiman dapat
dilihat dengan cara mengkalikan besaran presentase masing-masing bulan
dengan konstanta 12. Rumus pola data musiman sebagai berikut[15]:
π΅π’πππ =ππππππ ππ’π ππππ
1200Γ πππππππππ π‘πβπ’πππ (6)
IV. Hasil dan Pembahasan
Pada pengolahan data monitoring marketing CV Solofood Indonusa
dilakukan pengolahan data besar menjadi format .csv.
10
Pada Gambar 3, ditunjukkan data monitoring marketing yang telah
diubah dalam format .csv. Dalam data yang akan diolah ini terdapat beberapa
variabel, yaitu variabel bulan, dimana data yang akan diolah merupakan data
perusahaan dari bulan Januari 2013 sampai dengan Desember 2017. Selanjutnya,
terdapat variabel Q-NETT, artinya banyaknya barang yang sudah terjual di
pasaran tiap bulannya. Variabel selanjutnya adalah Retur, artinya banyaknya
barang yang kembali/ tidak terjual tiap bulannya. Kemudian, terdapat variabel
Kiriman Lalu, yang artinya semua barang yang telah dikirim/ distock ke berbagai
area oleh perusahaan. Variabel BS (Bad Stock) merupakan barang retur yang
mengalami kerusakan, hancur, ataupun kadaluarsa sehingga tidak dapat
dipasarkan lagi. Kemudian variabel Barang Bawaan Baru, merupakan barang
yang dikirim/ distock lagi untuk stock untuk bulan ke depannya. Dan variabel
terakhir yaitu variabel Kehilangan, merupakan kehilangan barang yang
terdeteksi oleh perusahaan.
Berdasarkan data time series yang telah diolah dengan Python, banyak
grafik yang dimunculkan untuk menganalisis pola data penjualan dari tahun ke
tahun. Hal ini dilakukan untuk melihat pola data time series agar dapat dianalisis
prediksi penjualan untuk bulan-bulan dan tahun-tahun yang akan datang.
Grafik pertama dapat ditunjukkan melalui Gambar 4.
Gambar 3. Data monitoring marketing dalam format .csv
11
Pada Gambar 4 dapat dilihat bahwa pada sumbu x yang tertera bukanlah
bulan melainkan tahun, seperti yang disarankan oleh default label. Angka pada
grafik mewakili jumlah tiap-tiap variabel terhadap titik tertinggi terhadap bagan
waktu tertentu. Pada grafik keseluruhan ini dapat dilihat perbandingan seluruh
variabel yaitu βQ-NETTβ (barang yang terjual), βReturβ (barang yang kembali/
tidak terjual), βKiriman Laluβ (barang yang dijual/ dipasarkan), βBSβ (barang
hancur/ kadaluarsa), βBarang Bawaan Baruβ (barang yang dijual/ dipasarkan
bulan selanjutnya), dan βKehilanganβ (kehilangan barang/ pencurian). Dapat
dilihat awal penjualan barang cukup tinggi, barang yang terjual juga cukup
tinggi, jadi dapat disimpulkan barang retur tidak terlalu banyak. Namun pada
pertengahan 2013 tepatnya Juli 2013, barang yang dijual/ dipasarkan turun
hampir setengah kali daripada sebelumnya, hal ini bisa jadi dikarenakan oleh
penyesuaian yang dilakukan pada bulan puasa. Pada Agustus 2013, barang
dipasarkan paling banyak bila dibandingkan bulan sebelumnya, hal ini mungkin
dikarenakan menyesuaikan momen lebaran. Namun barang yang terjual tidak
sesuai ekspektasi sehingga pada bulan berikutnya barang yang dipasarkan terus
menurun karena barang yang terjualpun terus menurun. Kemudian pada tahun
2014 dan seterusnya kasusnya sama, barang yang terjual terus menurun sehingga
barang yang dipasarkan juga diturunkan agar tidak banyak merugi karena barang
returnya meningkat. Akhirnya pada akhir tahun 2017, terjadi penurunan
penjualan barang yang sangat signifikan dari bulan dan tahun-tahun sebelumnya.
Grafik BS menunjukkan barang hancur/kadaluarsa kira-kira seperempat sampai
setengah dari barang retur (barang yang kembali/ tidak terjual) dan jumlah
barang bawaan baru selalu menyesuaikan penjualan bulan sebelumnya.
Selanjutnya, direncanakan satu kolom plot dengan sendirinya untuk
melihat plot tersebut melalui rangkaian waktu. Berikut ini perencanaan kolom
Q-NETT, Retur, dan BS melalui Python.
df[[βQ-NETTβ]].plot(figsize=(20,10), linewidth=5, fontsize=20)
plt.xlabel(βYearβ, fontsize=20);
Gambar 4. Grafik Hasil EDA
12
df[[βReturβ]].plot(figsize=(20,10), linewidth=5, fontsize=20)
plt.xlabel(βYearβ, fontsize=20);
df[[βBSβ]].plot(figsize=(20,10), linewidth=5, fontsize=20)
plt.xlabel(βYearβ, fontsize=20);
Pada Code 8, Code 9, dan Code 10 di atas, df[[βVariabelβ]] digunakan
untuk memplot dan merencanakan 1 variabel untuk 1 grafik berdasarkan
rangkaian waktu, yaitu variabel Q-NETT, Retur, dan BS. Figsize, linewidth, dan
fontsize digunakan untuk menetapkan ukuran gambar, lebar garis dan ukuran
font masing-masing plot. Untuk membuat plot menjadi lebih akurat, label pada
sumbu x ditentukan menjadi βYearβ, dan ukuran font menjadi 20.
Hasil grafik perencanaan kolomβQ-NETTβ dapat dilihat pada Gambar 5.
Variabel Q-NETT menunjukkan jumlah barang yang terjual. Pada Gambar 5
dapat dilihat perubahan jumlah barang yang terjual dari tahun ke tahun semakin
menurun. Awalnya pada tahun 2013 masih tinggi, namun mulai tahun 2014
terjadi penurunan sangat signifikan hingga akhirnya pada tahun 2015 penjualan
cukup stabil. Hingga terjadi penurunan lagi pada tahun 2016 sampai 2017.
Gambar 5. Grafik Variabel Q-NETT
Code 8. Plot kolom Q-NETT
Code 9. Plot kolom Retur
Code 10. Plot kolom BS
13
Selanjutnya, hasil perencanaan kolom Retur dapat dilihat pada Gambar
6. Variabel Retur menunjukkan barang yang dikembalikan ke pabrik dari area
penjualan. Bila dilihat pada Gambar 6, perubahan barang Retur selama data 60
bulan pernah mengalami penurunan signifikan. Hal tersebut sangat mungkin ada
hubungannya dengan turunnya barang yang terjual bila dilihat dari grafik Q-
NETT dari tahun ke tahun. Dari bulan pertama sampai bulan ke-30, barang Retur
cukup stabil tinggi, hingga setelah bulan ke-30 barang Retur mengalami
penurunan secara signifikan sampai bulan ke-45. Setelah itu, barang Retur
mengalami kenaikan lagi sampai tahun 2017 namun tidak setinggi awal bulan
sampai bulan ke-30.
Pada Gambar 7, dapat dilihat hasil perencanaan kolom BS. Variabel BS
(Bad Stock) menunjukkan barang Retur yang mengalami kerusakan atau
kadaluarsa. Dari Gambar 7, terlihat perubahan grafik BS tidak jauh berbeda
dengan perubahan grafik Retur. Pada awal bulan cenderung stabil hingga bulan
ke-30, setelah bulan ke-30 sempat mengalami kenaikan hingga bulan ke-35
Gambar 6. Grafik Variabel Retur
Gambar 7. Grafik Variabel BS
14
mengalami penurunan drastis hingga bulan ke-45. Selanjutnya berangsur-angsur
naik kembali hingga bulan ke-60.
Untuk mengetahui apakah data time series saling berkorelasi, maka perlu
dicari koefisien autokorelasi menggunakan Persamaan (1). Data time series
pertama yang akan dihitung koefisien autokorelasinya yaitu Q-NETT,
perhitungan lag 1 ditunjukkan pada Tabel 1.
Waktu
(t) Yt ππβπ (Yt - οΏ½Μ οΏ½) (ππβπ β οΏ½Μ οΏ½) (ππ β οΏ½Μ οΏ½)π
(Yt - οΏ½Μ οΏ½) (ππβπ β οΏ½Μ οΏ½)
1 63.114 - 27.907,60 - 3983376996 -
2 60.590 63.114 25.383,60 27.907,60 3671148100 708395355
β¦
Total 2.112.386 2,00 86866984146 6490082273
Pada Tabel 1 dilakukan perhitungan koefisien autokorelasi pada lag 1
untuk data Q-NETT dengan tujuan melihat apakah ada korelasi dalam data Q-
NETT sehingga akhirnya dapat dihitung prediksi untuk bulan ke depannya.
οΏ½Μ οΏ½ = 2.112.386
60= 35.206,40
Koefisien korelasi lag 1 (π1) dihitung menggunakan total pada Tabel 1
dengan Persamaan 1.
π1 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β1 β οΏ½Μ οΏ½)π
π‘=1+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=6490082273
86866984146= 0,0747
Korelasi antara ππ‘ dan ππ‘β1 atau autokorelasi dari satu periode
sebelumnya adalah 0,0747. Sedangkan korelasi pada lag 2 atau autokorelasi
antara ππ‘ dan ππ‘β2 menggunakan Persamaan 1 adalah sebagai berikut.
π2 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β2 β οΏ½Μ οΏ½)π
π‘=2+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=7444264310
86866984146= 0,0857
Korelasi antara ππ‘ dan ππ‘β2 atau autokorelasi untuk lag 2 adalah 0,0857.
Hal ini membuktikan bahwa terdapat autokorelasi pada data Q-NETT
berdasarkan dua kali periode lag. Variabel Q-NETT termasuk pada pola data
musiman, karena koefisien autokorelasinya meningkat pada lag waktu musiman.
Selanjutnya, dibuktikan apakah terdapat korelasi pada data time series
βReturβ dengan menghitung koefisien autokorelasi data pada Tabel 2 berikut ini.
Bulan Retur (Yt)
(data original)
ππβπ
(Y lagged periode
pertama)
ππβπ
(Y lagged periode
kedua)
Tabel 1. Perhitungan koefisien autokorelasi pada lag 1 untuk
data Q-NETT.
15
Jan-13 28.728
Feb-13 27.142 28.728
Mar-13 29.863 27.142 28.728
β¦
Tabel 2 menunjukkan data βReturβ untuk diolah dan dicari adakah
korelasinya menggunakan perhitungan koefisien autokorelasi sehingga akhirnya
dapat dicari prediksi untuk bulan ke depannya. Dari data βReturβ pada Tabel 2,
dilakukan perhitungan koefisien autokorelasi lag 1 sebagai berikut:
π1 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β1 β οΏ½Μ οΏ½)π
π‘=1+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=3499546521
4475961872= 0,7818
Korelasi antara ππ‘ dan ππ‘β1 atau autokorelasi dari satu periode
sebelumnya adalah 0,7818. Sedangkan korelasi pada lag 2 atau autokorelasi
antara ππ‘ dan ππ‘β2 menggunakan Persamaan 1 adalah sebagai berikut.
π2 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β2 β οΏ½Μ οΏ½)π
π‘=2+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=2959480474
4475961872= 0,6612
Korelasi antara ππ‘ dan ππ‘β2 atau autokorelasi untuk lag 2 adalah 0,6612.
Hal ini membuktikan bahwa terdapat autokorelasi pada data Retur berdasarkan
dua kali periode lag. Variabel Retur termasuk pada pola data tren, karena
korelasinya berturut-turut tinggi, koefisien autokorelasinya jauh dari nol namun
berangsur-angsur turun mendekati nol. Selanjutnya, dibuktikan apakah terdapat korelasi pada data time series
βBSβ dengan menghitung koefisien autokorelasi data pada Tabel 3 berikut ini.
Bulan BS (Yt)
(data original)
ππβπ
(Y lagged periode
pertama)
ππβπ
(Y lagged periode
kedua)
Jan-13 11.634
Feb-13 9.574 11.634
Mar-13 11.089 9.574 11.634
β¦
Tabel 3 menunjukkan data βBSβ untuk diolah dan dicari adakah
korelasinya menggunakan perhitungan koefisien autokorelasi sehingga akhirnya
dapat dicari prediksi untuk bulan ke depannya. Dari data βBSβ pada Tabel 3,
dilakukan perhitungan koefisien autokorelasi lag 1 sebagai berikut:
Tabel 2. Data Retur
Tabel 3. Data BS
16
π1 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β1 β οΏ½Μ οΏ½)π
π‘=1+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=852632770
1245228142= 0,6847
Korelasi antara ππ‘ dan ππ‘β1 atau autokorelasi dari satu periode
sebelumnya adalah 0,6847. Sedangkan korelasi pada lag 2 atau autokorelasi
antara ππ‘ dan ππ‘β2 menggunakan Persamaan 1 adalah sebagai berikut.
π2 =β (ππ‘ β οΏ½Μ οΏ½)(ππ‘β2 β οΏ½Μ οΏ½)π
π‘=2+1
β (ππ‘ β οΏ½Μ οΏ½)2ππ‘=1
=709795034
1245228142= 0,5700
Korelasi antara ππ‘ dan ππ‘β2 atau autokorelasi untuk lag 2 adalah 0,5700.
Hal ini membuktikan bahwa terdapat autokorelasi pada data BS berdasarkan dua
kali periode lag. Variabel BS termasuk pada pola data tren, karena korelasinya
berturut-turut tinggi, koefisien autokorelasinya jauh dari nol namun berangsur-
angsur turun mendekati nol. Selanjutnya menghitung prediksi menggunakan pola data musiman Q-
NETT dengan melakukan perhitungan indeks musiman menggunakan
persamaan 6, seperti berikut pada Tabel 4.
Bulan Jumlah
Penjualan
Rata-
Rata
Penjualan
Presentase
terhadap
Total
Indeks
Musiman
Januari 188.678 37735,6 8,931985 107,1838
Februari 187.388 37477,6 8,870917 106,451
β¦
Total 422477,2 100 1200
Pada Tabel 4, dapat dilihat indeks musiman bulanan selama 5 tahun yang
digunakan untuk menghitung prediksi bulan berikutnya. Karena pada data time
series terakhir adalah data ke-60 maka dilakukan prediksi pada bulan selanjutnya
yaitu bulan ke-60. Berikut perkiraan penjualan bulanan Januari 2018 dengan
persamaan berikut ini:
π΅π’πππ =ππππππ ππ’π ππππ
1200Γ πππππππππ π‘πβπ’πππ (6)
Perkiraan tahunan merupakan perkiraan hasil penjualan tahun 2018 yang
diprediksi menggunakan tren. Perkiraan penjualan bulan Januari tahun 2018
menggunakan pola musiman sebagai berikut:
π½πππ’πππ =107,1838
1200Γ 148.654 = 13.277,7505
Tabel 4. Indeks musiman data Q-NETT
17
Dari persamaan yang ada, hasil dari perhitungan yang sudah dilakukan
untuk prediksi Januari 2018 atau bulan ke-61 variabel Q-NETT menggunakan
perhitungan pola data musiman adalah 13.277,7505.
Berikutnya menghitung prediksi menggunakan pola data tren pada data
Retur dengan Persamaan 2, 3, 4, dan 5. Berikut perhitungannya:
οΏ½Μ οΏ½ =β π¦
π=
1.438.701
60= 23.978,35
π‘Μ = β π‘
π=
1.830
60= 30,5
π =38349569β
1830.1438701
60
73810β(1830)2
60
=38349569β43880380,5
73810β55815=
β5530811,5
17995= β307,35
π = οΏ½Μ οΏ½ β ππ‘Μ = 23.978,35 β (β307,35). 30,5 = 33.352,525
Dari perhitungan di atas, didapatkan persamaan sebagai berikut:
οΏ½ΜοΏ½ = 33.352,525 β 307,35π‘ (7)
Bila dilakukan prediksi Retur bulan ke 61 menggunakan Persamaan 7,
maka diperkirakan hasilnya sebagai berikut:
οΏ½ΜοΏ½61 = 33.352,525 β 307,35π‘ = 33.352,525 β 307,35.61 = 14.604,175
Dari persamaan yang ada, hasil dari perhitungan yang sudah dilakukan
untuk prediksi bulan ke-61 variabel Retur menggunakan pola data tren adalah
14.604,175.
Berikutnya menghitung prediksi menggunakan pola data tren pada data
BS dengan Persamaan 2, 3, 4, dan 5. Berikut perhitungannya:
οΏ½Μ οΏ½ =β π¦
π=
577.152
60= 9.619,2
π‘Μ = β π‘
π=
1.830
60= 30,5
π =15269444β
1830.577152
60
73810β(1830)2
60
=15269444β17603136
73810β55815=
β2333692
17995= β129,685
π = οΏ½Μ οΏ½ β ππ‘Μ = 9.619,2 β (β129,685). 30,5 = 13.574,59
Dari perhitungan di atas, didapatkan persamaan sebagai berikut:
18
οΏ½ΜοΏ½ = 13.574,59 β 129,685π‘ (8)
Bila dilakukan prediksi BS bulan ke 61 menggunakan Persamaan 8, maka
diperkirakan hasilnya sebagai berikut:
οΏ½ΜοΏ½61 = 13.574,59 β 129,685π‘ = 13.574,59 β 129,685.61 = 5.663,805
Dari persamaan yang ada, hasil dari perhitungan yang sudah dilakukan
untuk prediksi bulan ke-61 variabel BS menggunakan pola data tren adalah
5.663,805.
Dari seluruh perhitungan yang telah dilakukan, dapat ditemukan analisa
dari koefisien autokorelasi bahwa semua data berkorelasi. Variabel Q-NETT
teridentifikasi masuk ke dalam pola data musiman, sedangkan variabel Retur dan
BS teridentifikasi masuk ke dalam pola data tren. Selain itu, berhasil diprediksi
data penjualan untuk bulan berikutnya menggunakan perhitungan pola data tren
dan musiman. Prediksi variabel Q-NETT, Retur, dan BS dilakukan agar
perusahaan dapat mengira-ngira penjualan yang akan dilakukan bulan
berikutnya berdasarkan data pada bulan-bulan sebelumnya. Selain itu dapat
dilihat pula jumlah Retur dan BS yang perubahannya sama sehingga diharapkan
barang Retur dan barang BS dapat diminimalisir. Diharapkan analisa dan
perhitungan yang ada dapat membantu perusahaan dalam melakukan prediksi
penjualan pada masa yang akan mendatang agar stock yang dikirim tidak tersisa
banyak sehingga membuat perusahaan merugi.
V. Kesimpulan
Dari semua perhitungan yang sudah dilakukan dapat ditarik kesimpulan,
Analisis Autokorelasi Variabel Data Monitoring Marketing (Time Series) di CV
Solofood Indonusa merupakan analisis yang dilakukan untuk mengolah data
time series agar dapat dilihat polanya dan dilakukan perhitungan tren dan
musiman untuk memprediksi data di waktu yang akan datang. Setelah dilakukan
perhitungan koefisien autokorelasi lag 1 dan lag 2, dapat dibuktikan bahwa pola
data tiap variabelnya memiliki korelasi. Data time series pada variabel Q-NETT
termasuk ke dalam pola data musiman, sedangkan variabel Retur dan BS
termasuk ke dalam pola data tren. Kemudian, dilihat dari perhitungan pola data
musiman, prediksi Q-NETT yang didapatkan untuk Januari 2018 atau bulan ke-
61 adalah 13.277,7505. Sedangkan dilihat dari perhitungan pola data tren,
prediksi Retur dan BS adalah masing-masing; 14.604,175 dan 5.663,805.
Artinya, seluruh data penjualan berhasil diprediksi dengan hasil yang masuk
akal. Hal itu berarti dapat dilakukan prediksi-prediksi lagi oleh perusahaan
menggunakan perhitungan yang telah dibuktikan. Selain itu, analisa terhadap
data time series juga berhasil dilakukan menggunakan koefisien autokorelasi.
Diharapkan analisis dan perhitungan prediksi ini dapat membantu perusahaan
dalam memprediksi Q-NETT atau penjualan di masa yang akan datang, Retur
atau barang yang dikembalikan dari area penjualan, dan BS atau barang yang
19
rusak/ kadaluarsa; dengan cara menyesuaikan kiriman ke tiap-tiap area sesuai
dengan prediksi yang sudah dihitung sehingga tidak dilakukan pengiriman
dengan jumlah yang asal.
Berdasarkan analisis yang telah dilakukan sudah mencapai tujuan,
namun masih terdapat kekurangan. Kekurangan yang terdapat pada penelitian
ini dapat dikembangkan pada penelitian lain. Saran yang dapat dilakukan
penelitian lain menggunakan data yang lebih banyak lagi atau kasus yang
berbeda, dan juga dapat menggunakan metode atau algoritma lainnya sehingga
hasil penelitian dapat lebih akurat lagi.
VI. Daftar Pustaka
[1]. Tanaka, M.,& Okutomi, M., 2014, A Novel Inference of a Restricted
Boltzmann Machine. Pattern Recognition (ICPR), 2014 22nd
International Conference, pp. 1526-1531.
[2]. Ambarwati, R., 2016, Analisis Data Time Series Menggunakan Model
Exponential Generalized Autoregressive Conditional
Heteroscedasticity (EGARCH) (1,1), 2.
[3]. Fathurahman, M., 2012, Metode Cochrane-Orcutt untuk Mengatasi
Autokorelasi pada Regresi Ordinary Least Squares. Samarinda:
Universitas Mulawarman.
[4]. Caraka, R.E., dkk, 2016, Time Series Analysis Using Copula Gauss and
AR(1)-N.GARCH(1,1), Media Statistika, Vol. 9, No. 1, Hal 1-13.
[5]. Zhang, Y., dkk, 2017, Forecasting Electric Vehicles Sales with
Univariate and Multivariate Time Series Models: The case of China.
Nanjing: School of Transportation, Southeast University.
[6]. Danukusumo, K.P., 2017, Implementasi Deep Learning Menggunakan
Convolutional Neural Network untuk Klasifikasi Citra Candi Berbasis
GPU. Yogyakarta: Universitas Atma Jaya.
[7]. Ashari, 2013, Penerapan Metode Time Series dalam Simulasi
Forecasting Perkembangan Akademik Mahasiswa. Makassar: SMIK
AKBA.
[8]. Makridakis, S.,& Wheelwright, S.C., 1999, Metode dan Aplikasi
Peramalan. Jakarta: Binarupa Aksara.
20
[9]. Mistry, K.,& Saluja, A., 2016, An Introduction to OpenCV Using
Python with Ubuntu, International Journal of Scientific Research in
Computer Science, Engineering and Information Technology (2456-
3307), Vol. 1, Issue 2, pp. 65-68.
[10]. Samuel, A., dkk, 2017, Fitur Pengkategorian Otomatis dari Gambar
Berbasis Web dengan Metode SURF dan Haar Cascade Classifiers.
Surabaya: UK Petra.
[11]. Yamin, S., dkk, 2011, Regresi dan Korelasi dalam Genggaman Anda.
Jakarta: Salemba Empat.
[12]. Choeroni, M., 2013, Grafik Pengendali Rata-Rata Bergerak dalam
Pengendalian Kecacatan Per Unit untuk Data yang Berautokorelasi.
Malang: UIN Maulana Malik Ibrahim.
[13]. Sugiyono, 2009, Metode Penelitian Pendidikan Pendekatan Kuantitatif,
Kualitatif, dan R&D. Bandung: Alfabet.
[14]. Prastyantoro, R, 2003, Evaluasi Lokasi SPP Wilayah Pos V dengan
Menggunakan Model Simulasi Komputer. Bandung: ITB.
[15]. Nabilugisni, 2013, Analisis Time Series, Harvard University, 4-7.