Analisis Autokorelasi Variabel Data Monitoring Marketing ... text.pdfAnalisis Autokorelasi Variabel...

Analisis Autokorelasi Variabel Data Monitoring Marketing

(Time Series) di CV Solofood Indonusa

Artikel Ilmiah

Peneliti:

Yordan Hiswari (672015256)

Radius Tanone, S.Kom., M.Cs.

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

Desember 2018

Lembar Persetujuan

Analisis Autokorelasi Variabel Data Monitoring Marketing

(Time Series) di CV Solofood Indonusa

Artikel Ilmiah

Peneliti :

Yordan Hiswari (672015256)

Telah Disetujui Untuk Diuji:

Tanggal :........................................

Radius Tanone, S.Kom., M.Cs.

Pembimbing

Pernyataan

Artikel Ilmiah berikut ini :

Judul : Analisis Autokorelasi Variabel Data Monitoring

Marketing (Time Series) di CV Solofood Indonusa

Pembimbing : Radius Tanone, S.Kom., M.Cs.

adalah benar hasil karya saya :

Nama : Yordan Hiswari

NIM : 672015256

Saya menyatakan tidak mengambil sebagian atau seluruhnya dari hasil karya

orang lain kecuali sebagaimana yang tertulis pada daftar pustaka.

Pernyataan ini dibuat dengan sebenar-benarnya sesuai dengan ketentuan yang

berlaku dalam penulisan karya ilmiah.

Salatiga, 12 Desember 2018

Yordan Hiswari

1

I. Pendahuluan

Perkembangan Teknologi Informasi saat ini dapat dirasakan oleh banyak

orang. Salah satunya, pemanfaatan teknologi informasi juga dapat dirasakan

oleh perusahaan untuk berbagai kepentingan. Perusahaan CV Solofood Indonusa

merupakan salah satu perusahaan yang bergerak dibidang bakery. Dalam

sebulan omset yang dihasilkan oleh perusahaan ini dapat mencapai angka

tertentu. Dalam menjalankan proses bisnisnya, perusahaan melakukan penjualan

roti dalam skala yang besar. Skala yang dimaksud adalah berdasarkan jumlah

produk dan jangkauan penjualan. Untuk kategori roti sendiri diproduksi dan

dijual dengan jenis yang bervariasi. Sedangkan untuk jangkauan penjualan,

daerah yang dijadikan target meliputi seluruh pulau Jawa. Dalam menjalankan

proses bisnisnya, berbagai pencatatan penjualan yang meliputi jumlah capaian

target perhari, perminggu dan perbulan dapat dianalisa oleh perusahaan. Hal

serupa juga dapat dilakukan pada analisa area jangkauan dari penjualan produk.

Data-data perusahaan ini membentuk data time series, yaitu data yang runtun

oleh waktu.

Dalam data perusahaan, data time series terdiri dari 7 variabel yaitu,

bulan, Q-NETT, Retur, Kiriman Lalu, BS (Bad Stock), Barang Bawaan Baru, dan

Kehilangan. Selama ini, permasalahan terbesar yang terjadi dalam perusahaan

adalah melesetnya jumlah kiriman barang dengan jumlah barang yang terjual,

sehingga perlu diperkirakan jumlah kiriman pada bulan yang akan datang agar

perusahaan tidak terus merugi. Dalam hal ini, perlu diperkirakan prediksi untuk

variabel Q-NETT (barang yang terjual), Retur (barang yang kembali), dan BS

(barang rusak/ kadaluarsa).

Dalam melakukan analisa, data yang diolah begitu besar karena jumlah

produk dan area jangkauan penjualan semakin besar dari waktu ke waktu. Selain

itu, adanya data time series perusahaan yang selama ini belum maksimal

dianalisa. Proses analisa yang biasa-biasa saja tidak dapat dilakukan lagi,

misalnya saja untuk melakukan analisa prediksi keuntungan pada area jangkauan

baru atau pemasaran produk baru di waktu tertentu. Akan sulit jika hanya

menggunakan perhitungan manual atau menggunakan tools seperti excel.

Disamping itu, perusahaan sangat perlu melakukan perhitungan prediksi atas

penjualan agar dapat menyesuaikan situasi dan lokasi pemasaran dan perusahaan

tidak merugi. Melihat permasalahan yang ada, maka pengembangan data yang

semakin bertambah dari waktu ke waktu dapat dimaksimalkan dengan

memanfaatkan teknologi seperti machine learning. Machine learning atau

pembelajaran mesin merupakan pendekatan dalam AI yang banyak digunakan

untuk menggantikan atau menirukan perilaku manusia untuk menyelesaikan

masalah atau melakukan otomatisasi. Sesuai namanya, Machine Learning

mencoba menirukan bagaimana proses manusia atau makhluk cerdas belajar dan

men-generalisasi[1].

Rumusan masalah pada penelitian ini adalah bagaimana membantu

proses pengolahan data menggunakan metode autokorelasi di CV Solofood

Indonusa dengan data time series, yaitu data-data yang nilai variabelnya

berurutan menurut waktu. Selain itu, bagaimana membantu perusahaan

2

memprediksi penjualan di masa yang akan datang dilihat dari variabel Q-NETT,

Retur, dan BS. Adapun tujuan dan manfaat dari penelitian ini yaitu membantu

perusahaan dalam melakukan analisa terhadap data dengan jumlah yang besar

dengan data time series menggunakan bahasa pemrograman Python dan

membantu perusahaan memprediksi hasil penjualan di masa yang akan datang

dengan mengacu pada hasil prediksi ketiga variabel, Q-NETT, Retur, dan BS.

Data yang dianalisa berupa data penjualan dan area penjualan setiap hari,

minggu dan bulan dalam beberapa tahun terakhir.

II. Tinjauan Pustaka

Penelitian terdahulu yang berkaitan dengan penelitian data time series

berjudul “Analisis Data Time Series Menggunakan Model Exponential

Generalized Autoregressive Conditional Heteroscedasticity (EGARCH) (1,1)”.

Tujuan dari penelitian ini adalah untuk mendapatkan model EGARCH yang

terbaik dan untuk meramalkan data mingguan harga saham PT. Tambang Batu

Bara Bukit Asam Tbk. dari Januari 2009 sampai Februari 2016. Model terbaik

yang diperoleh untu data tersebut adalah model ARIMA (1,1,0) dan EGARCH

(1,1). Hasil ramalan untuk empat periode berikutnya sangat baik dan semua nilai

berada di dalam interval konfidensi 95%[2].

Penelitian lainnya berjudul “Metode Cochrane-Orcutt untuk Mengatasi

Autokorelasi pada Regresi Ordinary Least Squares”. Penelitian ini membahas

dalam pemodelan kuadrat terkecil biasa (OLS), salah satu asumsi penting adalah

variabel eror yang tidak berkorelasi atau tidak memiliki autokorelasi. Tujuan dari

penelitian ini adalah menyelidiki metode Cochrane-Orcutt untuk solusi

autokorelasi dalam regresi OLS dan diterapkan pada data perbankan. Hasilnya

menunjukkan bahwa metode Cochrane-Orcutt dapat digunakan sebagai solusi

autokorelasi dalam regresi OLS dan diterapkan pada data perbankan[3].

Penelitian lain berjudul “Time Series Analysis Using Copula Gauss and

AR(1)-N.GARCH(1,1)”. Prediksi menggunakan Copula ini dibangun atas tiga

hal penting yaitu fungsi distribusi marjinal, fungsi kernel, dan fungsi Copula.

Dalam hal ini, digunakan Copula Gaussian untuk menghubungkan data yang

berkorelasi dengan waktu dan dengan himpunan data lainnya (dalam hal ini data

return harga saham SP100 dan SP600)[4].

Penelitian lainnya berjudul “Forecasting Electric Vehicles Sales with

Univariate and Multivariate Time Series Models: The Case of China”.

Penelitian ini menyajikan analisis spektrum tunggal (SSA) sebagai model

univariate time series dan model autoregresif vektor (VAR) sebagai model

multivariate. Hasil empiris menunjukkan bahwa secara memuaskan SSA

mengindikasi tren yang berkembang dan memberikan hasil yang masuk akal.

Model VAR, yang terdiri ddari parameter eksogen yang terkait dengan pasar

setiap bulan, dapat secara signifikan meningkatkan akurasi prediksi[5].

Berbeda dengan penelitian sebelumnya, dalam penelitian ini hanya akan

menganalisis grafik dari olahan data time series menggunakan bahasa

pemrograman Python (Anaconda) lalu dilihat korelasi tiap variabelnya atau pola

3

yang terdapat pada data time series menggunakan metode autokorelasi untuk

prediksi penjualan di masa yang akan datang. Data time series diolah

menggunakan bahasa pemrograman Python (Anaconda) sehingga menghasilkan

grafik-grafik yang dapat dianalisis perubahannya dari bulan ke bulan.

Kemudian, korelasi tiap variabelnya akan diperhitungkan dengan menggunakan

metode autokorelasi dan dilihat pola data yang terdapat pada tiap variabel lalu

dilakukan prediksi. Variabel-variabel yang akan dianalisis ini diharapkan dapat

membantu perusahaan dalam memprediksi jumlah barang yang akan dikirim

sehingga dapat menekan barang retur dan barang BS (Bad Stock) sehingga

perusahaan tidak merugi.

- Machine Learning

Machine Learning adalah serangkaian teknik yang dapat membantu

dalam menangani dan memprediksi data yang sangat besar dengan cara

mempresentasikan data-data tersebut dengan algoritma pembelajaran. Machine

learning dapat membuat komputer memprogram diri mereka sendiri. Jika

pemrograman adalah pekerjaan untuk membuat otomasi, maka Machine

Learning mengotomatisasi proses otomasi. Pada dasarnya Machine Learning

membiarkan data melakukan pekerjaan[6].

- Data Time Series

Data time series merupakan suatu deskripsi masa lampau dan digunakan

untuk meramalkan masa depan, artinya kita berharap masa depan dapat

dijelaskan dengan informasi yang ada pada masa lampau. Kalau memang hal

ini yang terjadi, kita dapat menawarkan suatu model matematik yang mampu

merepresentasikan proses terjadinya data time series tersebut. Kemudian, kita

gunakan model matematik ini untuk membuat suatu ramalan tentang masa

depan[7]. Dalam pemodelan time series, sebagian data yang diketahui dapat

digunakan untuk meramalkan sisa data berikutnya sehingga memungkinkan

orang untuk mempelajari ketepatan peramalan[8].

- Python (Anaconda)

Python adalah bahasa pemrograman multiplatform yang open source,

yang terinterpretasi oleh typing dinamis dan kuat serta memiliki library yang

banyak juga seperti struktur data, multithreading, files, dan jaringan[9].

Keuntungan utama yang ditawarkan oleh bahasa pemrograman Python adlaah

memiliki alat simulasi python gratis. Memang, bahasa yang Open source, dapat

diimplementasikan dengan mudah seperti membuat model client-server untuk

dites, dan pemrograman dengan menggunakan web browser[10].

- Autocorrelation

Autokorelasi dapat didefinisikan sebagai korelasi antara nilai-nilai

pengamatan yang terurut dalam waktu. Autokorelasi sering terjadi pada deret

waktu (time series) karena suatu pengamatan dalam jenis data ini biasanya

dipengaruhi oleh data sebelumnya[11]. Autokorelasi berkaitan dengan

hubungan antara nilai-nilai yang berurutan dari variabel yang sama. Dengan

demikian terlihat adanya perbedaan antara autokorelasi dengan korelasi yang

mana sama-sama mengukur derajat keeratan hubungan. Korelasi mengukur

4

derajar keeratan hubungan di antara dua variabel yang berbeda, sedangkan

autokorelasi mengukur derajat hubungan di antara nilai-nilai yang berurutan

pada variabel yang sama atau pada variabel itu sendiri[12].

III. Metodologi Penelitian

Penelitian ini menggunakan 8 langkah model pengembangan menurut

Sugiyono (2008:289) yang ditunjukkan pada Gambar 1[13] berikut ini:

Tahapan Penelitian pada Gambar 1 dapat dijelaskan sebagai berikut:

1. Potensi dan Masalah

Penelitian selalu dibuat karena adanya potensi permasalahan yang

terjadi di lapangan. Berdasarkan wawancara yang dilakukan dengan

direktur utama dari perusahaan CV Solofood Indonusa, Bapak Widi

Nugraha, diketahui permasalahan terbesar yang terjadi di perusahaan

adalah mengenai keterbatasan pengelolaan data yang sangat besar. Hal

tersebut menghambat penganalisaan terharap variabel-variabel yang ada

Potensi dan Masalah

Pengumpulan Data

Desain Produk

Revisi Desain

Uji Coba Pemakaian

Revisi Produk

Validasi Desain

Gambar 1. Metode Penelitian[13]

Uji Coba Produk

5

pada data karena sejauh ini perusahaan masih menggunakan tools dari

Ms.Office yaitu Ms.Excel. Pembuatan data saja memakan waktu yang

sangat lama sehingga perusahaan tidak dapat menganalisa dan

memahami dengan baik data yang telah dibuat. Penelitian ini digunakan

untuk membantu perusahaan CV Solofood Indonusa dalam mengelola

data yang sangat besar dan menganalisa variabel yang ada dan hubungan

antar variabel pada data.

2. Pengumpulan Data

Pengumpulan data dilakukan dengan cara wawancara dengan

direktur utama perusahaan CV Solofood Indonusa, membaca berbagai

literatur, jurnal, dan browsing internet mengenai topik yang diangkat

dalam penelitian ini.

3. Desain Produk

Langkah-langkah mengelola data monitoring marketing dan

menganalisa menggunakan metode autokorelasi dapat ditunjukkan pada

gambar berikut ini:

Berikut ini merupakan penjelasan dari tahap-tahap desain produk:

a. Penelitian ini mengelola data perusahaan yang sangat besar

menggunakan bahasa pemrograman Python (Anaconda) dengan

menyesuaikan format .csv sehingga didapatkan hasil pengelolaan

data dalam bentuk grafik.

b. Pada tahap selanjutnya, grafik yang muncul dipelajari hubungan

antar variabelnya dan pola tiap variabelnya sehingga dapat

disesuaikan dengan permasalahan pada perusahaan, misal

penekanan kiriman penjualan agar perusahaan tidak merugi

banyak.

c. Tahap ini dilakukan hitungan pada data time series menggunakan

metode autokorelasi pada tiap variabelnya, kemudian dilihat

polanya.

4. Validasi Desain

Pada tahap validasi desain dilakukan suatu penilaian pada analisa

yang telah dibuat, apakah sesuai dengan kenyataannya yang terjadi di

perusahaan. Kemudian dilakukan penyesuaian pada teori-teori yang ada.

Mengelola data dengan Anaconda (Python)

Mempelajari Hubungan antar Variabel melalui Grafik Hasil Pengelolaan Data

Melihat pola pada data time series menggunakan Metode Autokorelasi

Gambar 2. Tahap-Tahap Desain Produk

6

5. Revisi Desain

Setelah hasil analisa selesai divalidasi, maka akan terlihat kelemahan

dari analisa yang sudah dibuat, sehingga perlu diubah/ direvisi.

Kemudian hasil analisa akan diperbaiki lagi.

6. Uji Coba Pemakaian

Setelah dilakukan revisi desain, maka akan dilakukan uji coba hasil

analisa dengan menyelesaikan permasalahan nyata pada perusahaan

7. Revisi Produk

Revisi produk akan dilakukan apabila dalam uji coba pemakaian

ditemukan lagi kelemahan-kelemahan dari hasil analisa yang perlu

diperbaiki agar hasil analisa dapat disempurnakan lagi.

8. Uji Coba Produk

Tahap terakhir adalah uji coba produk atas revisi produk yang

terakhir kali dilakukan. Dari hasil analisa yang telah melalui banyak

tahap revisi, diharapkan dapat membantu perusahaan dalam mengamati

keluar masuknya barang.

Pengolahan data time series dalam bentuk .csv dengan bahasa

pemrograman Python diawali seperti Gambar 3.

Pada Code 1 ditunjukkan pengolahan data diawali dengan import

packages: numpy, pandas, matplotlib, dan seaborn. Import numpy digunakan

untuk operasi vektor dan matriks, import pandas berperan sebagai spreadsheet

yang memiliki fitur seperti SQL namun tidak memiliki GUI, import matplotlib

digunakan untuk memvisualisasikan data agar lebih rapi, dan import seaborn

digunakan untuk memvisualisasikan data statistik berdasarkan matplotlib (high-

level interface). Setelah melakukan import packages, dilakukan import data

seperti pada Code 2.

Pada Code 2 ditunjukkan import data .csv dengan .read_csv(). Lalu

dilakukan pengecekan beberapa baris awal dengan .head(). Skriprows dilakukan

untuk skip baris pertama (nama variabel) untuk menunjukkan data yang pertama.

Code 1. Import Packages

Code 2. Import Data

7

Pada Code 3 dapat dilihat output dari import data yang menunjukkan

variabel-variabel pada data time series. Kemudian dapat digunakan .info() untuk

mengecek tipe data, jumlah baris, dan lain sebagainya seperti pada Code 4.

Pada Code 4, dapat dilihat info dari data time series yang sudah diimport

menggunakan .info(), yaitu jumlah kolom: 7, jumlah baris: 60, nama-nama

variabel: bulan, Q-NETT, Retur, Kiriman Lalu, BS, Barang Bawaan Baru,

Kehilangan, dan tipe data: float. Kemudian untuk menamai kolom (Data

Wrangle) dengan nama-nama variabel perlu memanggil DataFrame (df) seperti

coding pada Code 5 berikut ini.

Pada Code 5 dilakukan penamaan kolom dengan perintah df.columns dan

setiap kolom dinamai sesuai variabel tiap datanya, sedangkan df.head()

dilakukan untuk memeriksa kembali hasilnya. Berikut outputnya dapat dilihat

pada Code 6.

Code 3. Output Import Data

Code 4. Output .info()

Code 5. Data Wrangle

8

Pada Code 6, terlihat Output dari Data Wrangle, yaitu hasil dari

penamaan kolom tiap variabel data: month, Q-NETT, Retur, Kiriman Lalu, BS,

Barang Bawaan Baru, dan Kehilangan.

Selanjutnya, dilakukan Exploratory Data Analysis (EDA) atau yang biasa

disebut analisis data eksploratif, yaitu metode eksplorasi data menggunakan

teknik aritmatika sederhana dan grafis dengan cara seperti Code 7.

Pada Code 7, .plot() digunakan untuk menjadikan 7 plot baris menjadi 1

gambar (satu untuk setiap kolom, yaitu ‘month’, ‘Q-NETT’, ‘retur’, ‘kiriman

lalu’, ‘BS’, ‘barang bawaan baru’, ‘kehilangan’). Figsize, linewidth, dan fontsize

digunakan untuk menetapkan ukuran gambar, lebar garis dan ukuran font

masing-masing plot. Untuk membuat plot menjadi lebih akurat, label pada

sumbu x ditentukan menjadi ‘Year’, dan ukuran font menjadi 20.

Pada data time series, sering ditemukan korelasi antar variabel. Ukuran

yang biasa digunakan dalam korelasi adalah koefisien autokorelasi. Pola data

dan juga komponen seperti tren dan musiman dapat di pelajari menggunakan

autokorelasi. Berikut rumus koefisien autokorelasi[14]:

𝑟𝑘 =∑ (𝑌𝑡−�̅�)(𝑌𝑡−𝑘−�̅�)𝑛

𝑡=𝑘+1

∑ (𝑌𝑡−�̅�)2𝑛𝑡=1

, k= 0, 1, 2, …

(1)

Keterangan:

𝑟𝑘 = koefisien autokorelasi

�̅� = mean dari data observasi

𝑌𝑡 = observasi pada periode waktu t

𝑌𝑡−𝑘 = observasi k (periode waktu sebelumnya)

Selanjutnya mengidentifikasi pola data tren dan musiman pada data time

series. Pada pola data tren, korelasinya berturut-turut tinggi, koefisien

autokorelasinya jauh dari nol namun berangsur-angsur turun mendekati nol.

Code 7. Exploratory Data Analysis (EDA)

Code 6. Output Data Wrangle

9

Sedangkan pada pola data musiman, koefisien autokorelasi akan meningkat

pada lag waktu musiman. Pola data tren dapat dicari dengan rumus sebagai

berikut[15]:

�̂� = 𝑎 + 𝑏𝑡 (2)

Keterangan:

�̂� = data time series yang akan diperkirakan

𝑡 = variabel waktu

𝑎 𝑑𝑎𝑛 𝑏 = konstanta dan koefisien

𝑎 𝑑𝑎𝑛 𝑏 dapat dicari menggunakan rumus:

𝑎 = �̅� − 𝑏𝑡̅ (3)

�̅� =∑ 𝑦

𝑛 dan 𝑡̅ =

∑ 𝑡

𝑛

(4)

𝑏 =∑ 𝑡𝑦−

∑ 𝑡 ∑ 𝑦

𝑛

∑ 𝑡2−(∑ 𝑡)2

𝑛

(5)

Sedangkan untuk pola data musiman dapat dicari dengan metode rata-

rata sederhana. Pertama, mencari nilai rata-rata data time series tiap bulannya,

lalu dicari besaran presentase terhadap total jumlah nilai rata-rata (total jumlah

nilai rata-rata dipresentasekan menjadi 100). Indeks pola data musiman dapat

dilihat dengan cara mengkalikan besaran presentase masing-masing bulan

dengan konstanta 12. Rumus pola data musiman sebagai berikut[15]:

𝐵𝑢𝑙𝑎𝑛 =𝑖𝑛𝑑𝑒𝑘𝑠 𝑚𝑢𝑠𝑖𝑚𝑎𝑛

1200× 𝑝𝑒𝑟𝑘𝑖𝑟𝑎𝑎𝑛 𝑡𝑎ℎ𝑢𝑛𝑎𝑛 (6)

IV. Hasil dan Pembahasan

Pada pengolahan data monitoring marketing CV Solofood Indonusa

dilakukan pengolahan data besar menjadi format .csv.

10

Pada Gambar 3, ditunjukkan data monitoring marketing yang telah

diubah dalam format .csv. Dalam data yang akan diolah ini terdapat beberapa

variabel, yaitu variabel bulan, dimana data yang akan diolah merupakan data

perusahaan dari bulan Januari 2013 sampai dengan Desember 2017. Selanjutnya,

terdapat variabel Q-NETT, artinya banyaknya barang yang sudah terjual di

pasaran tiap bulannya. Variabel selanjutnya adalah Retur, artinya banyaknya

barang yang kembali/ tidak terjual tiap bulannya. Kemudian, terdapat variabel

Kiriman Lalu, yang artinya semua barang yang telah dikirim/ distock ke berbagai

area oleh perusahaan. Variabel BS (Bad Stock) merupakan barang retur yang

mengalami kerusakan, hancur, ataupun kadaluarsa sehingga tidak dapat

dipasarkan lagi. Kemudian variabel Barang Bawaan Baru, merupakan barang

yang dikirim/ distock lagi untuk stock untuk bulan ke depannya. Dan variabel

terakhir yaitu variabel Kehilangan, merupakan kehilangan barang yang

terdeteksi oleh perusahaan.

Berdasarkan data time series yang telah diolah dengan Python, banyak

grafik yang dimunculkan untuk menganalisis pola data penjualan dari tahun ke

tahun. Hal ini dilakukan untuk melihat pola data time series agar dapat dianalisis

prediksi penjualan untuk bulan-bulan dan tahun-tahun yang akan datang.

Grafik pertama dapat ditunjukkan melalui Gambar 4.

Gambar 3. Data monitoring marketing dalam format .csv

11

Pada Gambar 4 dapat dilihat bahwa pada sumbu x yang tertera bukanlah

bulan melainkan tahun, seperti yang disarankan oleh default label. Angka pada

grafik mewakili jumlah tiap-tiap variabel terhadap titik tertinggi terhadap bagan

waktu tertentu. Pada grafik keseluruhan ini dapat dilihat perbandingan seluruh

variabel yaitu ‘Q-NETT’ (barang yang terjual), ‘Retur’ (barang yang kembali/

tidak terjual), ‘Kiriman Lalu’ (barang yang dijual/ dipasarkan), ‘BS’ (barang

hancur/ kadaluarsa), ‘Barang Bawaan Baru’ (barang yang dijual/ dipasarkan

bulan selanjutnya), dan ‘Kehilangan’ (kehilangan barang/ pencurian). Dapat

dilihat awal penjualan barang cukup tinggi, barang yang terjual juga cukup

tinggi, jadi dapat disimpulkan barang retur tidak terlalu banyak. Namun pada

pertengahan 2013 tepatnya Juli 2013, barang yang dijual/ dipasarkan turun

hampir setengah kali daripada sebelumnya, hal ini bisa jadi dikarenakan oleh

penyesuaian yang dilakukan pada bulan puasa. Pada Agustus 2013, barang

dipasarkan paling banyak bila dibandingkan bulan sebelumnya, hal ini mungkin

dikarenakan menyesuaikan momen lebaran. Namun barang yang terjual tidak

sesuai ekspektasi sehingga pada bulan berikutnya barang yang dipasarkan terus

menurun karena barang yang terjualpun terus menurun. Kemudian pada tahun

2014 dan seterusnya kasusnya sama, barang yang terjual terus menurun sehingga

barang yang dipasarkan juga diturunkan agar tidak banyak merugi karena barang

returnya meningkat. Akhirnya pada akhir tahun 2017, terjadi penurunan

penjualan barang yang sangat signifikan dari bulan dan tahun-tahun sebelumnya.

Grafik BS menunjukkan barang hancur/kadaluarsa kira-kira seperempat sampai

setengah dari barang retur (barang yang kembali/ tidak terjual) dan jumlah

barang bawaan baru selalu menyesuaikan penjualan bulan sebelumnya.

Selanjutnya, direncanakan satu kolom plot dengan sendirinya untuk

melihat plot tersebut melalui rangkaian waktu. Berikut ini perencanaan kolom

Q-NETT, Retur, dan BS melalui Python.

df[[‘Q-NETT’]].plot(figsize=(20,10), linewidth=5, fontsize=20)

plt.xlabel(‘Year’, fontsize=20);

Gambar 4. Grafik Hasil EDA

12

df[[‘Retur’]].plot(figsize=(20,10), linewidth=5, fontsize=20)


df[[‘BS’]].plot(figsize=(20,10), linewidth=5, fontsize=20)


Pada Code 8, Code 9, dan Code 10 di atas, df[[‘Variabel’]] digunakan

untuk memplot dan merencanakan 1 variabel untuk 1 grafik berdasarkan

rangkaian waktu, yaitu variabel Q-NETT, Retur, dan BS. Figsize, linewidth, dan

fontsize digunakan untuk menetapkan ukuran gambar, lebar garis dan ukuran

font masing-masing plot. Untuk membuat plot menjadi lebih akurat, label pada

sumbu x ditentukan menjadi ‘Year’, dan ukuran font menjadi 20.

Hasil grafik perencanaan kolom‘Q-NETT’ dapat dilihat pada Gambar 5.

Variabel Q-NETT menunjukkan jumlah barang yang terjual. Pada Gambar 5

dapat dilihat perubahan jumlah barang yang terjual dari tahun ke tahun semakin

menurun. Awalnya pada tahun 2013 masih tinggi, namun mulai tahun 2014

terjadi penurunan sangat signifikan hingga akhirnya pada tahun 2015 penjualan

cukup stabil. Hingga terjadi penurunan lagi pada tahun 2016 sampai 2017.

Gambar 5. Grafik Variabel Q-NETT

Code 8. Plot kolom Q-NETT

Code 9. Plot kolom Retur

Code 10. Plot kolom BS

13

Selanjutnya, hasil perencanaan kolom Retur dapat dilihat pada Gambar

6. Variabel Retur menunjukkan barang yang dikembalikan ke pabrik dari area

penjualan. Bila dilihat pada Gambar 6, perubahan barang Retur selama data 60

bulan pernah mengalami penurunan signifikan. Hal tersebut sangat mungkin ada

hubungannya dengan turunnya barang yang terjual bila dilihat dari grafik Q-

NETT dari tahun ke tahun. Dari bulan pertama sampai bulan ke-30, barang Retur

cukup stabil tinggi, hingga setelah bulan ke-30 barang Retur mengalami

penurunan secara signifikan sampai bulan ke-45. Setelah itu, barang Retur

mengalami kenaikan lagi sampai tahun 2017 namun tidak setinggi awal bulan

sampai bulan ke-30.

Pada Gambar 7, dapat dilihat hasil perencanaan kolom BS. Variabel BS

(Bad Stock) menunjukkan barang Retur yang mengalami kerusakan atau

kadaluarsa. Dari Gambar 7, terlihat perubahan grafik BS tidak jauh berbeda

dengan perubahan grafik Retur. Pada awal bulan cenderung stabil hingga bulan

ke-30, setelah bulan ke-30 sempat mengalami kenaikan hingga bulan ke-35

Gambar 6. Grafik Variabel Retur

Gambar 7. Grafik Variabel BS

14

mengalami penurunan drastis hingga bulan ke-45. Selanjutnya berangsur-angsur

naik kembali hingga bulan ke-60.

Untuk mengetahui apakah data time series saling berkorelasi, maka perlu

dicari koefisien autokorelasi menggunakan Persamaan (1). Data time series

pertama yang akan dihitung koefisien autokorelasinya yaitu Q-NETT,

perhitungan lag 1 ditunjukkan pada Tabel 1.

Waktu

(t) Yt 𝒀𝒕−𝟏 (Yt - �̅�) (𝒀𝒕−𝟏 − �̅�) (𝒀𝒕 − �̅�)𝟐

(Yt - �̅�) (𝒀𝒕−𝟏 − �̅�)

1 63.114 - 27.907,60 - 3983376996 -

2 60.590 63.114 25.383,60 27.907,60 3671148100 708395355

…

Total 2.112.386 2,00 86866984146 6490082273

Pada Tabel 1 dilakukan perhitungan koefisien autokorelasi pada lag 1

untuk data Q-NETT dengan tujuan melihat apakah ada korelasi dalam data Q-

NETT sehingga akhirnya dapat dihitung prediksi untuk bulan ke depannya.

�̅� = 2.112.386

60= 35.206,40

Koefisien korelasi lag 1 (𝑟1) dihitung menggunakan total pada Tabel 1

dengan Persamaan 1.

𝑟1 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−1 − �̅�)𝑛

𝑡=1+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=6490082273

86866984146= 0,0747

Korelasi antara 𝑌𝑡 dan 𝑌𝑡−1 atau autokorelasi dari satu periode

sebelumnya adalah 0,0747. Sedangkan korelasi pada lag 2 atau autokorelasi

antara 𝑌𝑡 dan 𝑌𝑡−2 menggunakan Persamaan 1 adalah sebagai berikut.

𝑟2 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−2 − �̅�)𝑛

𝑡=2+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=7444264310

86866984146= 0,0857

Korelasi antara 𝑌𝑡 dan 𝑌𝑡−2 atau autokorelasi untuk lag 2 adalah 0,0857.

Hal ini membuktikan bahwa terdapat autokorelasi pada data Q-NETT

berdasarkan dua kali periode lag. Variabel Q-NETT termasuk pada pola data

musiman, karena koefisien autokorelasinya meningkat pada lag waktu musiman.

Selanjutnya, dibuktikan apakah terdapat korelasi pada data time series

‘Retur’ dengan menghitung koefisien autokorelasi data pada Tabel 2 berikut ini.

Bulan Retur (Yt)

(data original)

𝒀𝒕−𝟏

(Y lagged periode

pertama)

𝒀𝒕−𝟐

(Y lagged periode

kedua)

Tabel 1. Perhitungan koefisien autokorelasi pada lag 1 untuk

data Q-NETT.

15

Jan-13 28.728

Feb-13 27.142 28.728

Mar-13 29.863 27.142 28.728

…

Tabel 2 menunjukkan data ‘Retur’ untuk diolah dan dicari adakah

korelasinya menggunakan perhitungan koefisien autokorelasi sehingga akhirnya

dapat dicari prediksi untuk bulan ke depannya. Dari data ‘Retur’ pada Tabel 2,

dilakukan perhitungan koefisien autokorelasi lag 1 sebagai berikut:

𝑟1 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−1 − �̅�)𝑛

𝑡=1+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=3499546521

4475961872= 0,7818




𝑟2 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−2 − �̅�)𝑛

𝑡=2+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=2959480474

4475961872= 0,6612


Hal ini membuktikan bahwa terdapat autokorelasi pada data Retur berdasarkan

dua kali periode lag. Variabel Retur termasuk pada pola data tren, karena

korelasinya berturut-turut tinggi, koefisien autokorelasinya jauh dari nol namun

berangsur-angsur turun mendekati nol. Selanjutnya, dibuktikan apakah terdapat korelasi pada data time series

‘BS’ dengan menghitung koefisien autokorelasi data pada Tabel 3 berikut ini.

Bulan BS (Yt)

(data original)

𝒀𝒕−𝟏

(Y lagged periode

pertama)

𝒀𝒕−𝟐

(Y lagged periode

kedua)

Jan-13 11.634

Feb-13 9.574 11.634

Mar-13 11.089 9.574 11.634

…

Tabel 3 menunjukkan data ‘BS’ untuk diolah dan dicari adakah

korelasinya menggunakan perhitungan koefisien autokorelasi sehingga akhirnya

dapat dicari prediksi untuk bulan ke depannya. Dari data ‘BS’ pada Tabel 3,

dilakukan perhitungan koefisien autokorelasi lag 1 sebagai berikut:

Tabel 2. Data Retur

Tabel 3. Data BS

16

𝑟1 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−1 − �̅�)𝑛

𝑡=1+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=852632770

1245228142= 0,6847




𝑟2 =∑ (𝑌𝑡 − �̅�)(𝑌𝑡−2 − �̅�)𝑛

𝑡=2+1

∑ (𝑌𝑡 − �̅�)2𝑛𝑡=1

=709795034

1245228142= 0,5700


Hal ini membuktikan bahwa terdapat autokorelasi pada data BS berdasarkan dua

kali periode lag. Variabel BS termasuk pada pola data tren, karena korelasinya

berturut-turut tinggi, koefisien autokorelasinya jauh dari nol namun berangsur-

angsur turun mendekati nol. Selanjutnya menghitung prediksi menggunakan pola data musiman Q-

NETT dengan melakukan perhitungan indeks musiman menggunakan

persamaan 6, seperti berikut pada Tabel 4.

Bulan Jumlah

Penjualan

Rata-

Rata

Penjualan

Presentase

terhadap

Total

Indeks

Musiman

Januari 188.678 37735,6 8,931985 107,1838

Februari 187.388 37477,6 8,870917 106,451

…

Total 422477,2 100 1200

Pada Tabel 4, dapat dilihat indeks musiman bulanan selama 5 tahun yang

digunakan untuk menghitung prediksi bulan berikutnya. Karena pada data time

series terakhir adalah data ke-60 maka dilakukan prediksi pada bulan selanjutnya

yaitu bulan ke-60. Berikut perkiraan penjualan bulanan Januari 2018 dengan

persamaan berikut ini:

𝐵𝑢𝑙𝑎𝑛 =𝑖𝑛𝑑𝑒𝑘𝑠 𝑚𝑢𝑠𝑖𝑚𝑎𝑛

1200× 𝑝𝑒𝑟𝑘𝑖𝑟𝑎𝑎𝑛 𝑡𝑎ℎ𝑢𝑛𝑎𝑛 (6)

Perkiraan tahunan merupakan perkiraan hasil penjualan tahun 2018 yang

diprediksi menggunakan tren. Perkiraan penjualan bulan Januari tahun 2018

menggunakan pola musiman sebagai berikut:

𝐽𝑎𝑛𝑢𝑎𝑟𝑖 =107,1838

1200× 148.654 = 13.277,7505

Tabel 4. Indeks musiman data Q-NETT

17

Dari persamaan yang ada, hasil dari perhitungan yang sudah dilakukan

untuk prediksi Januari 2018 atau bulan ke-61 variabel Q-NETT menggunakan

perhitungan pola data musiman adalah 13.277,7505.

Berikutnya menghitung prediksi menggunakan pola data tren pada data

Retur dengan Persamaan 2, 3, 4, dan 5. Berikut perhitungannya:

�̅� =∑ 𝑦

𝑛=

1.438.701

60= 23.978,35

𝑡̅ = ∑ 𝑡

𝑛=

1.830

60= 30,5

𝑏 =38349569−

1830.1438701

60

73810−(1830)2

60

=38349569−43880380,5

73810−55815=

−5530811,5

17995= −307,35

𝑎 = �̅� − 𝑏𝑡̅ = 23.978,35 − (−307,35). 30,5 = 33.352,525

Dari perhitungan di atas, didapatkan persamaan sebagai berikut:

�̂� = 33.352,525 − 307,35𝑡 (7)

Bila dilakukan prediksi Retur bulan ke 61 menggunakan Persamaan 7,

maka diperkirakan hasilnya sebagai berikut:

�̂�61 = 33.352,525 − 307,35𝑡 = 33.352,525 − 307,35.61 = 14.604,175


untuk prediksi bulan ke-61 variabel Retur menggunakan pola data tren adalah

14.604,175.

Berikutnya menghitung prediksi menggunakan pola data tren pada data

BS dengan Persamaan 2, 3, 4, dan 5. Berikut perhitungannya:

�̅� =∑ 𝑦

𝑛=

577.152

60= 9.619,2

𝑡̅ = ∑ 𝑡

𝑛=

1.830

60= 30,5

𝑏 =15269444−

1830.577152

60

73810−(1830)2

60

=15269444−17603136

73810−55815=

−2333692

17995= −129,685

𝑎 = �̅� − 𝑏𝑡̅ = 9.619,2 − (−129,685). 30,5 = 13.574,59

Dari perhitungan di atas, didapatkan persamaan sebagai berikut:

18

�̂� = 13.574,59 − 129,685𝑡 (8)

Bila dilakukan prediksi BS bulan ke 61 menggunakan Persamaan 8, maka

diperkirakan hasilnya sebagai berikut:

�̂�61 = 13.574,59 − 129,685𝑡 = 13.574,59 − 129,685.61 = 5.663,805


untuk prediksi bulan ke-61 variabel BS menggunakan pola data tren adalah

5.663,805.

Dari seluruh perhitungan yang telah dilakukan, dapat ditemukan analisa

dari koefisien autokorelasi bahwa semua data berkorelasi. Variabel Q-NETT

teridentifikasi masuk ke dalam pola data musiman, sedangkan variabel Retur dan

BS teridentifikasi masuk ke dalam pola data tren. Selain itu, berhasil diprediksi

data penjualan untuk bulan berikutnya menggunakan perhitungan pola data tren

dan musiman. Prediksi variabel Q-NETT, Retur, dan BS dilakukan agar

perusahaan dapat mengira-ngira penjualan yang akan dilakukan bulan

berikutnya berdasarkan data pada bulan-bulan sebelumnya. Selain itu dapat

dilihat pula jumlah Retur dan BS yang perubahannya sama sehingga diharapkan

barang Retur dan barang BS dapat diminimalisir. Diharapkan analisa dan

perhitungan yang ada dapat membantu perusahaan dalam melakukan prediksi

penjualan pada masa yang akan mendatang agar stock yang dikirim tidak tersisa

banyak sehingga membuat perusahaan merugi.

V. Kesimpulan

Dari semua perhitungan yang sudah dilakukan dapat ditarik kesimpulan,

Analisis Autokorelasi Variabel Data Monitoring Marketing (Time Series) di CV

Solofood Indonusa merupakan analisis yang dilakukan untuk mengolah data

time series agar dapat dilihat polanya dan dilakukan perhitungan tren dan

musiman untuk memprediksi data di waktu yang akan datang. Setelah dilakukan

perhitungan koefisien autokorelasi lag 1 dan lag 2, dapat dibuktikan bahwa pola

data tiap variabelnya memiliki korelasi. Data time series pada variabel Q-NETT

termasuk ke dalam pola data musiman, sedangkan variabel Retur dan BS

termasuk ke dalam pola data tren. Kemudian, dilihat dari perhitungan pola data

musiman, prediksi Q-NETT yang didapatkan untuk Januari 2018 atau bulan ke-

61 adalah 13.277,7505. Sedangkan dilihat dari perhitungan pola data tren,

prediksi Retur dan BS adalah masing-masing; 14.604,175 dan 5.663,805.

Artinya, seluruh data penjualan berhasil diprediksi dengan hasil yang masuk

akal. Hal itu berarti dapat dilakukan prediksi-prediksi lagi oleh perusahaan

menggunakan perhitungan yang telah dibuktikan. Selain itu, analisa terhadap

data time series juga berhasil dilakukan menggunakan koefisien autokorelasi.

Diharapkan analisis dan perhitungan prediksi ini dapat membantu perusahaan

dalam memprediksi Q-NETT atau penjualan di masa yang akan datang, Retur

atau barang yang dikembalikan dari area penjualan, dan BS atau barang yang

19

rusak/ kadaluarsa; dengan cara menyesuaikan kiriman ke tiap-tiap area sesuai

dengan prediksi yang sudah dihitung sehingga tidak dilakukan pengiriman

dengan jumlah yang asal.

Berdasarkan analisis yang telah dilakukan sudah mencapai tujuan,

namun masih terdapat kekurangan. Kekurangan yang terdapat pada penelitian

ini dapat dikembangkan pada penelitian lain. Saran yang dapat dilakukan

penelitian lain menggunakan data yang lebih banyak lagi atau kasus yang

berbeda, dan juga dapat menggunakan metode atau algoritma lainnya sehingga

hasil penelitian dapat lebih akurat lagi.

VI. Daftar Pustaka

[1]. Tanaka, M.,& Okutomi, M., 2014, A Novel Inference of a Restricted

Boltzmann Machine. Pattern Recognition (ICPR), 2014 22nd

International Conference, pp. 1526-1531.

[2]. Ambarwati, R., 2016, Analisis Data Time Series Menggunakan Model

Exponential Generalized Autoregressive Conditional

Heteroscedasticity (EGARCH) (1,1), 2.

[3]. Fathurahman, M., 2012, Metode Cochrane-Orcutt untuk Mengatasi

Autokorelasi pada Regresi Ordinary Least Squares. Samarinda:

Universitas Mulawarman.

[4]. Caraka, R.E., dkk, 2016, Time Series Analysis Using Copula Gauss and

AR(1)-N.GARCH(1,1), Media Statistika, Vol. 9, No. 1, Hal 1-13.

[5]. Zhang, Y., dkk, 2017, Forecasting Electric Vehicles Sales with

Univariate and Multivariate Time Series Models: The case of China.

Nanjing: School of Transportation, Southeast University.

[6]. Danukusumo, K.P., 2017, Implementasi Deep Learning Menggunakan

Convolutional Neural Network untuk Klasifikasi Citra Candi Berbasis

GPU. Yogyakarta: Universitas Atma Jaya.

[7]. Ashari, 2013, Penerapan Metode Time Series dalam Simulasi

Forecasting Perkembangan Akademik Mahasiswa. Makassar: SMIK

AKBA.

[8]. Makridakis, S.,& Wheelwright, S.C., 1999, Metode dan Aplikasi

Peramalan. Jakarta: Binarupa Aksara.

20

[9]. Mistry, K.,& Saluja, A., 2016, An Introduction to OpenCV Using

Python with Ubuntu, International Journal of Scientific Research in

Computer Science, Engineering and Information Technology (2456-

3307), Vol. 1, Issue 2, pp. 65-68.

[10]. Samuel, A., dkk, 2017, Fitur Pengkategorian Otomatis dari Gambar

Berbasis Web dengan Metode SURF dan Haar Cascade Classifiers.

Surabaya: UK Petra.

[11]. Yamin, S., dkk, 2011, Regresi dan Korelasi dalam Genggaman Anda.

Jakarta: Salemba Empat.

[12]. Choeroni, M., 2013, Grafik Pengendali Rata-Rata Bergerak dalam

Pengendalian Kecacatan Per Unit untuk Data yang Berautokorelasi.

Malang: UIN Maulana Malik Ibrahim.

[13]. Sugiyono, 2009, Metode Penelitian Pendidikan Pendekatan Kuantitatif,

Kualitatif, dan R&D. Bandung: Alfabet.

[14]. Prastyantoro, R, 2003, Evaluasi Lokasi SPP Wilayah Pos V dengan

Menggunakan Model Simulasi Komputer. Bandung: ITB.

[15]. Nabilugisni, 2013, Analisis Time Series, Harvard University, 4-7.

Analisis Autokorelasi Variabel Data Monitoring Marketing ... text.pdfAnalisis Autokorelasi Variabel...

Documents

Transcript of Analisis Autokorelasi Variabel Data Monitoring Marketing ... text.pdfAnalisis Autokorelasi Variabel...