Uploaded by Ahmad Hidayatullah Nur Pratikta

Perc3 Data Mining

advertisement
2.1.
Teori Dasar
2.1.3. Support Vector Machine
SVM atau Support Vector Machine adalah sebuah metode
machine learning yang pertama kali diperkenalkan oleh Vladimir
Vapnik dan Alexey Chervonenkis pada tahun 1963 di Uni Soviet.
Namun, SVM baru menjadi terkenal pada tahun 1995 ketika Vapnik dan
timnya berhasil memperkenalkan algoritma SVM yang efektif dan
efisien dalam menyelesaikan masalah klasifikasi pada data yang
kompleks.
SVM atau Support Vector Machine merupakan salah satu
metode machine learning yang digunakan untuk melakukan klasifikasi
dan regresi. SVM adalah metode yang efektif untuk menyelesaikan
masalah klasifikasi pada data yang kompleks dengan jumlah fitur yang
besar. SVM juga memiliki kemampuan untuk menangani data yang
tidak linear secara efektif.
Pada dasarnya, SVM membangun sebuah model pembelajaran
mesin yang dapat digunakan untuk memisahkan data menjadi dua kelas
dengan membangun sebuah hyperplane yang memaksimalkan margin
antara kedua kelas.
Proses pembentukan hyperplane dilakukan dengan memilih
subset data latih yang disebut dengan support vector. Support vector
adalah titik-titik data yang berada paling dekat dengan hyperplane dan
merupakan titik-titik yang paling penting dalam pembentukan
hyperplane. SVM mencoba untuk membangun hyperplane yang
memiliki margin maksimum antara support vector dari kelas yang
berbeda. Dengan demikian, SVM dapat membangun model klasifikasi
yang dapat memisahkan data dengan baik.
SVM dapat digunakan pada berbagai masalah klasifikasi dan
regresi, seperti pengenalan gambar, analisis bioinformatika, prediksi
harga saham, dan sebagainya. Selain itu, SVM juga dapat digunakan
dalam kombinasi dengan teknik machine learning lain seperti neural
network dan ensemble learning untuk meningkatkan kinerja model.
Secara keseluruhan, SVM merupakan salah satu metode
machine learning yang efektif dan efisien dalam menyelesaikan
masalah klasifikasi pada data yang kompleks, dan dapat diaplikasikan
dalam berbagai bidang, seperti pengenalan pola, pengenalan suara,
pemrosesan citra, dan sebagainya.
Dalam pengenalan pola, SVM dapat digunakan untuk berbagai
tujuan, seperti pengenalan wajah, pengenalan tulisan tangan,
pengenalan
objek
kemampuannya
pada
dalam
gambar,
menangani
dan
sebagainya.
data
Dengan
kompleks
dan
multidimensional, SVM dapat menjadi pilihan yang baik untuk
digunakan dalam pengenalan pola. Hal itu dikarenakan Support Vector
Machine cenderung memiliki performa yang baik dalam hal
generalisasi, bahkan dalam kasus di mana jumlah fitur lebih besar dari
jumlah sampel. Serta juga efisien dalam ruang fitur yang besar, karena
hanya memerlukan subset dari titik data yang mendukung vektor-vektor
pendukung.
Dalam pemrosesan citra, SVM merupakan salah satu algoritma
pembelajaran mesin yang populer dan sering digunakan. SVM dapat
digunakan untuk berbagai aplikasi pemrosesan citra, dan dengan
kemampuannya dalam memisahkan data dengan garis atau bidang
hyperplane yang optimal, SVM dapat meningkatkan kinerja sistem
pengenalan citra.
3.1.
Langkah Kerja
3.1.3. Support Vector Machine
A. Import library yang dibutuhkan.
B. Memasukkan Dataset untuk menjadi Dataframe dan menampilkan
5 data teratas.
C. Proses Preprocessing data dengan pemisahan nilai X dan Y.
D. Dilakukan pemisahan Data Training dan Data Testing.
E. Dilakukan proses Data Encoding dengan Standarisasi nilai data.
F. Pemanggilan model Data Mining, pengaturan parameter model, dan
proses modelling.
G. Melakukan proses prediksi.
H. Menampilkan hasil evaluasi model.
I. Menampilkan visualisasi data hubungan antar 2 kolom data.
4.1.
Hasil dan Pembahasan
4.1.3. Support Vector Machine
A. Model SVM
Bagian ini merupakan proses modelling Support Vector
Machine (SVM), yang dimana fungsi sintaks kode yang digunakan
yaitu “SVC()” untuk menggunakan model SVM dalam kasus studi
Klasifikasi. Didalam parameternya, ditentukan kernel yang dimana
kernel yang dipilih yaitu kernel linear untuk proses pemisahan
kelas-kelas data serta lebih sederhana dan efisien dalam berbagai
studi kasus.
B. Evaluasi SVM
Untuk mengetahui kinerja dari model Data Mining yang
digunakan, maka dilakukan proses Evaluation dengan Confusion
Matrix dan
Classification Report.
Confusion Matrix dan
Classification Report adalah dua metrik evaluasi yang digunakan
untuk mengevaluasi kinerja model klasifikasi dalam Data Mining.
Confusion Matrix digunakan untuk evaluasi kinerja model
klasifikasi dengan membandingkan nilai sebenarnya dari kelas
target dengan nilai yang diprediksi oleh model. Sedangkan
Classification Report untuk menyediakan ringkasan dari kinerja
model klasifikasi. Dapat dilihat bahwa nilai akurasi dari model
adalah sebesar 60%.
C. Visualisasi SVM
Digunakan Scatter Plot dalam menentukan hubungan antar
2 variabel/kolom data karena titik-titik dalam plot mewakili
pasangan nilai dari kedua variabel, dan pola yang terbentuk dapat
memberikan gambaran tentang hubungan antara keduanya.
Berdasarkan hasil visualisasi diatas, bahwa tidak adanya korelasi
antar variabel data “Volatile Acidity” dan “Fixed Acidity”.
5.1.
Kesimpulan
5.1.3. Support Vector Machine
Kesimpulan pada percobaan ini adalah, model SVM memiliki
beberapa kelebihan dan kekurangan. Lalu SVM dapat digunakan dalam
kasus Regresi dan Klasifikasi, serta dapat diimplementasikan dalam
studi kasus mengenai Pengolahan Citra dan Bioinformatika. SVM dapat
dengan efektif menangani data yang tidak linear, karena dapat
memetakan data ke dimensi yang lebih tinggi (kernel trick) di mana
kelas dapat dipisahkan secara linier. Hasil percobaan yang dilakukan
dengan melakukan klasifikasi pada Dataset Wine Quality dengan nilai
akurasi sebesar 60%.
Download