Perc3 Data Mining

2.1. Teori Dasar 2.1.3. Support Vector Machine SVM atau Support Vector Machine adalah sebuah metode machine learning yang pertama kali diperkenalkan oleh Vladimir Vapnik dan Alexey Chervonenkis pada tahun 1963 di Uni Soviet. Namun, SVM baru menjadi terkenal pada tahun 1995 ketika Vapnik dan timnya berhasil memperkenalkan algoritma SVM yang efektif dan efisien dalam menyelesaikan masalah klasifikasi pada data yang kompleks. SVM atau Support Vector Machine merupakan salah satu metode machine learning yang digunakan untuk melakukan klasifikasi dan regresi. SVM adalah metode yang efektif untuk menyelesaikan masalah klasifikasi pada data yang kompleks dengan jumlah fitur yang besar. SVM juga memiliki kemampuan untuk menangani data yang tidak linear secara efektif. Pada dasarnya, SVM membangun sebuah model pembelajaran mesin yang dapat digunakan untuk memisahkan data menjadi dua kelas dengan membangun sebuah hyperplane yang memaksimalkan margin antara kedua kelas. Proses pembentukan hyperplane dilakukan dengan memilih subset data latih yang disebut dengan support vector. Support vector adalah titik-titik data yang berada paling dekat dengan hyperplane dan merupakan titik-titik yang paling penting dalam pembentukan hyperplane. SVM mencoba untuk membangun hyperplane yang memiliki margin maksimum antara support vector dari kelas yang berbeda. Dengan demikian, SVM dapat membangun model klasifikasi yang dapat memisahkan data dengan baik. SVM dapat digunakan pada berbagai masalah klasifikasi dan regresi, seperti pengenalan gambar, analisis bioinformatika, prediksi harga saham, dan sebagainya. Selain itu, SVM juga dapat digunakan dalam kombinasi dengan teknik machine learning lain seperti neural network dan ensemble learning untuk meningkatkan kinerja model. Secara keseluruhan, SVM merupakan salah satu metode machine learning yang efektif dan efisien dalam menyelesaikan masalah klasifikasi pada data yang kompleks, dan dapat diaplikasikan dalam berbagai bidang, seperti pengenalan pola, pengenalan suara, pemrosesan citra, dan sebagainya. Dalam pengenalan pola, SVM dapat digunakan untuk berbagai tujuan, seperti pengenalan wajah, pengenalan tulisan tangan, pengenalan objek kemampuannya pada dalam gambar, menangani dan sebagainya. data Dengan kompleks dan multidimensional, SVM dapat menjadi pilihan yang baik untuk digunakan dalam pengenalan pola. Hal itu dikarenakan Support Vector Machine cenderung memiliki performa yang baik dalam hal generalisasi, bahkan dalam kasus di mana jumlah fitur lebih besar dari jumlah sampel. Serta juga efisien dalam ruang fitur yang besar, karena hanya memerlukan subset dari titik data yang mendukung vektor-vektor pendukung. Dalam pemrosesan citra, SVM merupakan salah satu algoritma pembelajaran mesin yang populer dan sering digunakan. SVM dapat digunakan untuk berbagai aplikasi pemrosesan citra, dan dengan kemampuannya dalam memisahkan data dengan garis atau bidang hyperplane yang optimal, SVM dapat meningkatkan kinerja sistem pengenalan citra. 3.1. Langkah Kerja 3.1.3. Support Vector Machine A. Import library yang dibutuhkan. B. Memasukkan Dataset untuk menjadi Dataframe dan menampilkan 5 data teratas. C. Proses Preprocessing data dengan pemisahan nilai X dan Y. D. Dilakukan pemisahan Data Training dan Data Testing. E. Dilakukan proses Data Encoding dengan Standarisasi nilai data. F. Pemanggilan model Data Mining, pengaturan parameter model, dan proses modelling. G. Melakukan proses prediksi. H. Menampilkan hasil evaluasi model. I. Menampilkan visualisasi data hubungan antar 2 kolom data. 4.1. Hasil dan Pembahasan 4.1.3. Support Vector Machine A. Model SVM Bagian ini merupakan proses modelling Support Vector Machine (SVM), yang dimana fungsi sintaks kode yang digunakan yaitu “SVC()” untuk menggunakan model SVM dalam kasus studi Klasifikasi. Didalam parameternya, ditentukan kernel yang dimana kernel yang dipilih yaitu kernel linear untuk proses pemisahan kelas-kelas data serta lebih sederhana dan efisien dalam berbagai studi kasus. B. Evaluasi SVM Untuk mengetahui kinerja dari model Data Mining yang digunakan, maka dilakukan proses Evaluation dengan Confusion Matrix dan Classification Report. Confusion Matrix dan Classification Report adalah dua metrik evaluasi yang digunakan untuk mengevaluasi kinerja model klasifikasi dalam Data Mining. Confusion Matrix digunakan untuk evaluasi kinerja model klasifikasi dengan membandingkan nilai sebenarnya dari kelas target dengan nilai yang diprediksi oleh model. Sedangkan Classification Report untuk menyediakan ringkasan dari kinerja model klasifikasi. Dapat dilihat bahwa nilai akurasi dari model adalah sebesar 60%. C. Visualisasi SVM Digunakan Scatter Plot dalam menentukan hubungan antar 2 variabel/kolom data karena titik-titik dalam plot mewakili pasangan nilai dari kedua variabel, dan pola yang terbentuk dapat memberikan gambaran tentang hubungan antara keduanya. Berdasarkan hasil visualisasi diatas, bahwa tidak adanya korelasi antar variabel data “Volatile Acidity” dan “Fixed Acidity”. 5.1. Kesimpulan 5.1.3. Support Vector Machine Kesimpulan pada percobaan ini adalah, model SVM memiliki beberapa kelebihan dan kekurangan. Lalu SVM dapat digunakan dalam kasus Regresi dan Klasifikasi, serta dapat diimplementasikan dalam studi kasus mengenai Pengolahan Citra dan Bioinformatika. SVM dapat dengan efektif menangani data yang tidak linear, karena dapat memetakan data ke dimensi yang lebih tinggi (kernel trick) di mana kelas dapat dipisahkan secara linier. Hasil percobaan yang dilakukan dengan melakukan klasifikasi pada Dataset Wine Quality dengan nilai akurasi sebesar 60%.

Perc3 Data Mining

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib