Nama :1. Ayu Agustiani (2003110392) 2. Farisssa Sanurtillah ( 2003111100) 1. Tujuan Unsupervised Learning adalah penggunaan algopritma kecerdasan buatan atau aftifical intelligence (AI) untuk mengidentifikasi pola dalam kumpulan data yang berisi titik data yang tidak diklasifikasikan atau di beri dan juga pendekatan machine learning menggunakan algoritma untuk menganalisis atau menemukan pola dari suatu data tanpa bantuan maupun interpensi dari manusia, untuk mengurangi dimensi agar lebih terkelola,, melihat hubungan antarvaribel yang berbeda. 2. Clustering analysis adalah suatu teknik. yang bertujuan mengelompokkan obyek -obyek berdasarkan karakteristik yang dimiliki masing masing obyek, untuk mengidentifikasi obyek obyek, untuk menddukung system pendukung keputusan dan data mining.analisis ini merupakan teknik analisis ststistik multivariat yang mengelompokkan observasi berdasarkan beberapa variable atau feature. 3. Gambar 1: clustering, karena mengelompokkan data berdasarkan kemiripan bentuknya. Gambar 2 : clustering, karena mengelompokkan data berdasarkan jarak kedekatan setiap data dengan k-means Gambar 3 : klasifikasi dimana data sudah diberi label yaitu lingkaran dan tanda silang sudah ditentukan sebelum diproses. Klasifikasi termasuk kedalam supervised learning. Metodenya seperti KNN,Naive Bayes,dll. 4. Perbedaan clustering hierarchical dan clustering nonhierarchical: clustering hierarchical merupakan metode pengelompokan dengan proses berhirarki (bertingkat)., missal dalam proses pembagian taksonomi hewan di bidang biologi. Analisi bertingkat dibagi menjadi dua yaitu divisive ( top-down ) dan agglomerative( battom-up).Namun belum diketahui banyaknya yang diinginkan. Adapun analisis klasyter hirarki dengan pendekatan aglomeratif lebih banyak digunakan karena secara sistematis metode ini lebih akurat dan konsisten. clustering nonhierarchical merupakan metode pengelompokan objek dimana banyaknya cluster yang akan dibentuk dapat ditentukan terlebih dahulu.klaster non hirarki melakukan proses pengklasteran secara langsung pada semua observasi yang ada di data set , sehingga pengklasrteran hanya terjadi dalam satu level atau tidak bertingkat. Beberapa algoritma yang termasuk jenis non hirarki antara lain k-means clustering, k-medoids dan DBSCAN. . 5. K-Means adalah salah satu metode dari unservised learning yang termasuk kedalam clustering dengan menentukan nilai k terlebih dahulu. Nilai K merupakan banyaknya klister yang akan kita bentuk,setelah itu melakukan perhitungan menggunakan jarak Euclidean. Kelebihan dari k-means diantaranya mudah dipahami, dapat menangani data besar, dan anggota dalam cluster dapat disesuaikan, relative sederhana dan mudah untuk diterapkan, dapat diskalakan untuk dataset dalam jumlah besar, mudah beradaptasi dengan contoh baru dan umum diimplementasikan ke cluster dengan bentuk dan ukuran yang berbeda , seperti cluster elips. Sedangkan kekurangannya, yaitu perlu menentukan jumlah cluster yang optimal terlebih dahulu, sensitive terhadap pencilan, tidak mampu digunakan untuk cluster yang bervariasi, sensitive terhadap skala data, centroid awal yang berbeda menghasilkan hasil yang berbeda. Perlu menentukan nilai k secara manual, sangat bergantung pada inisialisasi awal. 6. Variabel yang bisa diidentifikasi dari gambar untuk melakukan clustering, yaitu bentuk kaki, bentuk telinga, bentuk hidung, bentuk poni, bentuk kepala, bentuk ekor.memiliki tanduk. 7. Dari gambar terdapat 5 cluster yang terbentuk yaitu YAK,RAT,DOG,PIG,dan FOX. 8. Bentuk telinga, ada atau tidaknya kumis, bentuk kaki, bentuk kepala,bentuk 9. Bentuk rambut/bulu, jumlah kaki,bentuk telinga 10. Jenis rambut/bulu, ada tidaknya memiliki poni,bentuk telinga 11. Bisa, seperti singa memiliki kemiripan bentuk kaki dengan anjing, kucing dan singa bisa masuk kedalam clastering PIG berdasarkan bentuk poni. 12. Bisa. Karena memiliki kararteristik berdasrakan kemiripan dari data sebelumnya yaitu pada RAT,DOG,PIG.