UTS AI 1. Apa yang kamu ketahui tentang Analisis Data? Analisis data adalah proses pengolahan data dengan tujuan untuk menemukan informasi yang berguna yang dapat dijadikan dasar dalam suatu pengambilan jawaban untuk solusi suatu permasalahan. Proses analisis ini meliputi kegiatan pengelompokkan data berdasarkan karakteristiknya, melakukan pembersihan data, mentransformasi data, membuat model data untuk menemukan informasi penting dari data tersebut. Tak lupa data yang sudah melalui proses tersebut harus disajikan dalam bentuk yang menarik dan mudah dipahami oleh orang lain biasanya dalam bentuk grafik atau plot. Teknologi ini merupakan suatu cara agar data yang terus bertambah setiap waktu tidak akan dibiarkan menumpuk begitu saja yang menyebabkan data tersebut menjadi hal yang sia-sia. Oleh sebab itu, analisis data merupakan langkah dalam pengolahan data yang sangat penting. Adapun analisis data memiliki berbagai macam pendekatan atau teknik yang dapat digunakan. 2. Sebutkan dan jelaskan beberapa teknik visualisasi data yang efektif selain Pie Charts dan Bar Charts! Beberapa teknik visualisasi data perbandingan yaitu : A. Line Charts Visualisasi data line charts adalah metode untuk menggambarkan data dalam bentuk garis yang menghubungkan titik-titik data yang relevan. Grafik garis sangat berguna untuk menunjukkan perubahan atau tren dari suatu kumpulan data dalam rentang waktu tertentu atau secara continu. Tipe visualisasi ini juga berguna untuk membandingkan antar kategori dengan cara memberikan warna yang berbeda pada setiap kategori tersebut. Visualisasi data line charts cocok digunakan untuk menunjukkan tren waktu, seperti pertumbuhan populasi, perubahan harga saham seiring waktu, Selain itu, line chart juga memungkinkan pengguna untuk membandingkan beberapa seri data secara bersamaan, yang memudahkan dalam menemukan korelasi antara berbagai variabel. Dalam memahami line chart, penting untuk memperhatikan fluktuasi, kecondongan, dan pola dari garis tersebut. B. Combo Charts Teknik Combo Charts biasanya digunakan untuk membandingkan dua set nilai suatu data yang biasanya sulit untuk dibandingkan karena adanya perbedaan skala sehingga dengan Teknik ini pengguna dapat dengan mudah membandingkan data kuantitatif dan kualitatif secara bersamaan. Chart ini pada dasarnya adalah diagram batang (Bar Chart) yang dikombinasikan dengan diagram garis (Line Chart). Penerapan combo charts ini penting untuk memperhatikan bagaimana jenis data yang berbeda tersebut yang saling berhubungan satu sama lain, dan apakah ada pola atau tren yang dapat diidentifikasi dari visualisasi tersebut. 3. Kompetensi apa saja yang harus dimiliki oleh Data Science? Berikut adalah beberapa kompetensi utama yang harus dimiliki oleh seorang praktisi ilmu data: 1. Memiliki pemahaman yang kuat tentang konsep-konsep dasar matematika dan statistik yang terkait dengan analisis data, seperti probabilitas, statistik inferensial, dan metode pengujian hipotesis. 2. Kemampuan dalam pemrograman komputer, terutama dalam bahasa pemrograman seperti Python, R, dan SQL. Pemahaman yang baik tentang manipulasi data, analisis, dan pemodelan adalah penting. 3. Pengolahan Data dan ETL (Extract, Transform, Load) merupakan Kemampuan untuk mengumpulkan, membersihkan, dan mempersiapkan data untuk analisis. Ini termasuk kemampuan dalam mengelola basis data, memahami data warehousing, dan menggunakan alat-alat ETL. 4. Pengolahan Bahasa Alami (Natural Language Processing) adalah Kemampuan untuk bekerja dengan teks dan data verbal, termasuk kemampuan untuk memahami, menginterpretasi, dan menghasilkan teks menggunakan teknik pemrosesan bahasa alami. 5. Pemahaman yang baik tentang berbagai teknik pembelajaran Machine Learning, serta kemampuan untuk menerapkan model ini untuk memecahkan masalah dan membuat prediksi berdasarkan data historis. 6. Kemampuan untuk menyajikan data secara visual dengan menggunakan berbagai alat dan teknik visualisasi, seperti grafik, peta, dan visualisasi interaktif lainnya. 7. Kemampuan untuk berkomunikasi secara efektif, baik secara lisan maupun tulisan, dengan berbagai pemangku kepentingan, termasuk tim teknis dan non-teknis. 8. Memiliki Sifat kepribadian yang penting termasuk rasa ingin tahu yang kuat dan ketekunan dalam mengeksplorasi dan memahami data, serta keterbukaan terhadap pembelajaran baru dan pengembangan keterampilan 4. Apa perbedaan analisis dan analitik? Analitik lebih menyeluruh dan berfokus pada penggunaan data untuk membuat prediksi, mengidentifikasi peluang, dan mendukung pengambilan keputusan di masa depan. Tools yang digunakan oleh data analitik adalah R, Tableau Public, Python, SAS, Apache Spark, dan Excel atau Google Sheets. Sedangkan Analisis adalah pemeriksaan terperinci dari elemen atau struktur tertentu yang dimana berfokus pada pemahaman data yang telah dikumpulkan dan penguraian informasi yang terkandung di dalamnya. Proses analisis seringkali berpusat pada pertanyaan spesifik yang memerlukan jawaban berdasarkan data yang ada. data analisis biasanya menggunakan tools seperti OpenRefine, KNIME, RapidMiner, Google Fusion Tables, Tableau Public, NodeXL, dan WolframAlpha. 5. Sebutkan masalah-masalah yang umum dihadapi oleh seorang data analyst? Seorang data analisis seringkali menghadapi berbagai tantangan dan masalah dalam pekerjaannya, termasuk: a) Data yang Tidak Lengkap b) Kualitas Data yang Rendah c) Kekurangan Data d) Sumber Data yang Beragam e) Kesalahan Model f) Keamanan Data dan privasi adalah perhatian besar g) Perubahan Data yang Cepat h) Ketidakpastian dan Ambigu Data i) Kepemilikan data dan akses ke data kadang-kadang dapat menjadi masalah yang kompleks. j) Kesulitan dalam Mendefinisikan Masalah 6. Tools dalam python apa saja yang digunakan untuk tujuan analisis data? Jelaskan fungsinya! 1. NumPy adalah perpustakaan dasar untuk komputasi ilmiah yang menyediakan dukungan untuk array dan operasi matematika yang cepat, membuatnya sangat berguna untuk pengolahan data numerik. 2. Pandas adalah perpustakaan untuk analisis data yang memungkinkan untuk mengimpor, menyimpan, dan mengelola data dalam bentuk DataFrames, serta melakukan operasi seperti pemfilteran, penggabungan, dan transformasi data. 3. Matplotlib adalah perpustakaan untuk visualisasi data yang memungkinkan untuk membuat berbagai jenis grafik, seperti grafik garis, grafik batang, grafik sebar, dan banyak lagi. 4. Seaborn adalah perpustakaan visualisasi data yang berdasarkan Matplotlib, dan ini menyederhanakan pembuatan grafik yang lebih menarik dan informatif. 5. Scikit-learn adalah perpustakaan pembelajaran mesin yang kuat yang menyediakan alat dan algoritma untuk tugas seperti klasifikasi, regresi, pengelompokan, dan lainnya. 6. Jupyter Notebook adalah lingkungan pengembangan interaktif yang memungkinkan untuk membuat dan berbagi dokumen yang menggabungkan kode, teks, dan visualisasi, ini sangat berguna dalam menjalankan dan mendokumentasikan analisis data. 7. Apa saja tahapan proses SEMMA dalam metodologi data science? Jelaskan! 1. Tahap pertama yaitu Sample, Sample merupakan sebuah proses data mining yang digunakan untuk mengumpulkan sampel yang menjadi acuan untuk mencari data yang cukup besar dan dapat membentuk informasi yang penting dan signifikan, namun data tersebut dapat dimanipulasi dengan cepat 2. Tahap kedua yaitu Explore, Explore merupakan sebuah proses data mining yang dapat digunakan untuk mencari kumpulan data dan menjadi informasi yang terkait dengan tren dan anomaly yang tidak terduga yang dapat digunakan untuk mendapatkan pengertian dan ide. Jika eksplorasi visual tidak mengungkapkan tren yang jelas, maka dapat melakukan menjelajahi data melalui teknik statistik termasuk analisis faktor, analisis korespondensi, dan pengelompokan untuk mendapatlan data yang jelas. 3. Tahap ketiga yaitu Modify, Modify merupakan sebuah proses data mining yang dapat digunakan untuk memodifikasikan data dan mengubah variable-variabel untuk memfokuskan proses pemilihan model. Untuk memilih model maka perlu adanya memanipulasi model data untuk memasukkan informasi seperti pengelompokan pelanggan dan subkelompok yang signifikan, atau untuk memperkenalkan variabel baru. 4. Tahap keempat yaitu Model, Model merupakan sebuah proses data mining yang dapat digunakan untuk memodelkan data dengan menyediakan software untuk mencari kombinasi data yang memprediksi hasil terpercaya yang diinginkan secara otomatis. Data yang sudah dikombinasikan dapat digunakan untuk memprediksi hasil yang diinginkan. 5. Tahap kelima yaitu Assess, Assess merupakan sebuah proses data mining yang dapat digunakan untuk menilai data dengan mengevaluasi kegunaan dan keandalan penemuan dari data proses data mining dan memperkirakan seberapa baik kinerja tersebut. 8. Apa tujuan visualisasi dalam analisis data? Tujuan utama dari visualisasi data adalah untuk menyampaikan informasi secara jelas dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel dan grafik. Visualisasi juga efektif untuk membantu pengguna dalam menganalisis dan penalaran tentang data dan bukti. Visualisasi membuat data yang kompleks, bisa diakses, dipahami dan berguna. 9. Sebutkan fungsi dan implementasi data analys dalam program studi yang anda ikuti Data analytics memiliki berbagai aplikasi dalam bidang ilmu hukum yang dapat membantu pengacara, lembaga penegak hukum, dan profesional hukum lainnya dalam berbagai cara. Berikut adalah beberapa fungsi dan implementasi data analytics dalam bidang ilmu hukum: 1. Analisis Kepatuhan Hukum, Data analytics dapat digunakan untuk menganalisis kepatuhan hukum di perusahaan atau lembaga dengan memantau dan menganalisis data transaksi dan kegiatan perusahaan untuk mengidentifikasi pelanggaran hukum atau potensi risiko hukum. 2. Menganalisis data historis dan faktor-faktor risiko, data analytics dapat membantu pengacara dan konsultan hukum dalam meramalkan risiko hukum potensial yang mungkin dihadapi oleh klien mereka. 3. Dengan menggunakan data analytics, pengacara dapat menganalisis kasus hukum terkait, preseden, dan keputusan pengadilan sebelumnya untuk mempersiapkan strategi hukum yang lebih efektif untuk kasus yang sedang mereka tangani. 4. Penggunaan data analytics juga bermanfaat agar dokumen-dokumen hukum dapat dikelola dengan lebih efisien melalui pencarian otomatis, klasifikasi, dan analisis konten, yang memudahkan pengacara dalam menemukan informasi yang relevan dan penting. 5. Dengan menggunakan teknik prediktif, data analytics dapat membantu dalam memprediksi hasil kasus pengadilan berdasarkan faktor-faktor tertentu, sehingga memungkinkan pengacara untuk merencanakan strategi yang lebih baik. 6. Data analytics dapat digunakan untuk memantau kinerja pengacara, departemen hukum, atau firma hukum dalam hal produktivitas, kepatuhan, dan hasil kasus untuk meningkatkan efektivitas operasional.