Uploaded by Adroit Rohmattulloh

UTS AI

advertisement
UTS AI
1. Apa yang kamu ketahui tentang Analisis Data?
Analisis data adalah proses pengolahan data dengan tujuan untuk menemukan
informasi yang berguna yang dapat dijadikan dasar dalam suatu pengambilan jawaban untuk
solusi suatu permasalahan. Proses analisis ini meliputi kegiatan pengelompokkan data
berdasarkan karakteristiknya, melakukan pembersihan data, mentransformasi data, membuat
model data untuk menemukan informasi penting dari data tersebut.
Tak lupa data yang sudah melalui proses tersebut harus disajikan dalam bentuk yang menarik
dan mudah dipahami oleh orang lain biasanya dalam bentuk grafik atau plot. Teknologi ini
merupakan suatu cara agar data yang terus bertambah setiap waktu tidak akan dibiarkan
menumpuk begitu saja yang menyebabkan data tersebut menjadi hal yang sia-sia.
Oleh sebab itu, analisis data merupakan langkah dalam pengolahan data yang sangat
penting. Adapun analisis data memiliki berbagai macam pendekatan atau teknik yang dapat
digunakan.
2. Sebutkan dan jelaskan beberapa teknik visualisasi data yang efektif selain Pie Charts dan Bar
Charts!
Beberapa teknik visualisasi data perbandingan yaitu :
A. Line Charts
Visualisasi data line charts adalah metode untuk menggambarkan data dalam bentuk garis
yang menghubungkan titik-titik data yang relevan. Grafik garis sangat berguna untuk
menunjukkan perubahan atau tren dari suatu kumpulan data dalam rentang waktu tertentu
atau secara continu.
Tipe visualisasi ini juga berguna untuk membandingkan antar kategori dengan cara
memberikan warna yang berbeda pada setiap kategori tersebut. Visualisasi data line charts
cocok digunakan untuk menunjukkan tren waktu, seperti pertumbuhan populasi, perubahan
harga saham seiring waktu,
Selain itu, line chart juga memungkinkan pengguna untuk membandingkan beberapa seri
data secara bersamaan, yang memudahkan dalam menemukan korelasi antara berbagai
variabel. Dalam memahami line chart, penting untuk memperhatikan fluktuasi, kecondongan,
dan pola dari garis tersebut.
B. Combo Charts
Teknik Combo Charts biasanya digunakan untuk membandingkan dua set nilai suatu data
yang biasanya sulit untuk dibandingkan karena adanya perbedaan skala sehingga dengan
Teknik ini pengguna dapat dengan mudah membandingkan data kuantitatif dan kualitatif
secara bersamaan.
Chart ini pada dasarnya adalah diagram batang (Bar Chart) yang dikombinasikan dengan
diagram garis (Line Chart). Penerapan combo charts ini penting untuk memperhatikan
bagaimana jenis data yang berbeda tersebut yang saling berhubungan satu sama lain, dan
apakah ada pola atau tren yang dapat diidentifikasi dari visualisasi tersebut.
3. Kompetensi apa saja yang harus dimiliki oleh Data Science?
Berikut adalah beberapa kompetensi utama yang harus dimiliki oleh seorang praktisi ilmu
data:
1. Memiliki pemahaman yang kuat tentang konsep-konsep dasar matematika dan statistik
yang terkait dengan analisis data, seperti probabilitas, statistik inferensial, dan metode
pengujian hipotesis.
2. Kemampuan dalam pemrograman komputer, terutama dalam bahasa pemrograman
seperti Python, R, dan SQL. Pemahaman yang baik tentang manipulasi data, analisis, dan
pemodelan adalah penting.
3. Pengolahan Data dan ETL (Extract, Transform, Load) merupakan Kemampuan untuk
mengumpulkan, membersihkan, dan mempersiapkan data untuk analisis. Ini termasuk
kemampuan dalam mengelola basis data, memahami data warehousing, dan
menggunakan alat-alat ETL.
4. Pengolahan Bahasa Alami (Natural Language Processing) adalah Kemampuan untuk
bekerja dengan teks dan data verbal, termasuk kemampuan untuk memahami,
menginterpretasi, dan menghasilkan teks menggunakan teknik pemrosesan bahasa alami.
5. Pemahaman yang baik tentang berbagai teknik pembelajaran Machine Learning, serta
kemampuan untuk menerapkan model ini untuk memecahkan masalah dan membuat
prediksi berdasarkan data historis.
6. Kemampuan untuk menyajikan data secara visual dengan menggunakan berbagai alat dan
teknik visualisasi, seperti grafik, peta, dan visualisasi interaktif lainnya.
7. Kemampuan untuk berkomunikasi secara efektif, baik secara lisan maupun tulisan, dengan
berbagai pemangku kepentingan, termasuk tim teknis dan non-teknis.
8. Memiliki Sifat kepribadian yang penting termasuk rasa ingin tahu yang kuat dan ketekunan
dalam mengeksplorasi dan memahami data, serta keterbukaan terhadap pembelajaran
baru dan pengembangan keterampilan
4. Apa perbedaan analisis dan analitik?
Analitik lebih menyeluruh dan berfokus pada penggunaan data untuk membuat
prediksi, mengidentifikasi peluang, dan mendukung pengambilan keputusan di masa depan.
Tools yang digunakan oleh data analitik adalah R, Tableau Public, Python, SAS, Apache Spark,
dan Excel atau Google Sheets.
Sedangkan Analisis adalah pemeriksaan terperinci dari elemen atau struktur tertentu
yang dimana berfokus pada pemahaman data yang telah dikumpulkan dan penguraian
informasi yang terkandung di dalamnya. Proses analisis seringkali berpusat pada pertanyaan
spesifik yang memerlukan jawaban berdasarkan data yang ada. data analisis biasanya
menggunakan tools seperti OpenRefine, KNIME, RapidMiner, Google Fusion Tables, Tableau
Public, NodeXL, dan WolframAlpha.
5. Sebutkan masalah-masalah yang umum dihadapi oleh seorang data analyst?
Seorang data analisis seringkali menghadapi berbagai tantangan dan masalah dalam
pekerjaannya, termasuk:
a) Data yang Tidak Lengkap
b) Kualitas Data yang Rendah
c) Kekurangan Data
d) Sumber Data yang Beragam
e) Kesalahan Model
f) Keamanan Data dan privasi adalah perhatian besar
g) Perubahan Data yang Cepat
h) Ketidakpastian dan Ambigu Data
i) Kepemilikan data dan akses ke data kadang-kadang dapat menjadi masalah yang
kompleks.
j) Kesulitan dalam Mendefinisikan Masalah
6. Tools dalam python apa saja yang digunakan untuk tujuan analisis data? Jelaskan fungsinya!
1. NumPy adalah perpustakaan dasar untuk komputasi ilmiah yang menyediakan dukungan
untuk array dan operasi matematika yang cepat, membuatnya sangat berguna untuk
pengolahan data numerik.
2. Pandas adalah perpustakaan untuk analisis data yang memungkinkan untuk mengimpor,
menyimpan, dan mengelola data dalam bentuk DataFrames, serta melakukan operasi
seperti pemfilteran, penggabungan, dan transformasi data.
3. Matplotlib adalah perpustakaan untuk visualisasi data yang memungkinkan untuk
membuat berbagai jenis grafik, seperti grafik garis, grafik batang, grafik sebar, dan banyak
lagi.
4. Seaborn adalah perpustakaan visualisasi data yang berdasarkan Matplotlib, dan ini
menyederhanakan pembuatan grafik yang lebih menarik dan informatif.
5. Scikit-learn adalah perpustakaan pembelajaran mesin yang kuat yang menyediakan alat
dan algoritma untuk tugas seperti klasifikasi, regresi, pengelompokan, dan lainnya.
6. Jupyter Notebook adalah lingkungan pengembangan interaktif yang memungkinkan untuk
membuat dan berbagi dokumen yang menggabungkan kode, teks, dan visualisasi, ini
sangat berguna dalam menjalankan dan mendokumentasikan analisis data.
7. Apa saja tahapan proses SEMMA dalam metodologi data science? Jelaskan!
1. Tahap pertama yaitu Sample, Sample merupakan sebuah proses data mining yang
digunakan untuk mengumpulkan sampel yang menjadi acuan untuk mencari data yang
cukup besar dan dapat membentuk informasi yang penting dan signifikan, namun data
tersebut dapat dimanipulasi dengan cepat
2. Tahap kedua yaitu Explore, Explore merupakan sebuah proses data mining yang dapat
digunakan untuk mencari kumpulan data dan menjadi informasi yang terkait dengan tren
dan anomaly yang tidak terduga yang dapat digunakan untuk mendapatkan pengertian
dan ide. Jika eksplorasi visual tidak mengungkapkan tren yang jelas, maka dapat
melakukan menjelajahi data melalui teknik statistik termasuk analisis faktor, analisis
korespondensi, dan pengelompokan untuk mendapatlan data yang jelas.
3. Tahap ketiga yaitu Modify, Modify merupakan sebuah proses data mining yang dapat
digunakan untuk memodifikasikan data dan mengubah variable-variabel untuk
memfokuskan proses pemilihan model. Untuk memilih model maka perlu adanya
memanipulasi model data untuk memasukkan informasi seperti pengelompokan
pelanggan dan subkelompok yang signifikan, atau untuk memperkenalkan variabel baru.
4. Tahap keempat yaitu Model, Model merupakan sebuah proses data mining yang dapat
digunakan untuk memodelkan data dengan menyediakan software untuk mencari
kombinasi data yang memprediksi hasil terpercaya yang diinginkan secara otomatis. Data
yang sudah dikombinasikan dapat digunakan untuk memprediksi hasil yang diinginkan.
5. Tahap kelima yaitu Assess, Assess merupakan sebuah proses data mining yang dapat
digunakan untuk menilai data dengan mengevaluasi kegunaan dan keandalan penemuan
dari data proses data mining dan memperkirakan seberapa baik kinerja tersebut.
8.
Apa tujuan visualisasi dalam analisis data?
Tujuan utama dari visualisasi data adalah untuk menyampaikan informasi secara jelas
dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel dan grafik.
Visualisasi juga efektif untuk membantu pengguna dalam menganalisis dan penalaran tentang
data dan bukti. Visualisasi membuat data yang kompleks, bisa diakses, dipahami dan berguna.
9. Sebutkan fungsi dan implementasi data analys dalam program studi yang anda ikuti
Data analytics memiliki berbagai aplikasi dalam bidang ilmu hukum yang dapat membantu
pengacara, lembaga penegak hukum, dan profesional hukum lainnya dalam berbagai cara.
Berikut adalah beberapa fungsi dan implementasi data analytics dalam bidang ilmu hukum:
1. Analisis Kepatuhan Hukum, Data analytics dapat digunakan untuk menganalisis kepatuhan
hukum di perusahaan atau lembaga dengan memantau dan menganalisis data transaksi
dan kegiatan perusahaan untuk mengidentifikasi pelanggaran hukum atau potensi risiko
hukum.
2. Menganalisis data historis dan faktor-faktor risiko, data analytics dapat membantu
pengacara dan konsultan hukum dalam meramalkan risiko hukum potensial yang mungkin
dihadapi oleh klien mereka.
3. Dengan menggunakan data analytics, pengacara dapat menganalisis kasus hukum terkait,
preseden, dan keputusan pengadilan sebelumnya untuk mempersiapkan strategi hukum
yang lebih efektif untuk kasus yang sedang mereka tangani.
4. Penggunaan data analytics juga bermanfaat agar dokumen-dokumen hukum dapat
dikelola dengan lebih efisien melalui pencarian otomatis, klasifikasi, dan analisis konten,
yang memudahkan pengacara dalam menemukan informasi yang relevan dan penting.
5. Dengan menggunakan teknik prediktif, data analytics dapat membantu dalam
memprediksi hasil kasus pengadilan berdasarkan faktor-faktor tertentu, sehingga
memungkinkan pengacara untuk merencanakan strategi yang lebih baik.
6. Data analytics dapat digunakan untuk memantau kinerja pengacara, departemen hukum,
atau firma hukum dalam hal produktivitas, kepatuhan, dan hasil kasus untuk
meningkatkan efektivitas operasional.
Download