Uploaded by 李宛虹

Python 資料分析作品集必備的5個專案

advertisement
資料分析師
必備的5個專案作品
這些專案
你都沒做過?
還說想當
資料分析師?
想轉職資料分析師除了要熟練地掌握 Python 及各種資料分析的技巧外,
另一個最多人忽略的重點是作品集。擁有一個好的資料分析作品集,不僅
能向面試官展現你的積極更能透過作品集展現你在分析資料時有條不絮的
態度,這可是成為資料分析師的一個非常重要的特質 。
在這篇懶人包中,我們為你整理出了
「資料分析作品集中 5 個必備的專案」,就讓我們繼續看下去吧!
1. Titanic
存活率預測相信許多人對於這個資料集並不陌生,也許你可能已經利用這
份資料集做過一些分類演算法的練習了。這份資料的特別之處在於其資料
非常的“髒”,我們在過去所學到的資料預處理的技巧都可以很完美的透
過這份資料集展現出來,同時Titanic存活率預測也是 Kaggle 上最多人參
與的競賽之一,可謂是資料分析競賽中的南喬峰。
問題分類:分類
難度:
資料集網址 : https://www.kaggle.com/c/titanic
2. 房價預測
如果說 Titanic 是資料分析競賽中的南喬峰,那麼同樣在 Kaggle 上的房
價預測則是名副其實的北慕容。這份資料集不僅僅包含了 80 個自變數,
同時自變數的種類繁多,都需要一個個的下去進行處理跟分析,很適合
作為一開始的前幾個專案,預測結果甚至能投稿至比賽平台取得一定的
分數,如果成績優異的話可是會讓面試官另眼相看呢!
問題分類:迴歸
難度:
資料集網址 :https://www.kaggle.com/c/house-prices-advanced-regression-techniques
3. 信用卡詐騙偵測
雖然說 Titanic 存活率分析可以讓我們練習多數的資料預處理方法,不過
若想要展現你在針對不平衡資料集(Imbalanced Dataset)的熟練程度,
就不能不提信用卡詐騙偵測這份資料聚集。
這份資料集的特別之處在於發生信用卡詐騙的機會非常的小,因此在這個
命題下的資料不可能是平衡的資料集(Balanced Dataset),所以非常適
合練習不平衡資料的預處理方法。
問題分類:分類(不平衡資料)
難度:
資料集網址 :https://www.kaggle.com/mlg-ulb/creditcardfraud
⧺倞耂갸庠
ਸ਼ʟʰࡘ!4!࢏અΏೡ‫ڟ‬ཥट˷ટरʹĂЃَѱဇьഓჭՐ௎୩ĞOMQğۨ
લФ፹ቸф੅๳Ⴘྱഁ௻ϋཥट෱ѱʙ‫˚ס‬৖Ꮏ྆Ą
ੰᖠ˷ᘸĈ˷ᘸ
ᘲ‫ݙ‬Ĉ!
ཥट෱Ⴉҭ!Ĉ!iuuqt;00xxx/lbhhmf/dpn0dmnfoucjtbjmmpo0gblf.boe.sfbm.ofxt.ebubtfu
鎖
解
專人
1
將由專
解鎖內容
供
提
並
,
您
繫
聯
人
2
驗
體
程
課
上
免費線
)
0
0
0
,
3
$
價
市
(
3
專業顧問
學習規劃
掃描 QR code / 搜尋 www.xuemi.co
預約講師免費諮詢
48 小時Pyrhon線上學習
Download