- numpy
- pandas
- matplotlib
- seaborn
- sklearn
- RandomForestClassifier
- cross_val_score
- preprocessing
- Name:乘客的姓名
- Sex: 乘客的性別
- Age: 乘客的年齡
- SibSp: 兄弟姊妹的數量
- Parch: 直系血親的數量
- Ticket: 船票的訊息
- Fare: 船票的價格
- Cabin: 住的客艙編號
- Embarked:登船港口 ( C / Q / S )
- PassengerId:乘客的流水 ID 編號
- Survived:是否存活
- 匯入資料和套件
- 觀察不同欄位對存活率的影響
- 年齡資料補遺
- 特徵選取
- 特徵標準化
- 模型選擇,採用Radom forest model
- 訓練模型和預測結果
- 交叉驗證
- 提交結果
Public Score: 0.77990