Skip to content

Latest commit

 

History

History
44 lines (34 loc) · 789 Bytes

README.md

File metadata and controls

44 lines (34 loc) · 789 Bytes

Titanic: Machine Learning from Disaster

Libraries

  • numpy
  • pandas
  • matplotlib
  • seaborn
  • sklearn
    • RandomForestClassifier
    • cross_val_score
    • preprocessing

Columns

  • Name:乘客的姓名
  • Sex: 乘客的性別
  • Age: 乘客的年齡
  • SibSp: 兄弟姊妹的數量
  • Parch: 直系血親的數量
  • Ticket: 船票的訊息
  • Fare: 船票的價格
  • Cabin: 住的客艙編號
  • Embarked:登船港口 ( C / Q / S )
  • PassengerId:乘客的流水 ID 編號
  • Survived:是否存活

Process

  1. 匯入資料和套件
  2. 觀察不同欄位對存活率的影響
  3. 年齡資料補遺
  4. 特徵選取
  5. 特徵標準化
  6. 模型選擇,採用Radom forest model
  7. 訓練模型和預測結果
  8. 交叉驗證
  9. 提交結果

Model Performance

Public Score: 0.77990