- AutoX贡献者意向成员群
- Email: [email protected]
- 找到自己感兴趣的issues;
- 在issue下方留言, 表明自己即将在感兴趣的issue上展开工作,我们的社区维护者将会把该issue的assignee变更为你;
- 你现在可以正常地编写代码,提交PR了.
欢迎将其他开源的数据集加进来,数据处理方法参考 MovieLens_data_process.
组件 | 状态 | code |
---|---|---|
流行商品召回 | 已完成 | popular_recall |
历史购买召回 | 已完成 | history_recall |
ItemCF | 已完成 | itemcf_recall |
UserCF | 待认领 | |
BinaryNet | 已完成 | binary_recall |
Swing | 待认领 | |
分组流行商品 | 待认领 | |
w2v内容召回 | 已完成 | w2v_content_recall |
NLP内容召回 | 待认领 | |
图像内容召回 | 待认领 | |
Random graph walk | 待认领 | |
负样本降采样 | 待认领 | |
User特征 | 已完成 | user_feature_engineer |
Item特征 | 待认领 | |
交互特征 | 已完成 | interact_feature_engineer |
Lightgbm ranker | 已完成 | ranker |
Lightgbm binary | 待认领 | |
Xgboost binary | 待认领 | |
Catboost binary | 待认领 | |
transformer | 待认领 | 参考 |
- 版本(git commit号): a0be65232cc1b929b919268310d4474c4274521c
- 效果
数据 | 调用代码 | map@12 |
---|---|---|
MovieLens | MovieLens_AutoX_recall_and_rank | 0.08030 |
HM | HM_AutoX_recall_and_rank | 0.02436(public score) |
内部数据-某服饰客户 | None | 0.47096 |
- 版本(git commit号): e223402e6de967e9821df9037e58361751ac0b6c
- 效果
数据 | 调用代码 | map@12 |
---|---|---|
MovieLens | MovieLens_AutoX_recall_and_rank | 0.07350 |
HM | HM_AutoX_recall_and_rank | 0.02616(public score) |
内部数据-某服饰客户 | ms_AutoX_recall_and_rank_0520.ipynb | 0.46964 |
组件 | 优化点 | 状态 |
---|---|---|
ItemCF | 并行化 | 待认领 |
UserCF | 并行化 | 待认领 |
交互特征 | 优化 | 待认领 |
做一些创新的研究, 在有效果的基础上, 可以合作发论文(有第四范式研究员以及高校老师合作)。
- 思路1: 推荐系统结合多模态(例如结合图像和文字描述学习商品的表征用于冷启动)
- 其他: 欢迎提出其他的一些思路来沟通.