1.参加过 Kaggle 比赛 Forest Cover Prediction,对给定区域的森林的基本信息,判定森林的所属类型,多分类任务。所用软件:Python,及 R 的机器学习算法包。
2.天池大数据比赛口碑预测,给定某时间段某特定商家的信息及交易信息,预测给定时间段内各商家的销售量,回归问题。所用软件:Python 及 SQL Server。
3.Jdata 算法比赛,跟定时间段的给定商品的基本信息及交易信息和特定用户的信息,预测未来时间内最有可能发生购买行为的用户商品对,排序问题。所用软件:
Python,R 及 SQL Server。
4.Kaggle 的 Quora Question Pairs 比赛,给定问题对,及相同与否,利用自然语言处理的算法包,判别待预测问题对的语义相同与否。所用软件:Python,R 中的机器学习及自然语言处理算法包。
在希嘉创智科技有限公司实习,主要应用 pyspark sql,ml 等进行常用算法部件的封装,建立一个可视化的大数据机器学习算法处理平台(类似于阿里云的数加平台),目前正在负责搭建分布式深度学习组件(接口是 Intel 的 BigDL,CPU 版本)。
可兼职时间
可兼职地点
0条评论 雇主评价