实现网
rocluo

昵称登录后显示

1200/8小时
3年工作经验

微软
机器学习算法工程师

机器学习
自然语言处理
情感分析
文本分类
深度学习

1

被预约次数

7

被收藏次数

1

被评价次数

擅长技能

1.北大机器学习硕士毕业,3年机器学习经验,具有扎实的机器学习算法理论基础。
2.工作于微软,从事机器学习深度学习相关研发工作。
2.掌握常见的聚类、分类、回归算法。
3.熟练掌握keras、tensorflow, 具有深度学习项目研发经验。
4.多次参加机器学习相关竞赛并取得top成绩。

项目经验

1.基于主题捕捉HAC(层次聚类)的网页人名消歧
把含有相同名字的网页聚成不同的类,每个类表示同一个人的描述。
使用BeautifulSoup进行网页解析,特征包含网页标题、链接、元数据、snippet、上下文窗口、词窗口等特征;
使用HAC+Topic进行聚类比单纯使用HAC的F1-Measures得分提升2.2%;
后来使用GBDT进行聚类阈值的学习,使用GBDT+HAC+Topic比HAC+Topic又提升了2.1%;

2.智能客服系统
负责CDSSM(卷积深层结构语义模型)的训练,为聚类和搜索提供sentence2vec接口。
负责建立agent提问的树结构, 采用不确定分支的层次Kmeas++,并对k进行一定的惩罚;
对聚好的每个类进行关键字提取,采用TextRank实现,并对关键字做后续调整。
负责对用户的提问进行结果的搜索排序,采用三层排序结构,第一层BM25+iCDSSM,第二层CDSSM,第三层pairwise。

3.基于SVM的短文本(query/title)多分类系统
实现超过3000个类的短文本多分类系统,现主要为线上query和广告title进行分类后计算相似性。
使用word2vec扩展特征,首先用类名字找出一些相近的词作为特征词,然后把短文本中的重要性高的词扩与特征词计算余弦相似度,取top5作为扩展特征。
其分类准确率提升了0.4%。

4.基于深度学习的中文语义匹配
使用CNN/BiLSTM简历深层语义模型,为智能客服系统提供语义理解接口,用于系统的答案检索

1条评论 雇主评价

  • 822c2599accfb199308758157210f90c

    瞳孔 2018-04-14 20:31

    工作认真负责,能体现专业素质

可兼职时间

周六全天
周六半天
周日全天
周日半天
工作日下班后

可兼职地点

海淀

被预约

1

被收藏

7

被评价

1

暂停预约

可兼职时间

周六全天
周六半天
周日全天
周日半天
工作日下班后

可兼职地点

海淀

已通过身份认证