毕业于深圳大学,英国Sheffield CS硕 candidate
自然语言处理和爬虫linux开发经验2-3年
NLP模型开发,包括但不限于文本分类,实体识别,语义等价
爬虫框架 scrapy celery分布式 或者原生编写都可以,反爬经验丰富
爬虫工作沟通时请明确具体需求说明(包括爬取信息格式,存取形式,爬取网站,必要的登录信息,项目时间规划)
这边负责一次性抓取数据,然后打包成需要的格式,后续维护需要再商议附价。
工作项目:
负责上百个网站新闻的数据爬取,后处理,入库
负责NLP模型开发,包括但不限于文本分类,实体识别,语义等价
业余项目:
独立开发出一套基于celery分布式爬虫监控系统demo
自然语言处理比赛爱好者,包括虚假新闻识别挑战赛top4
可兼职时间
可兼职地点
0条评论 雇主评价