实现网

爬取facebook公开组的成员信息 远程兼职

一般月薪3000元
项目类型:数据挖掘/爬虫
每月工作: 3天
工作方式:远程

职位详情

一,主要功能:
抓取facebook公开小组成员信息

二,开发语言:
python

三,环境说明:
facebook需要翻墙才能访问,开发者需要解决翻墙问题。甲方的翻墙环境不需要开发者提供,交付时程序能在甲方网络(已翻墙)正常运行即可。

四,详细功能:
1,抓取facebook公开小组信息,包括名字,居住地,大学,工作,联系方式,性别,网站和社交链接,婚姻状况,昵称(其他名字),最近发照片或视频的时间(以下简称最近活跃时间),3张相册图片。

2,用户分级: a 最近活跃时间,超过两年没发内容的组成员为不活跃,直接抛弃不用抓取。b 名字,居住地,昵称/其他名字, 包含中文/繁体/拼音的,拼音识别可以不是100%准确,如果自己实现需要说明思路,引用第三方库需要给出链接。c 抓取组成员最近发的照片,按发帖时间倒叙抓取,直到取到3张带人脸的照片停止。
等级依次递增,高等级包含低等级条件,例如,c等级用户一定满足a和b

3,输出成果: 把查询结果输出到execl文件中,可以同时按照最近活跃时间,用户等级排序,有无图片,图片要关联到execl中,点击可以查看。

五,验收标准:
1,开发者提供项目源码,安装的依赖需要说明功能和安装名,函数需要有注释,长代码段中需要有必要注释。
2,甲方测试通过

13fcacdaf7d3940d64e37fc0a65f4cd7
昵称登录后显示 3 年多前
公司地址 大连
团队人数未填写
融资情况未透露
产品介绍

暂无介绍

团队介绍

暂无介绍