5年以上Go、python、C++系统工程开发经验;
熟悉k8s及容器化技术,拥有4年以上k8s开发及GPU集群维护经验;
熟悉linux内核(网络/IO部分),熟悉ebpf,能够进行高性能系统开发;
熟悉分布式系统开发,拥有大规模分布式系统开发及运维经验,熟悉raft、multi-raft、gossip、一致性哈希等算法;
熟悉AI框架Pytorch、Horvord源码,能够对其进行二次开发;
在AI Paas平台与AIOT平台领域,具备丰富经验;
项目一:负责公有云 AI PaaS 平台设计、研发工作
基于公有云产品,为客户提供大规模机器学习产品和解决方案。涉及分布式训练平台与在线推理平台。在该项目中负责各子系统研发、优化与集群管理工作。
项目二:AIot智能设备管理平台
该项目为以人脸识别为核心的智能终端设备解决方案。目前该系统已成为人脸识别测温面板、手持机、智能盒子、摄像头等诸多设备的一体化管理平台,目前已稳定承载数万设备运行。
项目三:大规模AI视频分析平台
该项目主要为面向摄像头终端场景的视频流分析解决方案。 结合AI算法对视频数据进行分析,具备低延时、高可用、可扩展等特性。单集群即可支持万级视频设备稳定运行。
项目五:强化学习系统优化
利用Golang对强化学习项目进行重构,重构代码量达4万行,重构后qps提升4倍,内存使用量降低75%。
可兼职时间
可兼职地点
0条评论 雇主评价