## 技术经验积累 - 坚持学习的过程
1. 金融IT行业运维管理经验,熟悉主流基础运维架构建设;
2. 积极探索新技术方案进行尝试和测试,用技术满足业务发展需求;
3. 维护业务系统各项服务,持续查找并修复问题,保障业务稳定运行;
4. 应急响应线上故障报警,在故障时成为快速解决问题恢复业务的消防员;
5. 积累系统运维的最佳实践,制定运维规范和策略,并实现文档化;
6. 认同并坚持“Don't Repeat Yourself”的原则,努力实现“Automate Everything You Can”。
领英.LinkedIn - Keep in touch and find opportunities
https://www.linkedin.com/in/aowang
## 项目经验 - 技术沉淀的过程
> 2015/09 - ?
(1) 主要负责主机、存储、虚拟化等领域,熟悉IBM/Lenovo/HP/Dell等主机硬件,EMC/3PAR/HUAWEI等中高端存储,Brocade存储交换机配置,VMware vSphere/Horizon View数据中心及桌面虚拟化的建设和改造,熟悉RHEL原理和Bash Shell/Python自动化脚本运用,熟悉Veritas InfoScale高可用和NetBackup备份恢复系统。
(2) 协同负责两地三中心保障,张江(主)+外高桥(灾备)+大连(远备)共计305台主机和存储设备,推进小型机往x86服务器的转化,积极推动非核心生产和数据库服务器的私有云化。
(3) 作为主要负责人制定并实施4个升级改造类项目,外高桥B环境,张江仿真,金桥开发测试和外高桥新金融大数据,熟悉项目生命周期,数据中心实施标准,VMware 5至6跨版本升级,EMC存储性能优化,VMware和OpenStack在Dell刀片服务器上混合部署,Cloudera自动化安装,基线配置,JBOD自动化分区等。
(4) 参与3个协作项目创新实验室NVIDIA Tesla GPU计算,交易系统部Solarflare低延迟万兆交易调优,测试中心OpenStack迁移,参与内部项目Dell FX2超融合架构,VMware vSAN/RedHat Ceph分布式存储等技术预研。
(5) 作为项目经理协同实施张江核心业务区备份架构调整,完成SAN-Client+MSDP池二级备份加速,单通道提速1.6倍时间减少45分钟,改造后的业务区虚拟机约13TB加速备份每天只需要15分钟。在外高桥升级改造项目中实现SAN网络core-edge架构调整,降低光纤跳线复杂度,提高SAN网络灵活性和扩展性。
(6) 独立并主动完善CMDB配置信息表,跳线标签信息自动公式化,交换机配置命名规范统一自动化,VMware模板标准化,编写标准化运维操作手册,推广云霁科技Cloudboot自动化部署,编写基于Bash Shell的自动化脚本辅助现有运维系统在SSH信任关系,自动化分区,并发执行等功能。
(7) 协作开发基于Python和pyVmomi的VMware vSphere自动化管理脚本,实现对ESXi和vSphere批量化操作管理,通过标准化的ova模板,网络标签和存储规划,将虚拟机部署时间压缩至1台和多台近乎等同的分钟级别,实现网络IP,主机名,分区一次性配置即可使用。
(8) 加入由7人组成的跨部门自动化运维平台敏捷开发小组,主要负责基础环境选型和基于Ansible的主机自动化管理,团队内部协作所使用到的技术包含但不会局限于CentOS/MySQL/Python/virtualenv/PyPI/Django/Git/Gitlab/
Jenkins/JIRA/Samba/PyCharm/Visual Studio Code等。
> 2015/07 - 2015/08
(1) 从0到1的CMDB资产梳理,包括3个IDC和2大云平台在内共计212台云主机和96台物理托管设备
(2) 熟悉IDC,DNS(DNSPod),CDN(蓝汛),Ucloud,Qcloud,Aliyun等服务,和厂商保持长期友好联系。
(3) 独立研究和实现基于LTMP(CentOS+Tengine+MySQL+PHP)的全自动化部署和系统调优
(4) 独立研究和实现基于XtraBackup技术不停机不锁表完成在线生产MySQL数据库的主从同步
(5) 独立研究和实现基于sersync配置rsync+inotify实现数百GB数据实时同步
(6) 独立研究和实现基于ELK(Elasticsearch+Logstash+Kibana) 搭建日志集中分析平台
(7) 研究Nginx性能调优/负载均衡,MemCache/Redis内存缓存,Zabbix分布式监控等
(8) 基于阿里云DTS实施电信南汇至阿里云RDS的数据库迁移,耗时10小时完成400GB传输
(9) 应急响应处理20GB以上的DDOS持续攻击,研究和分析阿里云和电信的安全防御差异
---
> 2012/07 - 2015/06
(1) 熟悉Linux/AIX高可用完整架构,熟悉Oracle/SQL Server数据库和Weblogic中间件技术,熟练使用Bash/Python编写自动化部署、清理、监控等脚本满足日常运维需要,协同管理超过47套系统共计214台主机系统和存储设备。
(2) 参与4套PCI-DSS安全审计项目系统主机安全加固,独立开发编写自动备份和整改安全加固脚本,和厂商合作愉快并保持长期友好联系。
(3) 独立负责超过11套共计78台x86服务器和小型机的数据中心业务系统上线或迁移工作,组织电力、存储和网络相关同事制定统一规范的标准流程。
(4) 协同参与基于Cisco UCS刀片服务器和KVM/VMware虚拟化技术的云平台建设,独立编写测试报告并反馈1处严重级别Bug,引起领导特别重视。
(5) 通过3个月时间独立研究、测试和实施基于Windows 2008R2故障转移集群和SQL Server 2012 AlwaysOn技术的上海与武汉两地3中心架构,实现跨区域网络和存储的高可用建设。
(6) 独立研究和实现基于PXE协议的自动化SLES云部署方案,节省超过45分钟时间实现快速安全统一化定制部署,得到同事和领导的认可和推广应用。
(7) 独立研究和实现基于Corosync /OpenAIS +Pacemaker搭建银行金融级别SuSE HA高可用集群,完整搭建Active/BackUp, Active/Active 和 N+1 主动/被动3种模式,用于代替国产Skybility HA。
(8) 独立研究和实现基于Kickstart自动化部署CentOS大数据Hadoop集群系统,在1小时内完成18台x86国产浪潮服务器的所有配置,包括2台NameNode,4台AppNode,12台DataNode节点。
(9) 独立研究和实现基于Bash+Expect的轻量级数据中心批量管理框架,模块化功能设计学习成本低,支持ssh密码交互和私钥两种登录方式,特点是针对不同需求场景支持`顺序`和`并发`两种执行命令调用,包含详细的日志记录。
可兼职时间
可兼职地点
Can Yurdaer 2016-10-08 16:44
OX is a true server professional. I found him quite knowledgable & cabaple of sorting out the given problems so efficiently. I'd be happy to take his services again in near future. 我们工程师的留言