精通Python,Flask,FastApi,pandas,sklearn,Spark,COZE,Dify
熟悉MySQL,MongoDB,Nanovector以及Redis和Elasticsearch
熟悉BERT,transformers,LLaMA-Factory、modelscope/swift、Ollama、DeepSpeed、Megatron-LM、Langchain
熟练掌握:Linux 系统,shell、三方件编译,mysql数据库、Milvus向量数据库
熟悉熟练掌握:Flask、Fastapi、熟悉使用阿里云、mindspore、pytorch框架
熟悉分布式系统、缓存、消息队列和数据库设计优化
具备Linux,Docker、Kubernetes实战能力
1、负责公司的AI智能客服系统开发与迭代升级,实现电商客服系统商业化应用
2.主导大模型应用研发及能力,进行汽车点位识别分类200种准确率90%
3.负责开发多个基于 Coze 的智能体,涵盖多种应用场景,包括客服、政务等领域
4.主导开发基于字节大模型、知识库、向量数据库技术底座的知识中台
5、负责大模型的选型,建立代码评审机制,落地CI/CD流水线,部署效率提升60%
6、指导培训公司内部大模型的应用,分享大模型前沿知识并且落地新技术
7、在AI客服项目在知识库检索做集群优化,平均响应时间<50ms
8、负责核心算法项目的规划、实施和交付,保证项目进度和质量
项目名称:基于 LangGraph 的智能 Text-to-SQL 工作流编排系统
项目时间:2025.06 - 至今
项目背景: 在企业数据分析场景中,业务人员需要频繁查询数据库获取业务洞察,但面临技术门槛高、Schema 理解困难、复杂查询易出错等痛点。为解决非技术人员无法直接编写 SQL、需要依赖数据分析师导致响应周期长的问题,设计并实现了一套基于 LangGraph 的智能 Text-to-SQL 工作流编排系统,支持业务人员通过自然语言直接查询数据库,自动生成准确的 SQL 并返回分析结果,显著提升数据分析效率。
项目简介:设计并实现了一套完整的 LLM 工作流编排系统,支持自然语言到 SQL 的智能转换,涵盖多步推理、Agent 协作、RAG 检索优化、自动化评估与质量保障等核心能力。 技术栈*:Python、LangGraph/LangChain、FastAPI、Pydantic、FAISS/Milvus、MySQL、Redis、Docker
工作内容: 1. 工作流编排:基于 LangGraph 设计并实现 3 种工作流架构(V1 并行/V2 简化/V3 迭代规划),支持条件路由、错误恢复、mid-SQL 执行,V3 工作流达到 100% 成功率,平均 22.3s/问题
2. RAG 优化:实现多路检索融合(TableRAG 向量检索 + BM25 + GraphRAG 知识图谱),通过上下文压缩优化 Token 消耗 80%(从 ~5500 降至 ~800),检索准确率提升 18%
3. 评估体系:建立自动化评估框架,实现 SQL 语义对比工具、性能指标追踪(延迟/Token/错误率),支持 A/B 测试对比不同检索模式,迭代 9 个版本持续优化
4. 工程化:集成 Logfire(OpenTelemetry)实现端到端可观测性,支持工作流版本管理、Prompt 模板版本化、实验追踪,建立三级缓存机制(内存 TTL → 文件 → 数据库)提升 Schema 加载速度 10x
5. 平台化:提供 FastAPI 微服务 RESTful API、Python SDK(支持同步/异步/流式查询)、8 个 CLI 工具,支持多数据源切换与知识图谱索引
核心成果: V3 迭代规划工作流:100% 成功率(6/6 问题),平均22.3s/问题,21,657 tokens/问题,支持自适应2-5 步规划- RAG 优化:Token消耗减少80%,检索准确率提升 18%,支持50W+文档/实体检索,平均响应延迟<150ms -
评估体系:建立完整基准测试流程,支持自动化评估与性能对比
工程化:端到端可观测性,支持版本管理、实验追踪、灰度发布
基于字节大模型的AI知识中台(2024.12-2025.03)
技术栈:技术栈:Python、FastAPI、Docker、Kubernetes、Redis、Elasticsearch/Milvus、PyTorch
项目简介:基于字节大模型(LLM),搭建统一的 AI 知识中台,打通多源文档、知识图谱与向量检索能力,为智能客服、舆情分析、内部助手等下游应用提供一站式问答/检索服务。 可以提供小程序、H5等接口。
核心成果:核心成果:
1.支撑知识量级50W+文档/实体,检索平均延迟<150ms;
2.上线后3个月内为客服机器人日均2K+次检索请求提供服务,问答准确率提升18%;
3.与前端协同完成4套页面原型、5个交互接口的灰度联测,系统上线后稳定运行60+天无故障。
可兼职时间
可兼职地点
0条评论 雇主评价