🌐 GraphRAG 开发者挑战赛——法律文档处理(原型) 职位类型: 合同 / 自由职业 报酬方式: 仅在通过评测(总体得分 95% 以上)后支付 开发周期: 从接收材料起 7–10 天内完成现场演示 项目范围: GraphRAG 原型(无前端、无生产环境) 我们正在寻找一位紧跟当前图结构检索(Graph-based Retrieval)研究的专家,能够为法律文档设计一个高精度 GraphRAG 管道系统。 本项目不是聊天机器人或界面开发项目,也不是比拼延迟速度的竞赛。 系统可包含多跳检索或智能 Agent 调度。 知识图谱的构建与遍历属于项目范围。 ⚠️ 必须实现 GraphRAG,而非普通的 RAG! 📂 你将获得的资料 /docs/ → 10 份预处理的 Markdown 法律文档(包含丰富元数据) /sample_questions.json → 2 个示例问题(格式参考) /sample_answers_rag.json → 2 个示例答案(风格与结构参考) 以上仅为格式参考。正式评测将使用未公开的新问题。 🛠️ 你需要完成的内容(仅限原型阶段) 请在 Python 3.12 环境下(Poetry 项目结构)实现以下两个函数: def ingest(document_paths: List[str]) -> None: """导入提供的法律 Markdown 文档,构建知识图谱等。""" def query(questions: List[str]) -> List[str]: """返回基于检索结果的答案,并使用 Vancouver 风格的引文格式。""" 要求: 无需前端 UI、无需 API Key、无需云环境; 可使用任意技术栈,重点在于方法与结果; query(...) 必须支持并行执行,并能在终端显示进度; 在 60 分钟的现场测试中需处理约 400 个问题。 🧪 评测与报酬(如何获得支付) 你在本地使用示例文件进行开发与调试; 现场测试时(60 分钟内),我们提供约 400 个新问题; 你运行 query(...) 并生成 /answers.json 文件; 我们使用 LLM 作为评测者对你的答案进行打分(你无需构建评估框架)。 若你的总体得分在以下四项指标中超过 95%,则视为通过: 忠实性(Faithfulness):无幻觉,回答内容来源明确; 相关性(Relevance):检索内容与问题高度匹配; 完整性(Completeness):覆盖问题的所有关键要点; 清晰度(Clarity):结构清晰、逻辑严谨、法律表达规范。 通过后需提交完整代码库(包含仓库、Poetry 锁文件、运行说明及技术说明文档)。 我们验证可复现性后支付报酬,并考虑与你签订长期合作。 注意事项: 不使用 F1 指标; 不考察延迟时间; 官方统一运行评测; 若未通过评测 → 无报酬,你保留代码所有权;不做例外处理。 英文版:We’re hiring an expert who follows current graph-based retrieval research and can design a high-accuracy GraphRAG pipeline for legal documents. This is not a chatbot/UI project and not a latency contest. The system may include multi-hop/agentic orchestration. Knowledge-graph construction and traversal are in scope. Must be GraphRAG not vanilla RAG! ---------------------------------------------------------------------- 📂 What You Receive - /docs/ → 10 pre-processed Markdown legal documents (rich metadata) - /sample_questions.json → 2 sample questions (format reference) - /sample_answers_rag.json → 2 sample answers (style/structure reference) These are for orientation only. The live benchmark uses unseen questions. ---------------------------------------------------------------------- 🛠️ What You Must Build (Prototype Only) Expose exactly two Python functions (Python 3.12, Poetry project): def ingest(document_paths: List[str]) - None: """Ingest the provided legal markdown documents, build knowledge graph etc.""" def query(questions: List[str]) - List[str]: """Return answers as strings with Vancouver-style citations grounded in retrieved sources.""" - No UI, no API keys provided, no cloud required - Use any stack—we care about your approach and results, not tools - query(...) must support parallel execution to process ~400 questions in the 60-min live session. Must show a progress indicator in the terminal. ---------------------------------------------------------------------- 🧪 Demo & Evaluation (How You Get Paid) - You implement locally using the samples for orientation - Live 60-min session: we provide ~400 questions - You run query(...) live and produce /answers.json - We run the benchmark (LLM-as-judge) on your answers; you don’t need to build an evaluation framework If your overall score is more than 95% across: • Faithfulness (no hallucinations; grounded in retrieved text) • Relevance (retrieval matches the query) • Completeness (key points fully covered) • Clarity (clear, structured, legally coherent) You hand over the entire codebase (repo, Poetry lock, run instructions, and short tech note). Payment is released only after you deliver the full repo and we verify reproducibility. You are considered for hiring/further engagement. NOTE: - We do not use F1 - We do not measure latency - We run the benchmark - Fail → No payment; you keep your code. No exceptions
招聘|Python 后端兼职】亚马逊竞品数据自动采集与分析脚本开发 —— 可远程,个人开发者优先 🧩 项目简介 本项目用于亚马逊选品分析:基于 SellerSprite API + Keepa API,实现自动采集竞品数据 → 清洗 → 生成 Excel 报表,并能定期自动更新。 仅使用官方 API,不做爬虫。 📊 核心需求(必须实现) 1️⃣ 数据采集模块 SellerSprite: /v1/product/competitor-lookup(竞品查找) /v1/traffic/keyword(关键词流量) Keepa(精简版,可选):历史价格、BSR、评论趋势、上架时间(Date First Available) 2️⃣ 数据输出模块(仅以下字段,其他不需要) 固定列: 记录日期|类目名称|产品图片|链接|ASIN|品牌|父体销量|类目排名|价格|评分|评论|上架时间|变体数量|变体类型| 变体1销量|变体1规格|变体1价格|变体2销量|变体2规格|变体2价格|变体3销量|变体3规格|变体3价格 说明: 记录日期、类目名称:每次采集自动写入; 变体仅展开 Top3(按子体近30日销量优先,若不足3个则留空)。 3️⃣ 采样/选品模式 模式A:正态分布随机抽样(≥30个) 从 SellerSprite 返回的候选竞品池中,按类目排名/销量分布抽样;可设置参数:--sample-size、--std、--seed 等。 模式B:手动指定竞品 支持直接传入 ASIN 列表或文件,可选中需要调查的竞品,而不是随机抽样。 4️⃣ 自动更新模块(基础版) 命令行参数:--update daily | weekly | monthly 日更:价格、评分、评论数、BSR; 周更:关键词与广告词数据; 月更:趋势汇总(BSR、价格曲线); 自动覆盖 Excel 对应字段,生成日志。 5️⃣ 配置与日志模块 config.yaml:存放 API Key、输出路径、更新频率、列名顺序; 限流与重试机制(429、超时自动重试),支持断点续传; 日志文件:error.log。 6️⃣ 上传与共享模块 在生成 Excel 文件后,系统可选择自动上传到 腾讯文档表格,实现团队共享; 通过 腾讯文档开放平台 API(HTTP 调用)实现: 支持创建/更新指定文档; 可设置更新模式:覆盖指定区域或追加行; 自动填充日期、类目、ASIN 等字段; 上传成功后返回腾讯文档链接写入日志。 🧠 技术要求 Python 3.10+;requests / pandas / openpyxl / tenacity /tencentcloud-sdk; 熟悉 REST API 调用与 JSON 解析; 有 Excel 生成与在线文档 API 对接经验优先; 能独立完成限流/重试逻辑;命令行工具即可,无需前端; 若后期扩展 Web 界面(上传类目/关键词),可再议长期合作。
们需要一位有经验的工程师,将现有的交易算法(目前运行在某零售交易平台上)重构为独立应用,使用 Java 或 Python 编写,并通过 FIX 直接连接市场。解决方案必须支持净额账户(netting,禁止对冲),并将原平台的订单类型准确映射到券商的 FIX 等价物(止损、限价,以及带价格改善的入场逻辑)。 该角色不仅要实现策略本身,还需搭建最小可用执行环境——包括会话管理、订单管理、风险检查和日志记录等。 必备能力 具有构建生产级 FIX 引擎的成熟经验(Logon/Heartbeat/消息重放、缺口处理、持久化、重连)。 在净额账户/净额撮合场景下进行实盘订单路由:Replace/Cancel 流程、部分成交、IOC/FOK、TIF 处理。 能在零售平台语义(止损/止盈、内部订单ID)与 FIX 字段(ClOrdID、OrigClOrdID)之间进行映射。 编写低延迟、容错代码,具备幂等的订单处理能力。 精通 Java(QuickFIX/J) 或 Python(quickfix);熟悉 Kafka/Redis 更佳。 交付物 使用地道的 Java 或 Python重写的策略逻辑(含单元测试)。 FIX 连接器,并提供至少一个参考券商的配置。 面向净额账户的订单与头寸管理模块。 仿真模式(CSV 日志)与轻量级监控看板。 Docker 化部署与运行手册(runbook)。 回复中请包含 2–3 个过往 FIX 项目(你的角色与工作范围)。 你更倾向使用 Java 还是 Python,以及原因。 你通常使用的 FIX Store/日志方案及原因(例如 JDBC/FileStore、内存+外部持久化等)。 简述你会如何将零售平台的 SL/TP/市价单映射为净额场景下的 FIX 表达(含 ClOrdID/OrigClOrdID、Replace/Cancel 流程、TIF/IOC/FOK 等)。 MVP 的大致时间线和预算。
【专业合作】计算机视觉项目:基于OpenCV实现书法字的毫米级网格对齐与差分测量系统 一、 项目核心概要 我们致力于开发一款书法教学小程序的核心评分引擎。本项目并非依赖难以把控的深度学习,而是**通过特制的毫米级刻度网格纸,将书法评价转化为一个高精度、可量化的图像测量问题**。技术路径清晰,目标明确。 二、 核心技术挑战与思路(项目基石) 我们已定义清楚核心任务,您需要解决以下两个关键问题: 1. 高鲁棒性的网格识别与亚像素级对齐: 目标:从用户拍摄的、可能存在透视变形、光照不均、部分笔迹遮挡的作业图片中,稳定、精确地识别出1mm间距的网格线。 输出:计算透视变换矩阵,实现与标准模板的**亚像素级别精准对齐**,为后续测量奠定基础。 2. 基于网格坐标系的笔画量化比对算法: 目标:** 在对齐的坐标系下,提取学生字与标准字的笔画轮廓。设计算法,**定量计算关键点的位置偏差(精确到毫米)、笔画粗细均匀度等指标**,并合成科学评分。 输出: 可视化的比对结果(如红透覆盖效果)及结构化数据。 三、 技术栈与交付要求** - 必需技术栈:精通 **Python/OpenCV** 或 **C++/OpenCV**,必须有实际的图像处理/测量项目经验。 - 必需交付物:完整的、可部署的**源代码**、技术文档及一个可演示的微信小程序原型。 - 项目周期:3周内完成核心开发与测试。 四、 项目预算与合作模式 - 项目预算:人民币1.5万元 - 2.5万元。我们重视代码质量与解决方案的优雅性,对于能提出更优技术方案的开发者,预算可议。 - 合作模式:项目制外包。 - 付款方式(保障双方权益) 我们提议采用 3/5/2 的分期付款模式,即合同签订后付30%,核心功能Demo通过后付50%,全部上线验收合格后付尾款20%。具体可协商。 五、 下一步(意向开发者请按此要求沟通) 为高效筛选,请在联系时**务必提供以下信息**,否则将无法回复: 1. 技术思路: 针对“网格线的鲁棒性识别”挑战,简述您的解决方案(例如,如何应对笔迹遮挡和透视变形)。 2. *初步评估:基于上述思路和3周工期,给出您的初步工时与费用评估。 3. 能力证明:请提供您的GitHub主页链接或相关的技术作品集(最好是图像处理类项目)。
工作内容:应用软件开发 软件名称:单机版测绘软件 该软件主要用于测绘公司使用,形成CAD图形 系统涉及的相关专业技术:国产CAD(主浩辰CAD)、arcgis 开发语言:.NET ,LISP ,C# 工作内容: 主要负责功能优化、界面展示和逻辑修改、BUG解决。 例:界面选项逻辑修改;土地用途字段调整;图形压盖检查规则新增、变更服务数据入库校验等。 工期:根据需求最终定期,需求稳定,长期合作。 薪资:日薪 200 - 500 元 根据需求,双方商定。
【招聘】后端外包工程师|北美 iOS AI运动教练&社交应用(含 ML 预备架构) 项目简介: 我们是一个小型敏捷团队,正在开发一款iOS AI运动教练(包含社交应用),核心功能包含即时通讯与未来AI特性。现寻找一位后端工程师进行短期集中合作,交付可稳定运行的核心系统。初期目标为支撑数百至一千日活用户,但需为未来扩展预留空间,打造可观测、可扩展的后端。合作愉快可转为长期技术伙伴。 周期:8 周集中开发交付上线 MVP(可续约长期) 模式:全远程;与前端保持日/周同步;按里程碑结算 关系:短期项目合同制,合作愉快可转长期技术伙伴 8 周交付范围 实时通讯:文本/图片/短语音视频消息;可靠存储;WebSocket 连接管理与推送(含 APNs);离线消息补投与重传。 数据存储:用户/会话/消息/媒体的 Schema 设计与实现;为 ML 预备易导出数据(JSONL/Parquet)、字段字典、质量/溯源标记。 任务编排:异步任务系统(转码、批量发送等),具备幂等、重试、超时、死信队列、状态追踪。 部署与运维:基于 Docker 的一键部署;生产环境可观测性(日志/指标/链路追踪/告警);基础安全与限流。 技术要求(必需) 语言:Python(FastAPI/Django)/ Go / Node.js(以交付为先) 数据库:精通 PostgreSQL 或 MongoDB 等,能给出 Schema 设计取舍与理由 实时通信:有 WebSocket / Socket.IO 实战经验 容器化:熟练使用 Docker 打包与部署 云服务:熟悉 AWS(VPC、对象存储、容器部署等) 加分项 集成或部署过 ML 服务(TensorFlow Serving / TorchServe 等) 具备 Kubernetes 轻量化部署经验 熟悉 API 安全最佳实践(认证、授权、速率限制、审计) 非功能目标(示例) 端到端消息延迟 P95 ≤ 1s;持久化成功率 ≥ 99.9%;月可用性 ≥ 99.9% 基础可观测性:关键接口的指标、分布式追踪与日志关联 里程碑与验收(示例) 第 2 周:最小可用后端骨架(认证、健康检查、消息原型、CI/CD) 第 4 周:消息持久化/历史拉取、媒体直传、编排器 MVP、基础观测 第 6 周:权限与限流、灰度发布、SLO 仪表盘、针对 1k DAU 的压测报告 第 8 周:生产部署、Runbook、告警阈值、回归与终验 交付物清单 源码与文档(架构图、Schema、API 清单、Runbook)、IaC/配置、压测脚本与报告、恢复演练记录。 申请方式 注明“后端外包应聘”,并附: 技术简介:1–2 个最相关项目,你的角色/架构设计/解决的难题与技术栈 时间安排:可开始时间与未来两个月的投入保障 报酬期望:线上面谈
寻找合适的开发工程师,是一个视频交友app需要找人接入美颜SDK 我现在在开发一套视频交友App,现在需要用到澜极美颜SDK,希望找个技术可以帮我对接一下,用的是声网视频,有demo 预算1000元双端
每年要帮忙做小程序服务器的迁移,以及日常如果有运行问题需要解决就要维护。 现在我需要把一个优惠券改成不与平台优惠叠加这么一个东西,有开发的源代码,JAVA语言的,微信小程序的,请合适的人与我联系。。。。。
1.需求描述:给运行中的一条公链部署搭建完成一个主节点; 2.搭建主节点的部署文件已有; 3.要求有丰富的相关经验,可长期合作; 4.其他要求:主节点搭建完成后运行稳定 ,搭建周期1天内完成,搭建过程可远程
在目前现有的微信小程序上进行二开。用户在小程序上可以实现进入商城下单购买配送生鲜商品功能。用户在食谱的采购订单里面也可以实现购物车加购商城内对应供应商门店内的商品。 管理后台的营养师食谱指定页面UI进行优化。 小程序使用原生开发,后端使用springboot
编写爬虫程序,从一个网站爬取指定的数据,并存入数据库。 要求 1. 要有相当的技巧和经验,能绕过常见的防火墙、ip限制等反爬虫障碍; 2. 能实现多线程或者多进程并发爬取,以提升爬取的速度; 3. 能制定爬取的策略,可以周期性爬取而不会导致再次被封堵; 4. 要求交付代码、数据,并向全职团队讲解。
工作内容: 1、负责基于go语言相关软件产品核心模块的设计和开发,核心框架看护及代码维护; 2、负责公司 相关产品设计方案,准确把握业务需求,进行系统技术方案设计,核心代码开发和系统调优等工作; 3、参与系统架构设计及系统框架的评估选型; 4、攻克各种高并发、数据隔离、系统解耦、云解决方案等方面的技术难关。 5、完成领导安排的其他工作。 任职要求: 1、本科以上学历,精通Go语言,有良好的算法基础; 2、熟练掌握 springboot springmvc springcloud相关框架; 3、熟悉常用的消息队列中间件rabbitMQ rocketMQ Kafka 其中一到两个技术,并了解其原理以及流程; 4、熟悉mysql开发应用,了解数据库隔离级别以及数据库的CAP,Base原理,并对其分布式事务有自己的独到见解; 5、熟练掌握缓存redis或memcahe,并掌握其基本原理; 6、有优秀的分析和解决问题能力,对挑战问题充满激情,有较强的沟通能力以及团队意识者优先。 7.毕业三年以上
comfy UI接口调用封装项目。 JAVA后端岗位要求: 1、5年以上的开发经验,扎实的 Java 基础,熟悉多线程、集合、IO、反射、泛型等核心技术。 2、熟练使用Java常用框架和工具,如 Spring boot 、Spring Cloud、SpringMVC、Mybatis等 3、熟悉缓存(Redis),缓存设计和模式及其应用; 4、熟练掌握 MySQL 等关系型数据库,具备 SQL 优化能力 5、容器化:熟悉 Docker、Kubernetes 等容器化技术,具备实际部署经验。 6、DevOps:熟悉 CI/CD 工具(如 Jenkins、GitLab CI),了解自动化测试和部署流程。 工作内容描述: 1、在现有工程基础上(用户体系、基础设施具备),完成AI教学工具的后端开发 2、根据需求完成功能开发、接口联调对接
1、需求描述 数据湖专家,为银行客户现场提供数据湖开发咨询。 技术:有丰富的数据湖实际开发经验。 2、人才要求 5年以上工作经验; 1年以上数据湖开发经验,大数据和数据中台经验。 最好有银行业经验。 四、其他要求 坐班要求:可以双方约定好时间,去给客户现场提供数据湖实施咨询。 项目周期:总周期约30天。
工作: 1、 使用Lean4形式化数学竞赛题目的解题过程 2、指导其他人使用工具完成lean4语言的转化(也按条结算提成) 待遇: 日薪1000+提成(计件多劳多得),日均2000+ 时间: 自由,自己安排 周期: 有数据包可持续做 可居家 需求: 1、需要lean4语言形式化奥数题的解题过程; 2、需要林业专业,精通遥感地图的教授(背书,最好是能真正参与项目,出具方案),标注卫星地图识别到的植被区、植被; 3、需要文学专业的,进行文学题解析,对AI给出的答案进行综合优化; 4、需要数据专业的,精通Excle表,分析内容是否符合三个特性
岗位职责 1. 基于公司现有Scrapy框架,遵循公司编码规范,完成指定网站的漏洞数据抓取开发。原则上所有数据源需支持增量和全量爬取 2. 输出符合公司规范的爬虫文档(Spider逻辑说明、字段映射表、反爬策略记录) 3. 输出符合公司Schema的数据。 技术要求 1、1年以上Scrapy实战经验,3年以上的python开发经验,熟悉并能正常使用Redis、mongo、mysql相关中间件。 2、具备突破高防护级别网站的实际经验(反爬),包括但不限于scrapy-proxy-pool或自定义代理中间件开发;Cloudflare/WAF防护对抗策略(请求速率控制、Cookie策略)。(需提供过往案例证明代码片段可进行脱敏处理) 增量、全量爬取一下网站信息, 按要求返回数据结构 https://github.com/CVEProject/cvelistV5 https://huntr.dev/bounties/hacktivity/ https://github.com/aquasecurity/vuln-list-debian/blob/main/tracker/CVE https://www.cvedetails.com/vulnerability-list/published_on-today/ https://app.opencve.io/cve/ https://feedly.com/cve https://cve.circl.lu/vuln/cve-2024-57881 https://gitlab.com/gitlab-org/security-products/gemnasium-db https://www.cybersecurity-help.cz/vulnerabilities/ https://gstreamer.freedesktop.org/security https://www.suse.com/security/cve/ https://cxsecurity.com/ https://www.seebug.org/
1、我们目前的数据团队,有时候会遇到一些 flink 的问题,需要找一些有经验的人一起交流 2、正对团队遇到的各种 flink 等数据问题,及时排忧解难提供思路 3、目前技术栈,是用的 阿里云的 flink, 基于 maxcompute 4、不需要长期工作,只需要沟通解决问题就行 5、如果合适,可以长期作为技术顾问合作
项目: 负责 AI 网站的全栈开发工作,包括前端、后端以及数据库的相关开发,优化手机端页面,实现多语言功能。 任职要求: 1. 具备一定前端审美能力,有全栈网站开发经验,有海外网站开发经验者优先。 2. 有 ChatGPT 聚合聊天项目经验者优先。 3. 前端:熟练使用 Next.js 和 Tailwind 进行开发,能够对手机端页面进行优化,确保页面美观。 4. 后端:熟练使用 Node.js,具备丰富对接 API 的能力(现有可直接使用的 API)。 5. 能够接入 Supabase 数据库。 6. 熟悉设置多语言的 i18n。 7. 工作靠谱,具备良好的沟通能力,自由职业者优先。