🌐 GraphRAG 开发者挑战赛——法律文档处理(原型) 职位类型: 合同 / 自由职业 报酬方式: 仅在通过评测(总体得分 95% 以上)后支付 开发周期: 从接收材料起 7–10 天内完成现场演示 项目范围: GraphRAG 原型(无前端、无生产环境) 我们正在寻找一位紧跟当前图结构检索(Graph-based Retrieval)研究的专家,能够为法律文档设计一个高精度 GraphRAG 管道系统。 本项目不是聊天机器人或界面开发项目,也不是比拼延迟速度的竞赛。 系统可包含多跳检索或智能 Agent 调度。 知识图谱的构建与遍历属于项目范围。 ⚠️ 必须实现 GraphRAG,而非普通的 RAG! 📂 你将获得的资料 /docs/ → 10 份预处理的 Markdown 法律文档(包含丰富元数据) /sample_questions.json → 2 个示例问题(格式参考) /sample_answers_rag.json → 2 个示例答案(风格与结构参考) 以上仅为格式参考。正式评测将使用未公开的新问题。 🛠️ 你需要完成的内容(仅限原型阶段) 请在 Python 3.12 环境下(Poetry 项目结构)实现以下两个函数: def ingest(document_paths: List[str]) -> None: """导入提供的法律 Markdown 文档,构建知识图谱等。""" def query(questions: List[str]) -> List[str]: """返回基于检索结果的答案,并使用 Vancouver 风格的引文格式。""" 要求: 无需前端 UI、无需 API Key、无需云环境; 可使用任意技术栈,重点在于方法与结果; query(...) 必须支持并行执行,并能在终端显示进度; 在 60 分钟的现场测试中需处理约 400 个问题。 🧪 评测与报酬(如何获得支付) 你在本地使用示例文件进行开发与调试; 现场测试时(60 分钟内),我们提供约 400 个新问题; 你运行 query(...) 并生成 /answers.json 文件; 我们使用 LLM 作为评测者对你的答案进行打分(你无需构建评估框架)。 若你的总体得分在以下四项指标中超过 95%,则视为通过: 忠实性(Faithfulness):无幻觉,回答内容来源明确; 相关性(Relevance):检索内容与问题高度匹配; 完整性(Completeness):覆盖问题的所有关键要点; 清晰度(Clarity):结构清晰、逻辑严谨、法律表达规范。 通过后需提交完整代码库(包含仓库、Poetry 锁文件、运行说明及技术说明文档)。 我们验证可复现性后支付报酬,并考虑与你签订长期合作。 注意事项: 不使用 F1 指标; 不考察延迟时间; 官方统一运行评测; 若未通过评测 → 无报酬,你保留代码所有权;不做例外处理。 英文版:We’re hiring an expert who follows current graph-based retrieval research and can design a high-accuracy GraphRAG pipeline for legal documents. This is not a chatbot/UI project and not a latency contest. The system may include multi-hop/agentic orchestration. Knowledge-graph construction and traversal are in scope. Must be GraphRAG not vanilla RAG! ---------------------------------------------------------------------- 📂 What You Receive - /docs/ → 10 pre-processed Markdown legal documents (rich metadata) - /sample_questions.json → 2 sample questions (format reference) - /sample_answers_rag.json → 2 sample answers (style/structure reference) These are for orientation only. The live benchmark uses unseen questions. ---------------------------------------------------------------------- 🛠️ What You Must Build (Prototype Only) Expose exactly two Python functions (Python 3.12, Poetry project): def ingest(document_paths: List[str]) - None: """Ingest the provided legal markdown documents, build knowledge graph etc.""" def query(questions: List[str]) - List[str]: """Return answers as strings with Vancouver-style citations grounded in retrieved sources.""" - No UI, no API keys provided, no cloud required - Use any stack—we care about your approach and results, not tools - query(...) must support parallel execution to process ~400 questions in the 60-min live session. Must show a progress indicator in the terminal. ---------------------------------------------------------------------- 🧪 Demo & Evaluation (How You Get Paid) - You implement locally using the samples for orientation - Live 60-min session: we provide ~400 questions - You run query(...) live and produce /answers.json - We run the benchmark (LLM-as-judge) on your answers; you don’t need to build an evaluation framework If your overall score is more than 95% across: • Faithfulness (no hallucinations; grounded in retrieved text) • Relevance (retrieval matches the query) • Completeness (key points fully covered) • Clarity (clear, structured, legally coherent) You hand over the entire codebase (repo, Poetry lock, run instructions, and short tech note). Payment is released only after you deliver the full repo and we verify reproducibility. You are considered for hiring/further engagement. NOTE: - We do not use F1 - We do not measure latency - We run the benchmark - Fail → No payment; you keep your code. No exceptions
给任意一台windows设备上放置一个文件,该文件需要得到授权后才能被其他软件使用 功能: 1.未授权的设备自动弹出购买卡密 2..购买卡密后,文件才可以保留在电脑上(没网络可以保留,但是设备联网后文件需要自动被删除且不可找回) 3.定时检查卡密是否过期,如果过期且已经加载到相应的程序中,程序会退出 具体场景见附件
1. 报表系统后端服务开发,对接其他系统获取数据、用户信息,完成报表数据封装; 2. 沟通能力较强;熟悉Java技术栈,对报表系统有一定经验; 3. 驻场在徐汇青松城,预计1-2个月工作量,可长期合作;
总体任务:工具类网站的后端设计,API+后端服务器+数据库 ①账户系统:包含常见的功能,比如注册,找回密码等,都很老套(要求也可以通过gmail登录)。 ②网站服务: 网站包含多个工作流,每个工作流中有多项服务,比如大模型,TTS,OCR,STT等技术,(所有技术已经训练好,只需要部署到云服务器上), 用户上传文件给大模型(已经训练好,只需要部署到云服务器上),文件类型包括网页(爬虫爬成文本),doc文档,连接到邮箱(gmail的接口,可以爬所有邮件),pdf,xlsx,mp3,typora的文档 上传文档之后传输给大模型,跑完之后,可以开始chatbot问问题或者直接生成调研文档 ③在AWS上部署 ④未来工作流会增加很多种类型,另外关于大模型的响应时间,目前消费级显卡5min出结果,要求每分钟内至少接受1000次请求,最高10000次,60s内出结果,负载均衡+微服务,AWS提供了很多服务帮助实现。 ⑤加密,比如用户读取结果需要秘钥,关于加密算法直接用welldefined的就可以了,但是这个可以后面再说 请先考虑一个大体报价给我,合适的话我给具体功能文档
1、需求描述 网站开发,后端研发。 用户发布作品,收藏作品,浏览Feed作品。 用户登陆注册。 第三方支付。 2、参考产品 抖音App 3、人才要求 Python 实际项目编程经验。有大型网站开发与应用研发经验; K8s Docker部署
问题描述: 在电网中,当人为拔插电器、电器自动启停调频的时候,瞬时功率(电流)会发生波动 是正常现象。 但是当多个用电器叠加的时候即使没有拔插用电器,而且这些用电器也不具备自动调频、启停的功能。瞬时功率(电流)也会存在较大波动。针对这种异常现象,请回复: 这种异常现象是什么原因造成的,是否有类似降噪或者滤波等解决办法。来降低功率(电流)的异常波动。 注:瞬时功率(电流)波动指的是除了功率有效值之外还有功率分布也是不均匀的。
一 微信管理,识别微信上传图后进行积分回复,建立相应数据库。 二 抓取相关数据 视屏,将内容整合后生成html文件 项目周期:两周 技术: 使用python,应用open cv 和ui automation进行开发
问题背景: 下图为同一电源类负载接入两种不同环境的电网中产生的电流波形图,电流信号 经由 2000:1 的电流互感器采样所得,数据值均已根据比例转换为以 A(安培)为单位,采 样率为 8533.33Hz,采样点共 342 点(两个工频周期),每条波形的起始点均对应该相电压 的过零点(由负到正)。 问题描述: 可以明显观察到两个浪涌的起始相位有很大的差异,经不完全测试,环境 1 的相 位为大部分电网接入该负载所呈现的相位,环境 2 的相位为少部分电网接入该负载所呈现 的相位。 1. 请从电力分析的角度解释为什么不同的电网环境会导致同一种负载的相位差 异? 2. 现具备电压电流同步采集的能力,是否有可能根据无负载时的数据自动检测 该环境存不存在相位偏移?如果可能,请说出具体检测标准。
国产窄带通信模块 1.整体要求: 选择国产通信芯片,制作一款通信模块,类似lora模块功能。 2.具体要求: (1)选择国产通信芯片,频率选择为410-525MHz (2)要求带宽为1Kbps (3)传输距离最低10KM (4)要有透传、广播、定点、主从模式。 (5)数据稳定传输机制LBT检测、前向纠错、数据重传、超时无数据重启。 (6)数据传输成功返回标志、数据传输附加ID与信号值、无线数据分包。 (7)工作电流:2.0-3.7V(3.3V典型值) (8)天线选型:IPEX座/邮票孔 需求:代码、原理图、pcb设计、硬件制作 注:项目制,价格可谈,有意向擅长的请联系我,谢谢。
问题原理: 已知反激式开关电源(脉冲调制)在MOS管导通瞬间变压器的初级线圈会获得 能量,由于线圈内部形成的分布电容,形成了LC振荡电路,使线圈电压乃至220V端电流 形成了脉冲震荡波形,如下图所示: 问题描述: 是否可以设计一个振荡电路(接入市电),使得在220V端震荡开始时,该电路可 以跟随震荡,以达到增大震荡幅值的效果? 如果可以,请设计出电路原理图及PCB,如果不可以,是否可以通过其他途径增 大该震荡幅值?
c语言开发 1,定时截屏,并把图片转为压缩后的jpg格式。并把图片通过调用web API,传给后端。 2,调用API时,出了图片,还需要传入机器的id,该id配置在配置文件中 3,定时时间、api接口地址(相对地址),都在配置文件中。 4,具体配置格式如下: { "id_pc": "171-5", "device_interval":20, "server": { "server_url": "http://localhost/bendingDCI/" } } 5,因计算机系统比较老旧,所以采用c语音减低系统消耗,所以要求软件充分考虑内存、CPU低消耗。考虑内存回收问题,支持长时间运行不卡顿。 6、运行环境支持winXP系统,尽量用windows自动dll等。 7,记录必要文本日志,日志文件放在exe文件的log目下,每天记录一个新日志文件,日志名称:log20230905.txt。日志内容样例: 20230905 09:00:02 启动程序 20230905 09:01:08 执行任务成功 --这个意思就是上传成功,但不要直接写上传字样 8,开机自启动,启动后缩小多右下角图标,点击图标弹出窗口,窗口内容可以查看当天日志。 也可不带页面。 9,提供代码,包括运行环境、版本说明。 合作费用具体谈。
根据API接口提供的船名、航次信息从港航纵横以及其他船公司网站抓取预计离到港时间数据。 备注:港航纵横需要登录验证,有简单的英文+数字字母验证码。 其余船公司网站均不需要登录验证。 需要熟悉Python爬虫开发、能够调用验证码识别库进行验证码识别。
一套PHP语言,TP框架的商城系统, 1、对遗留下来的bug进行修复 2、提供接口文档,对现有API接口需要进行对接 3、后台代理开发,有API对接数据,开发代理后台对订单进行处理 4、5年以上PHP 6、有商城开发并且熟悉TP 框架 ,熟料掌握接API口开发 7、会一些前端的技术,有一点点前端的工程需要修改
酷信IM 即时通讯二次开发 JAVA 服务端,有过酷信IM 即时通讯二次开发经验。 精通IMserver 消息服务器。 处理开发过程中的bug 熟悉酷信IM 服务器部署 一定要有IM 通信服务器开发经验 技术栈:spring boot 框架 ,mongodb,rocketmq,redis IM通信 重要:现在要紧急处理的问题是:消息一密集发送,量一多后,服务端就会主动和客户端断开Socket链接。 重要:现在要紧急处理的问题是:消息一密集发送,量一多后,服务端就会主动和客户端断开Socket链接。
一:项目背景 目前已经有产品,已经上线过一次,只是服务器到期需要重新部署下。 后面会有持续需求,现在最紧急的需求是需要把原来的服务部署上去。 二:使用语言 Java 三:人才要求 找Java合伙人,精通Java,精通数据库,有责任心。
一、需求描述 根据项目分配得任务来完成工作 任务内容:企业内部系统,主要是做接口功能封装 二、人才要求 1、JAVA基础扎实,深入理解java集合、多线程、IO和JVM原理,精通常见的设计模式的使用场景; 2、熟练掌握 Spring、SpringMVC、SpringBoot、SpringCloud、Mybatis等框架,熟练掌握高并发、分布式、缓存、消息、异步等机制,有mq、Redis大型网站实战经验; 3、熟练掌握Mysql; 4、具备良好的编码习惯及严谨的逻辑思维,有一定的技术设计能力; 5、熟悉linux命令,能通过linux命令解决生产遇到的紧急问题; 6、责任心强,抗压能力强,工作积极主动,沟通协作能力较强; 7、3-6 年以上java开发经验,有企业内部系统开发经验。 三、其他要求 坐班要求:驻场开发。 项目周期:总周期约3-4个月。
一、需求描述 产品类别:FTP Server程序 开发进度:已有c++代码,需要调试 功能:实现FTP server常用功能,使用winSCP等工具可以正常登录、收发文件。 技术:使用c++语言,xp embedded嵌入式系统。注意不是纯xp。 人才要求 3年以上c++开发经验。 其他: 远程工作,时间预计半天。
需求:c#编制的FTP服务端程序,具有ftp常用功能: ①、按标准FTP协议登录FTP服务器,进行身份验证; ②、显示远程目录、文件列表,进行目录切换; ③、目录、文件列表的排序显示(文件名、时间、类型); ④、能上传文件、下载、删除文件; ⑤、支持设置选择二进制、文本格式文件传输(UNIX标准的文本);6、断点续传,文件大小限制。 要求产品稳定,自我容错,能长期运行不闪崩。 支持平台xp及以上系统,.net4。 参考产品 csdn很多开源类似产品。要鉴别功能,确保运行。 人才要求 c#3年以上 其它 远程工作,交付代码。 交付时间1天。