源文件是原始的PDF(可以编写的那种)或扫描件,基本上是账单,需要通过内容识别,将入和出的金额及其他内容*按需存入数据库方便未来调用。 对识别率有较高要求,允许借助各种OCR识别API或其他来实现。
需要请工程师帮忙做一个程序,用于识别较为清晰的图片与PDF文档,根据里面的规则上传到数据库,按照一定的规则生成文档。 这里没办法上传附件,图片是银行账单,有4个不同的样式。 需求是: 1)要识别里面的数字与文字,根据数字前面的文字或位置判断是属于借还是贷,将数字与文字分别录入到数据库内; 2)用数据库内的数字,透过加、减、乘等规则导出一个报表。也可以做成将数字和文字嵌入在我们提供的excel表格内,生成并保存。
网站:https://www.icris.cr.gov.hk/csci/ 在这个网站上抓取一些信息,需求有2个: 1)抓取需求。访问后点击【无账户使用者】,然后会跳出一个新窗口,新窗口内有单选或多选,随机选择某个再确认后进入查询页。查询页有按编号查询的,从000001开始抓,抓完所需要的内容录入数据库后再轮到000002开始,以此类推。 2)即时查询需求。 在我们的网站搜索框输入公司名称或编号之后,服务器后台实际上从上面说到的网站上抓取数据,反馈即时新数据过来。反馈的数据要能整理并使用。 可参考此网站:http://www.cidb.pub/HK.aspx
需要给CRM增加功能,主要是: 1)主动提醒功能:到指定时间提醒,提醒方式:邮件、短信、微信公众号(若绑定); 2)在线发邮件与短信功能,可设置固定格式模板,导入数据库指定字段实现快速发送邮件功能; 3)上传文件,设置文件大小,上传保存在七牛云,按一定条件归类,并可索引下载; 4)数据导入功能,主要为excel导入,按列的名称去匹配数据库的值,如均为email则导入到email内; 5)自安装功能,安装后使用统一数据库,但是可以绑定不同的子域名; 6)适配PC、移动端 目前有JAVA的CRM,如阁下有PHP语言的CRM也可以,那就用阁下现成的进行二次开发。前端HTML5