实现网
软件开发工程师(兼职) 远程兼职
python
PHP
JAVA

核心需求 对指定的新闻文章的内容进行智能判断,提取出文章描述关键字和态度。新闻文章来源爬虫爬取的各新闻网站、微信公众号的。关键字是某单位主体的名称、简称,高校居多。如北京大学、北大,清华大学、清华。 文章的态度即是文本的情感态度,分为以下三种情况: 正面:文章对单位主体的认可赞美的。 中立:文章对单位主体进行客观真实的介绍,不包含个人立场。 负面:文章对单位主体不认可,进行批评指责甚至是恶意抹黑。 判断标准要能接近人工识别的标准,至少是让人看上去是相关的。 主要问题 在关键字提取时,像这些都是正文含有北京大学,情绪偏负面的。但是主体内容和北京大学无关的内容,是不需要的。要想办法过滤掉。这样用户一眼看过去相关度就高了。也就容易接受使用了。解决舆情系统误报问题,最终让舆情系统的检测更准确。 举例来说: 正文里面含有北京大学,但是整体文章和“北京大学”无关。造成误报。根本需求就是提高相关性,降低误报。 示例样本 根据识别是否正确,分为正样本(可以正确判断的样本)和负样本(会识别错误的样本)。 正样本 以下样本能够正确识别含有北京大学、或者北大的匹配的样本。 https://dy.163.com/article/HP3596OB0553THOL.html https://3g.163.com/dy/article/HH4N4H660536LOE0.html https://dy.163.com/article/HNE5U0TC0552UVEN.html https://www.cn-healthcare.com/article/20200619/content-538308.html 负样本 负样本主要有三类 第一类的可能是分词造成的。比如下面的含有“北大”,但是不是我们需要的北京大学的“北大”。 https://news.sina.com.cn/s/2022-12-19/doc-imxxeieh3862464.shtml http://www.zhuzhouwang.com/2020/1229/394854.shtml https://www.sznews.com/news/content/2022-12/19/content_25525650.htm 第二类,含有“北京大学”,但是这个新闻和北京大学没关系。 https://news.hangzhou.com.cn/shxw/content/2022-12/19/content_8429260.htm http://www.jiaodong.net/news/system/2022/12/17/014530967.shtml https://www.ztnews.net/article/show-393527.html http://news.66wz.com/system/2022/12/17/105529619.shtml https://hb.ifeng.com/c/8LlaffrCHQj 第三类,含有“北京大学”,内容也匹配。但是情感分析不准确。 对于已标记的数据,我们目前的训练结果准确度能达到90%多,但是对于未标记的数据,还是会有误判的情况。希望合作方能给出更好的解决方案。 最终输出: 合作者最好有过舆情开发经验,能提供以前的项目进行对比查看。如果是全新开发需能提供初步测试的demo进行在线测试。确定可行,提供整体的解决方案,架构设计,程序源码。

Small cba1699d3a0e0e1fb46e7e468cb9d793
昵称登录后显示 1 年多前发布

预估 40000 元

已有13人投递
软件开发工程师(兼职) 远程兼职
python
PHP
JAVA

核心需求 对指定的新闻文章的内容进行智能判断,提取出文章描述关键字和态度。新闻文章来源爬虫爬取的各新闻网站、微信公众号的。关键字是某单位主体的名称、简称,高校居多。如北京大学、北大,清华大学、清华。 文章的态度即是文本的情感态度,分为以下三种情况: 正面:文章对单位主体的认可赞美的。 中立:文章对单位主体进行客观真实的介绍,不包含个人立场。 负面:文章对单位主体不认可,进行批评指责甚至是恶意抹黑。 判断标准要能接近人工识别的标准,至少是让人看上去是相关的。 以下是开发中的用户界面 主要问题 在关键字提取时,像这些都是正文含有北京大学,情绪偏负面的。但是主体内容和北京大学无关的内容,是不需要的。要想办法过滤掉。这样用户一眼看过去相关度就高了。也就容易接受使用了。解决舆情系统误报问题,最终让舆情系统的检测更准确。 举例来说: 正文里面含有北京大学,但是整体文章和“北京大学”无关。造成误报。根本需求就是提高相关性,降低误报。 示例样本 根据识别是否正确,分为正样本(可以正确判断的样本)和负样本(会识别错误的样本)。 正样本 以下样本能够正确识别含有北京大学、或者北大的匹配的样本。 https://dy.163.com/article/HP3596OB0553THOL.html https://3g.163.com/dy/article/HH4N4H660536LOE0.html https://dy.163.com/article/HNE5U0TC0552UVEN.html https://www.cn-healthcare.com/article/20200619/content-538308.html 负样本 负样本主要有三类 第一类的可能是分词造成的。比如下面的含有“北大”,但是不是我们需要的北京大学的“北大”。 https://news.sina.com.cn/s/2022-12-19/doc-imxxeieh3862464.shtml http://www.zhuzhouwang.com/2020/1229/394854.shtml https://www.sznews.com/news/content/2022-12/19/content_25525650.htm 第二类,含有“北京大学”,但是这个新闻和北京大学没关系。 https://news.hangzhou.com.cn/shxw/content/2022-12/19/content_8429260.htm http://www.jiaodong.net/news/system/2022/12/17/014530967.shtml https://www.ztnews.net/article/show-393527.html http://news.66wz.com/system/2022/12/17/105529619.shtml https://hb.ifeng.com/c/8LlaffrCHQj 第三类,含有“北京大学”,内容也匹配。但是情感分析不准确。 对于已标记的数据,我们目前的训练结果准确度能达到90%多,但是对于未标记的数据,还是会有误判的情况。希望合作方能给出更好的解决方案。 最终输出: 合作者最好有过舆情开发经验,能提供以前的项目进行对比查看。如果是全新开发需能提供初步测试的demo进行在线测试。确定可行,提供整体的解决方案,架构设计,程序源码。

Small cba1699d3a0e0e1fb46e7e468cb9d793
昵称登录后显示 1 年多前发布

预估 40000 元

已有1人投递
软件开发工程师(兼职) 远程兼职
python
PHP
C#
JAVA

在线讲座直播 一、基本功能 1、主持人 ①推流:摄像头(多个摄像头可以选择)、屏幕、视频文件; ②互动:语音、文字发言; ③管理:禁言、踢人、连麦 2、观众 ①允许连麦 ②文字发言 ③视频录制 3、直播的收费,需要支持支付宝,微信支付,云闪付等,金额由主持人收取,在提现时,平台收取一定的佣金。 二、直播流程 1、直播进行前 首先由主持人发布讲座预告,直播时间来临,主持人进入直播,此时,直播预告变为直播进行中,观众即可进入直播。 2、直播进行中 主持人可选择摄像头来推流或者推流窗口、播放指定的视频。在推流窗口或者视频文件时,可以选择是否切换到画中画。在聊天窗口,可以发送文字、截图、图片及其它文件。 观众可以在线观看,并通过聊天窗口与主持人或者其他观众进行互动。 3、直播结束 将本次视频直播保存到服务器,主持人在用户中心的直播历史记录中,可以随时进行下载。聊天窗口的聊天记录也需同步保存。 三、前端样式 1、电脑端 左侧为直播画面,右侧为聊天互动区,只需要显示主持人的直播画面,不需要显示观众摄像头的视频画面。 2、手机端 由于手机屏幕较小,整体上的布局,可以参考抖音直播。 四、适配系统 在web端能完全达到需求的情况下,就不需要桌面端了,但需要全面兼容各类目前流行的和最新的浏览器,老旧的浏览器如果无法兼容,则进行提示。 手机端则主要就是安卓端了(鸿蒙系统在兼容app时要正常)、苹果端、微信小程序。 需要成品软件及源代码

Small cba1699d3a0e0e1fb46e7e468cb9d793
昵称登录后显示 1 年多前发布

预估 40000 元

已有3人投递

我是技术人才
我在寻找远程工作

技术人才入驻

我是创业者
我在寻找技术人才

发布用人需求