在acc中显示jieba已经安装,但是打开acc后发现找不到jieba.

qq_41950777 2020-12-02 10:46:36
...全文
79 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 基于机器学习+深度学习+bert方法的虚假新闻检测项目源码.zip # Fake-News-Detection NKU_2022Fall Python language programming project **虚假新闻检测**项目,简单的**nlp分类**问题 使用**机器学习**、**深度学习**和**bert模型**解决问题 仓库只上传了代码,大文件统统没有上传,下面网盘链接用于下载需要的大文件,照着文件夹融合网盘文件和代码文件即可 [所需附件下载链接](https://pan.baidu.com/s/1WpDSuQgC1HQaVNc8xlpuyQ?pwd=jzkl ) ### 问题描述 数据集是文微信消息,包括微信消息的Official Account Name,Title,News Url,Image Url,Report Content,label。Title是微信消息的标题,label是消息的真假标签(0是real消息,1是fake消息)。训练数据保存在train.news.csv,测试数据保存在test.news.csv。 实验过程先统计分析训练数据【train.news.csv】。根据train.news.csv的Title文字训练模型,然后在test.news.csv上测试,给出Precision, Recall, F1-Score, AUC的结果。 ### 环境配置 使用anaconda集成开发环境,pytorch深度学习框架 具体配置方法我参考的博客链接:[PyTorch环境配置及安装_pytorch配置-CSDN博客](https://blog.csdn.net/weixin_43507693/article/details/109015177) ### 方法介绍 #### 机器学习模型 主要流程就是数据加载、预处理、特征工程、模型训练与评估,nlp的任务需要将文本数据转换成向量数据,这里用了词袋模型和`tyidf`两张方法。 代码在`traditional.py`,都有现成的包用,简单调包调参就行,使用了随机森林、支持向量机、朴素贝叶斯、逻辑回归等方法,有的算法可以加入网格搜索与交叉验证调参,不过感觉如果想继续优化可能得在特征工程部分下手。 最后得到的结果: | 使用模型 | 向量化方法 | acc | recall(1) | precision(1) | auc | | :------------------------------: | :--------: | :----: | :-------: | :------------: | :--: | | 朴素贝叶斯+jieba精确模式 | 词袋模型 | 84.33% | 0.60 | 0.47 | 0.74 | | 同上 | tyidf | 88.97% | 0.33 | 0.80 | 0.66 | | 高斯内核支持向量机+jieba搜索引擎 | 词袋模型 | 86.62% | 0.10 | 0.84 | 0.55 | | 同上 | tyidf | 91.21% | 0.46 | 0.89 | 0.72 | | 随机森林+jieba精确模式 | 词袋模型 | 87.03% | 0.12 | 0.97 | 0.56 | | 同上 | tyidf | 87.18% | 0.13 | 0.98 | 0.56 | | 逻辑回归+jieba精确模式 | 词袋模型 | 90.48% | 0.50 | 0.77 | 0.74 | | 同上 | tyidf | 89.33% | 0.37 | 0.79 | 0.68 | #### 神经网络解决
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用。 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 基于机器学习+深度学习+bert方法的虚假新闻检测项目源码.zip 虚假新闻检测项目,简单的nlp分类问题 使用机器学习、深度学习和bert模型解决问题 仓库只上传了代码,大文件统统没有上传,下面网盘链接用于下载需要的大文件,照着文件夹融合网盘文件和代码文件即可 ### 问题描述 数据集是文微信消息,包括微信消息的Official Account Name,Title,News Url,Image Url,Report Content,label。Title是微信消息的标题,label是消息的真假标签(0是real消息,1是fake消息)。训练数据保存在train.news.csv,测试数据保存在test.news.csv。 实验过程先统计分析训练数据【train.news.csv】。根据train.news.csv的Title文字训练模型,然后在test.news.csv上测试,给出Precision, Recall, F1-Score, AUC的结果。 ### 环境配置 使用anaconda集成开发环境,pytorch深度学习框架 ### 方法介绍 #### 机器学习模型 主要流程就是数据加载、预处理、特征工程、模型训练与评估,nlp的任务需要将文本数据转换成向量数据,这里用了词袋模型和`tyidf`两张方法。 代码在`traditional.py`,都有现成的包用,简单调包调参就行,使用了随机森林、支持向量机、朴素贝叶斯、逻辑回归等方法,有的算法可以加入网格搜索与交叉验证调参,不过感觉如果想继续优化可能得在特征工程部分下手。 最后得到的结果: | 使用模型 | 向量化方法 | acc | recall(1) | precision(1) | auc | | :------------------------------: | :--------: | :----: | :-------: | :------------: | :--: | | 朴素贝叶斯+jieba精确模式 | 词袋模型 | 84.33% | 0.60 | 0.47 | 0.74 | | 同上 | tyidf | 88.97% | 0.33 | 0.80 | 0.66 | | 高斯内核支持向量机+jieba搜索引擎 | 词袋模型 | 86.62% | 0.10 | 0.84 | 0.55 | | 同上 | tyidf | 91.21% | 0.46 | 0.89 | 0.72 | | 随机森林+jieba精确模式 | 词袋模型 | 87.03% | 0.12 | 0.97 | 0.56 | | 同上 | tyidf | 87.18% | 0.13 | 0.98 | 0.56 | | 逻辑回归+jieba精确模式 | 词袋模型 | 90.48% | 0.50 | 0.77 | 0.74 | | 同上 | tyidf | 89.33% | 0.37 | 0.79 | 0.68 | #### 神经网络解决。资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!

37,743

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • WuKongSecurity@BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧