社区
橙子园(数据说)
文章分享
帖子详情
基于fastText做的文本分类尝试
yeah_you_are
2022-07-26 15:11:00
加精
文章地址
...全文
90
回复
打赏
收藏
基于fastText做的文本分类尝试
文章地址
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
fast
Text
:
文本分类
和词嵌入工具
快速
文本分类
,多
文本分类
, 词嵌入
毕业设计基于
Fast
text
的中文医疗问答系统python源码+运行说明+中文医疗对话数据集.zip
【资源介绍】 毕业设计基于
Fast
text
的中文医疗问答系统python源码+运行说明+中文医疗对话数据集.zip 本项目为本人的本科毕业设计,基于知识图谱的中文医疗问答系统,通过爬虫工具从公开的医疗网站获取医疗知识并利用Neo4j图数据库构建知识图谱。问句意图利用
Fast
text
文本分类
算法识别,并简单编写了一个槽位记忆功能辅助记住上下文信息,最后利用Django框架搭建了一个简单的前端对话界面。 ## 使用步骤 ### 1. csdn下载本项目并安装必备环境依赖 ### 必备 - JDK 15以上 - Neo4j 4.2.1 - Python3.6以上 - Django 2.1.7 - jieba 0.42.1 -
fast
text
0.9.2 - py2neo 2020.1.1 ### 爬虫相关 - requests 2.25.1 - lxml 4.3.0 - retrying 1.3.3 - vthread 0.1.1 - cchardet 2.1.7 ### 其他 - pyTelegramBotAPI 3.7.4 (用于连接TelegramBot) ### 2. 安装Neo4j数据库 主要代码存放在MASystem文件夹中 - Crawler 爬虫代码以及爬取到的医疗信息 - dict 实体字典列表 - entities 爬取的所有数据,整理成json格式 - build_dict.py 从爬取后的数据中提取实体字典 - buIld_graph.py 依靠爬取的数据连接neo4j构建知识图谱 - request_disease.py 爬取疾病分类数据 - request_others.py 爬取其他分类数据 - classifier 意图分类器相关代码 - dict 部分意图语料和实体字典 - intent 意图语料 - models 存储训练好的模型 -
fast
text
_data.txt
Fast
text
库能够识别的语料 - intent.txt 所有意图的举例解释文件 - stopwords.txt 停用词语料 - train_intents_
fast
text
.py 训练
Fast
text
分类器的代码 - vocabs.txt 训练
Fast
text
过程中留下的字典,不重要 - word2vec-test.py 采用word2vec的
尝试
,不重要 - con
text
ual 处理上下文信息的代码 - IntentDetector.py 调用模型识别意图代码 - IntentProcessor.py 记忆上下文实体,处理对应意图的回复 - KGQuery.py 提供从图数据库查询的各类方法 - telegramBot.py 支持机器人在telegram上运行的相关代码 - static中存放网页相关的静态文件 - 其他文件均为 Django框架生成或依赖的文件 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,也适用于小白学习入门进阶。当然也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或者热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载,沟通交流,互相学习,共同进步!
基于PyTorch深度学习框架的中文
文本分类
系统实现_包含
fast
text
_
text
cnn_
text
rnn_
text
rnn_att_
text
rnn_bc_transformer_d.zip
基于PyTorch深度学习框架的中文
文本分类
系统实现_包含
fast
text
_
text
cnn_
text
rnn_
text
rnn_att_
text
rnn_bc_transformer_d.zip
fast
text
训练集
fast
text
训练集,用户
fast
text
文本分类
训练集。。。。
datasets4
fast
Text
:快速文本格式的多类和多标签数据集
数据集4
fast
Text
橙子园(数据说)
14,984
社区成员
118
社区内容
发帖
与我相关
我的任务
橙子园(数据说)
开发者离不开的主题就是数据,此社区包含大数据、数据科学、人工智能、前后端开发等内容。只要你会和数据打交道,那就请加入吧! ------落地生根,长成参天大树
复制链接
扫一扫
分享
社区描述
开发者离不开的主题就是数据,此社区包含大数据、数据科学、人工智能、前后端开发等内容。只要你会和数据打交道,那就请加入吧! ------落地生根,长成参天大树
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
社区希望广大博主积极加入进来,将自己的文章同步到本社区,增加更多的曝光量!
试试用AI创作助手写篇文章吧
+ 用AI写文章