Py实训13-C文件处理

2019300908-邱晓宇 2022夏-程序设计实训 2022-08-03 17:31:18

 

 

 

...全文
256 回复 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
基于C语言实现的面向中文电子病历的命名实体识别源码+项目说明(课程设计项目) 【1】项目代码完整且功能都验证ok,确保稳定可靠运行后才上传。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通,帮助解答。 【2】项目主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 【3】项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 【4】如果基础还行,或热爱钻研,可基于此项目进行二次开发,DIY其他不同功能,欢迎交流学习。 【备注】 项目下载解压后,项目名字和项目路径不要用中文,否则可能会出现解析不了的错误,建议解压重命名为英文名字后再运行!有问题私信沟通,祝顺利! 基于C语言实现的面向中文电子病历的命名实体识别源码+项目说明(课程设计项目) 任务描述 本评测任务为面向中文电子病历的命名实体识别,即对于给定的一组电子病历纯文本文档,任务的目标是识别并抽取出与医学临床相关的实体提及(entity mention),并将它们归类到预先定义好的类别(pre-defined categories),比如症状,药品,手术等。 第一步:数据处理(Linux) $python raw2bio.py -1 #将训练数据分词并贴上字典特征 $python raw2bio.py -2 #将标签数据分词并贴上标签 $python raw2bio.py -3 #将标签保存成pickle文件为了后面将训练数据与标签合在一起 $python raw2bio.py -4 #将标签与训练数据文本接起来构成如下格式 $python raw2bio.py -1 test #将测试数据处理成需要的格式 第二部:模型训练(Linux) $bash wapiti_ccks.sh #训练模型,模型储存在/eval/bio_ccks中 第三部分:获得结果(Linux) $python get_result.py #提取结果文件,结果保存在CCKS_result中其格式为BIO和finall中格式为官方标签格式 $python onefile.py #将结果转成提交格式 结果文件 Flyon\CCKS_CRF\eval\result.txt

34

社区成员

发帖
与我相关
我的任务
社区描述
依托实践实训环节,为同学们更好掌握所需的基本技能,提供一个交流学习的社区。
python安全linux 高校
社区管理员
  • shawn904
  • weixin_44003872
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧