社区
VB基础类
帖子详情
很基础的问题,如何在文本文件里把所有的符号及数字去掉? 赠高分
iammzh8888
2003-10-20 06:33:05
符号包括除英文大小写字母之外的在0~127ascii码之间的所有符号。
谁能解答不胜感激。
最好是能只搜索一遍文本就能解决问题。另外,如何在解决上一问题后能把词(包括中文词和英文词)提取出来。谢谢
...全文
147
4
打赏
收藏
很基础的问题,如何在文本文件里把所有的符号及数字去掉? 赠高分
符号包括除英文大小写字母之外的在0~127ascii码之间的所有符号。 谁能解答不胜感激。 最好是能只搜索一遍文本就能解决问题。另外,如何在解决上一问题后能把词(包括中文词和英文词)提取出来。谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
kmzs
2003-10-22
打赏
举报
回复
就是算法要写好、快不太容易
tianmiaohu
2003-10-22
打赏
举报
回复
用VBScript里的Regular Expression作全局的替换. 参考VBScript的文档资料.
cpio
2003-10-22
打赏
举报
回复
可以用mid函数把内容一个个地分到一个数组中
再对数组进行处理
如果数组中ASCII值是0-127,可以把它换成空格(也可以是别的,0-127的都行)
再用JOIN函数把数组转成字符串
用replace把空格换成空,就行了
iammzh8888
2003-10-20
打赏
举报
回复
希望有哪位好心人回复给解决一下
毕业设计Python基于机器学习的电商淘宝商品评论情感分析项目源码+数据(
高分
项目).zip
如果文本中有“666“,”好好好“等无用词语,
去掉
评论中的标点
符号
。 分词 使用jieba精确模式进行分词,构造词典 将词汇向量化 创建词语字典,并返回每个词语的索引,词向量,以及每个句子所对应的词语索引 分类...
文本向量化
文本表示是自然语言处理中的
基础
工作,文本表示的好坏直接影响到整个自然语言处理系统的性能。文本向量化就是将文本表示成一系列能够表达文本语义的向量,是文本表示的一种重要方式。目前对文本向量化大部分的研究都...
用户评论文本挖掘
用户评论文本挖掘 学习目标 知道评论文本挖掘的作用 掌握使用nltk和gensim来进行基本NLP处理 一、评论文本挖掘介绍 文本挖掘就是从文本信息中挖掘我们感兴趣的内容 数据分析师为什么要关注文本数据 在我们日常的...
多场景业务实战 --用户评论文本挖掘(写的有点细有点多)
在我们日常的产品和运营工作中,经常接触的数据分析方法、形式绝大部分是基于对
数字
(值)的描述性分析。这些又被称为结构化数据 除此之外,图片,文字,视频,这些统称为非结构化数据 非结构化...
多场景业务实战-用户评论文本挖掘
用户评论文本挖掘 学习目标 知道评论文本挖掘的作用 掌握使用nltk和gensim来进行基本NLP处理 一、评论文本挖掘介绍 文本挖掘就是从文本信息中挖掘我们感兴趣的内容 数据分析师为什么要关注文本数据 在我们日常的...
VB基础类
7,763
社区成员
197,605
社区内容
发帖
与我相关
我的任务
VB基础类
VB 基础类
复制链接
扫一扫
分享
社区描述
VB 基础类
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章