关于正向最大匹配中文分词的问题

Coolyqq 2012-11-02 01:01:23

“我是中国人，我来自湖南”,我可以利用集合HashMap结合来中文分词：我，是，中国人，我，来自，湖南

但问题来了要是字符串里有非中文怎么把这些中文提出来呢，比如：“是中国人 he hello china 我来自湖南 hello china”
怎么一块一快的分出来了，形如这样的答案String[]{”是中国人“,“ he hello china” ,“我来自湖南”，“hello china”},
在线都等，谢谢各位前辈

...全文

184 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

q1531 2012-11-02

打赏
举报

回复

分词有现成的工具，中文分词的话IKAnalyzer这些就不错了，得到的词组还可以知道是什么类型的。

【顶刊复现】配电网两阶段鲁棒故障恢复研究（Matlab代码实现)

GBT3098.5-2025 紧固件机械性能自攻螺钉_可搜索.pdf

基于segmentation_models_pytorch开源模型库与自定义模型支持的大尺寸遥感影像语义分割与地物分类项目_使用GDAL进行栅格与矢量数据处理_通过yml配置文件.zip

ts-type-challenges（TS 类型体操标杆，条件 + 映射 + infer 全覆盖），包含 100 + 实战题：内置工具类型实现、分布式条件、自定义 DeepReadonly/DeepPartial、模板字面量类型，配套练习答案，VIP 级类型编程素材。

考虑不确定性的含集群电动汽车并网型微电网随机优化调度研究（Matlab代码实现）

62,622

社区成员

307,257

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章