关于正向最大匹配中文分词的问题

Coolyqq 2012-11-02 01:01:23
“我是中国人,我来自湖南”,我可以利用集合HashMap结合来中文分词:我, 是,中国人,我,来自,湖南


但问题来了要是字符串里有非中文怎么把这些中文提出来呢,比如:“是中国人 he hello china 我来自湖南 hello china”
怎么一块一快的分出来了,形如这样的答案String[]{”是中国人“,“ he hello china” ,“我来自湖南”,“hello china”},
在线都等,谢谢各位前辈
...全文
137 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
q1531 2012-11-02
  • 打赏
  • 举报
回复
分词有现成的工具,中文分词的话IKAnalyzer这些就不错了,得到的词组还可以知道是什么类型的。

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧