请问怎么用正则表达式过滤掉非中文的文本

bentu610 2008-08-19 04:12:16

用哪个正则表达式可以过滤掉非中文的内容，
这里的中文指的是所有的汉字，但不包括中文
的标点

...全文

1273 6 打赏收藏转发到动态举报

写回复

用AI写文章

6 条回复

切换为时间正序

请发表友善的回复…

发表回复

mayuanfei 2008-08-19

打赏
举报

1.先把其他的字符替换成空(参考楼上).
2.再把所有中文标点替换为空.剩下的就是你要的中文了.

thinkisbest 2008-08-19

打赏
举报

中文过滤好东西收藏下

acrobatyuer 2008-08-19

打赏
举报

不懂...但顶起来了....

rascalboy520 2008-08-19

打赏
举报

这是我用过的代码，楼主改一下就可以用了，



/**

	 * 处理含有中文字符的url

	 * 

	 * @param url

	 * @return 新的url

	 */

	public static String enCodeURL(String url, String code) {

		if (!StringUtil.isFine(url))

			return null;

		Pattern pattern = Pattern.compile(

				"[\u300a\u300b]|[\u4e00-\u9fa5]|[\uFF00-\uFFEF]",

				Pattern.CASE_INSENSITIVE | Pattern.DOTALL);

		Matcher m = pattern.matcher(url);

		if (m.find()) {

			int get = m.start();

			String suburl = url.charAt(get) + "";

			String encodesuburl = "";

			try {

				encodesuburl = URLEncoder.encode(suburl, code);

			} catch (Exception e) {

			}

			url = url.replaceAll(suburl, encodesuburl);

			url = enCodeURL(url, code);

		}

		url = url.replaceAll(" ", "20%");

		return url;

	}