好东西,大家以后说不定能用上,共享一下(顺便测试一下)!

montao 2008-04-24 04:03:07
加精
比word先进的字数统计
我测试过了,基本接近完美,但是肯定还有BUG 望提出!谢谢

package taotao.montao.demo;

/**
* 获取文章的字数或则字符数
* @author montao
*/
public class StatWordCount {

private final char[] CHS = {',',';','.','!','?',';','+','。','?','!'}; //符号数组

private final char[] CHN = {'\n','\r'}; //转义符数组

private final char[] SPACE = {' ',' '}; //空格的数组(前半角,后全角)

/**
* 根据指定条件来筛选文章的字数
* @param wordContent 文章内容
* @param compriseInterpunction 是否包含指定字符
* @param compriseSpace 是否包含空格
* @return 返回文章经过指定筛选后的长度
*/
public int getWordCount(String wordContent,boolean compriseInterpunction,boolean compriseSpace)
{
if(wordContent==null){
return 0;
}else if(wordContent.length()==0){
return 0;
}else{
//既要包含符号又要包含空格
if(compriseInterpunction && compriseSpace){
//清除转义符
String regex = "["+new String(CHN)+"]";
wordContent = wordContent.replaceAll(regex," ");
return this.getWordCount(wordContent);
}
//不包含符号包含空格
else if(!compriseInterpunction && compriseSpace){
//使用正则表达式去掉指定的符号和转义符
String regex1 = "["+new String(CHN)+"]";
String regex2 = "["+new String(CHS)+"]";
wordContent = wordContent.replaceAll(regex1," ");
wordContent = wordContent.replaceAll(regex2," ");
return this.getWordCount(wordContent);
}
//包含指定符号不包含空格
else if(compriseInterpunction && !compriseSpace){
//使用正则表达式去掉空格和转义符
String regex1 = "["+new String(CHN)+"]";
String regex2 = "["+new String(SPACE)+"]";
wordContent = wordContent.replaceAll(regex1," ");
wordContent = wordContent.replaceAll(regex2," ");
return this.getWordCount(wordContent);
}
//空格和指定符号都不包含
else{
//使用正则表达式去掉空格,指定符号和转义符
String regex1 = "["+new String(CHN)+"]";
String regex3 = "["+new String(CHS)+"]";
String regex2 = "["+new String(SPACE)+"]";
wordContent = wordContent.replaceAll(regex1," ");
wordContent = wordContent.replaceAll(regex2," ");
wordContent = wordContent.replaceAll(regex3," ");
return this.getWordCount(wordContent);
}
}
}

/**
* 返回文章中的字数
* @param wordCount 文章内容
* @return
*/
@SuppressWarnings("unused")
private int getWordCount(String wordContent){
int count = 0;
if(wordContent==null){ //判断是否为null,如果为null直接返回0
count = 0;
}else if(wordContent.length()==0){ //判断是否为空,如果为空直接返回0
count = 0;
}else{ //判断获取字数
wordContent = wordContent.trim(); //清空空格
//临时变量
String s4 = "";
String s3 = "";
String s1 = "";
boolean bb = false;
if(wordContent.length()>0){
s4 = String.valueOf(wordContent.charAt(wordContent.length()-1));
}
for(int i=0;i<wordContent.length();i++){
s3 = String.valueOf(wordContent.charAt(i));
int num = s3.getBytes().length;
if(s3.hashCode()==32||s3.getBytes().length==2){
bb=true;
}if(num==2){
count++;
}else{
if(i+1<wordContent.length()&&(i>1)){
s1 = String.valueOf(wordContent.charAt(i+1));
if((s1.hashCode()==32||s1.getBytes().length==2)&&(s3.hashCode()!=32)){
count++;
}
}
}
}
if(!bb){
count++;
}else{
if(s4.getBytes().length==1){
count++;
}
}
}
return count;
}

/**
* 根据条件来获取文章的字符数
* @param wordContent 文章内容
* @param compriseInterpunction 是否包含指定符号
* @param compriseSpace 是否包含空格
* @return 返回字符长度
*/
public int getWordCharacter(String wordContent,boolean compriseInterpunction,boolean compriseSpace)
{
//既要包含符号又要包含空格
if(compriseInterpunction && compriseSpace){
//清除转义符
String regex = "["+new String(CHN)+"]";
wordContent = wordContent.replaceAll(regex," ");
//首部的空格不算
wordContent = wordContent.replaceAll("^\\s+","");
return wordContent.length();
}//不包含符号包含空格
else if(!compriseInterpunction && compriseSpace){
//首部的空格不算
wordContent = wordContent.replaceAll("^\\s+","");
//使用正则表达式去掉指定的符号和转义符
String regex1 = "["+new String(CHN)+"]";
String regex2 = "["+new String(CHS)+"]";
wordContent = wordContent.replaceAll(regex1," ");
wordContent = wordContent.replaceAll(regex2," ");
return wordContent.length();
}//包含指定符号不包含空格
else if(compriseInterpunction && !compriseSpace){
//使用正则表达式去掉空格和转义符
return this.getNoSpaceCount(wordContent);
}//空格和指定符号都不包含
else{
//使用正则表达式去掉指定符号
String regex1 = "["+new String(CHS)+"]";
wordContent = wordContent.replaceAll(regex1," ");
return this.getNoSpaceCount(wordContent);
}
}

/**
* 获取文章中非空格的字符总数
* @param wordContent 文章内容
* @return
*/
private int getNoSpaceCount(String wordContent) {
int spaceCount = 0;
if(wordContent==null)
{
spaceCount = 0;
}else if(wordContent.length()==0)
{
spaceCount = 0;
}else
{
//替换首部的
wordContent = wordContent.replaceAll("^\\s+","");
wordContent = wordContent.replaceAll(" ","");
//使用正则替换转义符
String regex = "["+new String(CHN)+"]";
wordContent = wordContent.replaceAll(regex,"");
spaceCount = wordContent.length();
}
return spaceCount;
}
}
...全文
6465 272 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
272 条回复
切换为时间正序
请发表友善的回复…
发表回复
aigoican 2011-04-10
  • 打赏
  • 举报
回复
统计的一定准确吗?
ioceanfish 2011-04-10
  • 打赏
  • 举报
回复
收藏先
a514718137 2011-04-10
  • 打赏
  • 举报
回复
see see
fwwdn 2011-04-10
  • 打赏
  • 举报
回复
慢慢研究ing……
H602miss 2011-04-10
  • 打赏
  • 举报
回复
做个标记···留着看
N_banner 2011-04-10
  • 打赏
  • 举报
回复
收藏了 嘻嘻
haiyex1 2011-04-04
  • 打赏
  • 举报
回复
学习中
abcd493191085 2010-11-28
  • 打赏
  • 举报
回复
高难度东西
花花小智 2010-11-28
  • 打赏
  • 举报
回复
功夫, 导入,
降龙 2010-11-28
  • 打赏
  • 举报
回复
收藏了。。。。
renhuihhh 2010-11-28
  • 打赏
  • 举报
回复
向楼主致敬!建议做成javaBean吧,这样代码公开,免得大家给你挑毛病...哈哈
e_forrest 2010-11-27
  • 打赏
  • 举报
回复
mark
yrq27 2010-10-12
  • 打赏
  • 举报
回复
藏下喔
fubinfeng 2010-10-11
  • 打赏
  • 举报
回复
看看 !
prettyangell 2010-10-11
  • 打赏
  • 举报
回复
对我有用
voice1122 2010-10-09
  • 打赏
  • 举报
回复
我也收藏。
ysj300 2010-10-09
  • 打赏
  • 举报
回复
没有注意看,收藏下。顶下。
Gogo520520 2010-10-09
  • 打赏
  • 举报
回复
保存 下 我也不明白
路痴哥斯拉 2010-10-09
  • 打赏
  • 举报
回复

package com.javatest;
import com.javatest.StatWordCount;

public class javatest {
public static void main(String[] args) {
String string = new String("扯淡 111啊a 1");
StatWordCount statWordCount = new StatWordCount();
System.out.print("'"+string+"'计算字数结果: "+statWordCount.getWordCount(string,false,false)+"个");
}
}

'扯淡 111啊a 1'计算字数结果: 6个


完美……
caihongxing198712 2010-10-09
  • 打赏
  • 举报
回复
学习。。。。
加载更多回复(245)

62,634

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧