我重新测试了一下我的数据:
共有数据项499945个,数据结构
class JobRecord {
public String szJobID;
public String szJobTitle;
public String szJobDesc;
}
统计数据长度(多数为中文,GBK编码):
JobID是纯数字,长度在8-11位之间。
JobTitle是GBK编码,多数为中文,也有纯英文的。平均长度在7.8(汉字算一个)。
JobDesc是GBK编码,多数为中文,也有纯英文的。平均长度在179.1(汉字算一个)。