关于UTF-8问题
我在ubuntu 下用perl做文本对比,两个文件都是utf-8格式的,但是对比出来结果不对,有匹配的行,就是不认。
但是如果转到win下,用相同的程序和文本文件,utf-8的,也不认。但是把文本文件转成ASCII的字符集,结果就对了。
按道理,两个文本都是utf-8的,而且我的文本中都是英文和数字,没有怪字符,应该是可以进行对比的,有没有人遇到这样的问题呢?
如果perl在处理文本时,因文本的字符集选用不同而结果不同的话,会有很大的问题的。像这样的问题该如处理?
最方便,安全的办法是什么?
再问个问题:
有没有什么函数会提供警示功能(当两个文本,字符集不同时,或是无法处理的字符集)。