I have some Perl code that translates new-lines and line-feeds to a normalized form. The input text is Japanese, so that there will be multi-byte characters.
现在还有可能做这个转换逐字节的基础上(我认为目前),或我需要检测字符集和支持Unicode支持?换句话说,是广受欢迎的编码(shift - jis, EUC-JP, utf - 8, iso - 2022 - jp)使用字节字符集的一部分可能会被误认为是ASCII控制字符?
我只需要CR和低频工作。
<强>更新:< /强>添加iso - 2022 - jp。这是一个看起来最麻烦的时髦的转义序列……