当您将<代码>б等特性归入终点站时,请见б<>>/code>,但实际投入的是序列号。
由于您的终端编码为cp1251
,打字бa>
,因此按字母顺序得出与单代码<>codea>>>>>>。 载于cp1251
:
In [219]: "баба".decode( utf-8 ).encode( cp1251 )
Out[219]: xe1xe0xe1xe0
说明一使用<代码>utf-8 见上文,因为我的终端编码是utf-8
,而不是cp1251
。 对于我来说,бaбa.decode(utf-8 )
只是бa>>>>。
自打字<代码>>бa>>>>>>>> > 依次按字母顺序排列的<代码>xe1xe1xe0xe1xe0,在座标有<代码>u> "aбa>>的>上,则<>>>>> 收到>u x1xe0xe1xe0xe1xe0。 正因如此,你看到了这一点。
>>> s
u xe1xe0xe1xe0
该单编码代表á<à
。
以及
>>> print s.encode( latin1 )
the latin1
encoding converts u xe1xe0xe1xe0
to xe1xe0xe1xe0
.
The terminal receives the sequence of bytes xe1xe0xe1xe0
, and decodes them with cp1251
, thus printing баба
:
In [222]: print( xe1xe0xe1xe0 .decode( cp1251 ))
баба
Try:
>>> s = "баба"
(不含u
) 或
>>> s = "баба".decode( cp1251 )
页: 1 或者,使用ver,但非常明确(和>>>> 最终-编码):
>>> s = u N{CYRILLIC SMALL LETTER BE}N{CYRILLIC SMALL LETTER A}N{CYRILLIC SMALL LETTER BE}N{CYRILLIC SMALL LETTER A}
或者简单但不太容易理解
>>> s = u u0431u0430u0431u0430