两天来,我一直在努力处理 我所面临的一个问题。
The final goal is to migrate the content of an apple wiki server to foswiki/twiki markup.
我找到了一个 Xslt 样式表, 它能做大部分工作, 并且做得相当好, 而且很快。 我只需要把它用在 完善的( X) HTML 上, 也就是整洁的出现的地方- 苹果维基数据结构的“ content” 字符串里面有很多 HTML 标记, 但是不完整 。
使用 xmlrpc 内查, 无证苹果 API 几乎可以使用,
试图使用整洁 现在给我:
UnicodeEncodeError: ascii codec can t encode character u u2013 in position 121: ordinal not in range(128)
显然,我搜索了这个错误信息, 发现了一些文章, 包括这里的一些关于Stackoverflow的文章, 但他们似乎暗示这是我使用的终端的编码问题。 然而, LANG=en_US. UTF-8 在这里, 因此这不能成为我问题的原因。
我发现一篇文章暗示要除掉管理局, 但这样做,我创造了一个新的错误信息, 对我而言也没什么意义:
UnicodeDecodeError: ascii codec can t decode byte 0xef in position 0: ordinal not in range(128)
相关代码片断如下:
pages = {}
paths = s.groupsForSession(session_id) # paths is a list of groups that user can read on that server
for aPath in paths:
entries = s.wiki.getEntries(session_id, aPath)
# entries = s.search.getEntries(session_id, aPath)
pprint.pprint(entries)
for uid in entries:
try:
entry = s.wiki.getEntryWithUID(session_id, uid[ uid ])
except Exception, e:
print e.faultString
raise Exception
pages[uid[ uid ]] = entry
pprint.pprint( pages[uid[ uid ]][ content ])
print(
tidy.parseString(
str(
unicode(
pages[uid[ uid ]][ content ].strip(codecs.BOM_UTF8), utf-8
)
),
**options
)
)