我试图产生一份约23至30兆赫的XML文件,当时我与否开放。
XML Parsing Error: not well-formed
Location: file:///Users/User/Downloads/export(2).xml
Line Number 137725, Column 1343:
之后,我尝试用XML Nanny对该文件进行鉴定,我收到以下错误:
Invalid Character (Unicode: 0xB)
几行(13):137725、137738、137751、137764、1377、137790、137803、137816、146834、189949、193444、193457、193470
我曾尝试过几个“解决办法”,其中包括:
定期表达:
preg_replace( /[^x9xAxDx20-x{D7FF}x{E000}-x{FFFD}x{10000}-x{10FFFF}]+/ , , $data->Description);
这里的问题是,我不敢肯定,这是有效的ReEx,因为我获得内部服务器Error,因为我们的藏身有 mo的安全。
我曾试图在UTF-8与BOM一道拯救我的档案,但这是绝望的。
Ive试图与UTF-8/TUORE使用iconv,但这样做无助于。
我试图用人性替代来利用人性,但是,这 did子在我的文件上工作得很好,因为我有2330k条线,甚至可以取代存在这一问题的具体主线,即:先发人大事——在加拿大的专言中,我方言被人 killed。
现在,我的解决办法是用人工方式澄清这种无效性质的数据库记录,但现在,这是对我问题的适当和正确的解决办法,因为今后这一文字将用来使这一出口和手工编辑的理论或话题自动化。