English 中文(简体)
如何从与PHP的文件中删除无效的XMLchar果
原标题:How to remove invalid XML charactes from document with PHP
  • 时间:2012-04-10 20:09:26
  •  标签:
  • php
  • xml

我试图产生一份约23至30兆赫的XML文件,当时我与否开放。

XML Parsing Error: not well-formed
Location: file:///Users/User/Downloads/export(2).xml
Line Number 137725, Column 1343:

之后,我尝试用XML Nanny对该文件进行鉴定,我收到以下错误:

Invalid Character (Unicode: 0xB)

几行(13):137725、137738、137751、137764、1377、137790、137803、137816、146834、189949、193444、193457、193470

我曾尝试过几个“解决办法”,其中包括:

  1. 定期表达:

    preg_replace(
       /[^x9xAxDx20-x{D7FF}x{E000}-x{FFFD}x{10000}-x{10FFFF}]+/ 
      ,    , $data->Description);
    

    这里的问题是,我不敢肯定,这是有效的ReEx,因为我获得内部服务器Error,因为我们的藏身有 mo的安全。

  2. 我曾试图在UTF-8与BOM一道拯救我的档案,但这是绝望的。

  3. Ive试图与UTF-8/TUORE使用iconv,但这样做无助于。

  4. 我试图用人性替代来利用人性,但是,这 did子在我的文件上工作得很好,因为我有2330k条线,甚至可以取代存在这一问题的具体主线,即:先发人大事——在加拿大的专言中,我方言被人 killed。

现在,我的解决办法是用人工方式澄清这种无效性质的数据库记录,但现在,这是对我问题的适当和正确的解决办法,因为今后这一文字将用来使这一出口和手工编辑的理论或话题自动化。

最佳回答

我首先坚持XML Nanny提供的信息:

Invalid Character (Unicode: 0xB) (several lines)

<0xB是控制特性范围的一种特性,但XML文件只允许具有非常有限的控制特性。 我建议你开始用数字实体取代这些实体,并再次尝试:

$xml = strtr($xml, array("x0B" => "&#x0B;"));

地球科学委员会可以接受。

问题回答

我面临这样的类似问题。 我在通过XML发送数据之前使用基64en代码对数据进行加密,然后在接收数据之后,我将其编码。 如果为你工作,请让我发言。 或者,我是否明确理解你的问题?





相关问题
Brute-force/DoS prevention in PHP [closed]

I am trying to write a script to prevent brute-force login attempts in a website I m building. The logic goes something like this: User sends login information. Check if username and password is ...

please can anyone check this while loop and if condition

<?php $con=mysql_connect("localhost","mts","mts"); if(!con) { die( unable to connect . mysql_error()); } mysql_select_db("mts",$con); /* date_default_timezone_set ("Asia/Calcutta"); $date = ...

定值美元

如何确认来自正确来源的数字。

Generating a drop down list of timezones with PHP

Most sites need some way to show the dates on the site in the users preferred timezone. Below are two lists that I found and then one method using the built in PHP DateTime class in PHP 5. I need ...

Text as watermarking in PHP

I want to create text as a watermark for an image. the water mark should have the following properties front: Impact color: white opacity: 31% Font style: regular, bold Bevel and Emboss size: 30 ...

How does php cast boolean variables?

How does php cast boolean variables? I was trying to save a boolean value to an array: $result["Users"]["is_login"] = true; but when I use debug the is_login value is blank. and when I do ...