You want to throw away the "Price On Ask" string? Or is that valuable information?
如果在数据中有许多噪音,而且这是完全没有兴趣的,那么我就有一个过滤器去除所有非数字。
但是,如果时间允许,我更愿意将数据与模式匹配明确处理(组合代码为PHP):
//$price is raw string
$price=str_replace( , , ,$price); //Get rid of commas
$price=str_replace( $ , ,$price); //Get rid of dollar signs
if($price== Price On Ask )$price=null;
elseif(preg_match( /^d+$/ ,$price))$price=(int)$price; //Simple number
elseif(preg_match( /^(d+) Price On Ask$/i ,$price,$parts)){
$price=(int)$parts[1];
}
else{
echo "Unexpected price string: $price
";
$price=null;
}
然后,我有为一些扼杀装置设定旗帜的结构。 此外,如果数据中出现新的插图,那么我的文字就会听觉,我可以决定是不是。
(说明:将价格定为无效,意味着将国家扫盲十年列入数据库,而不是零)。)