The following regular expression is used to extract the URL connection from a page:
LINK_REGEX = re.compile("<a [^>]*href=[ "]([^ "]+)[ "][^>]*>")
<>问题1>> 如何代表以下描述? I mismatch and “ in purpose
<a href="http://www.yahoo.com >
我尝试了以下发言,我没有做任何工作。
>>> page = <a href="http://www.yahoo.com >
>>> page
<a href="http://www.yahoo.com >
>>> page = <a href="http://www.yahoo.com >
>>> page
<a href="http://www.yahoo.com>
< Question2>根据我的理解,经设计,LNK_REGEX将与上述链接相对应,尽管这并不可取。 因此,我如何能够修改定期表述,以强制执行与“......”的匹配。