我有一份超文本文件(载于utf-8)。 开放式
<html>
// header
<body>
// some text
<table>
// some rows with cells here
// some cells contains tables
</table>
// maybe some text here
<table>
// a form and other stuff
</table>
// probably some more text
</body></html>
我只需要找回头一张表格(用表格打印)。 Omit all submissions before first <table>
and subsequently </table>
。 一些囚室还载有段落、黑体和文字。 主要表格的每个行数不超过一个表格。
我怎么能抽取一份行文清单,其中每个元件都持有平原(单编码管)电池数据,并列出每一封顶桌的行号? 宽度不超过1级。
I tried HTMLParse, PyParse and re module, but can t get this working. I m quite new to Python.