我有一份PDF,我正在使用PDE
。 它正在发挥作用,但并非是我所希望的方式。
library(PDE)
myTables <- PDE_pdfs2table(pdf = GPI-2023-Web.pdf )
Following file is processing: GPI-2023-Web.pdf
No filter words chosen for analysis.
The following table was detected but not processable for extraction: Table 3.2 shows a breakdown of the change in the e
27 table(s) found in GPI-2023-Web.pdf .
Analysis of GPI-2023-Web.pdf complete.
该表摘录了所有表,并作为单个CSVs排入一个称为tables/code>的分册。
cd tables/
[tables]$ ls
GPI-2023-Web_#010_table1.csv GPI-2023-Web_#024_table3.csv
GPI-2023-Web_#011_table1.csv GPI-2023-Web_#025_table1.csv
GPI-2023-Web_#012_table1.csv GPI-2023-Web_#026_table1.csv
GPI-2023-Web_#013_table3.csv GPI-2023-Web_#027_table1.csv
GPI-2023-Web_#014_table3.csv GPI-2023-Web_#02_table1.csv
GPI-2023-Web_#015_table3.csv GPI-2023-Web_#03_table1.csv
GPI-2023-Web_#017_table3.csv GPI-2023-Web_#04_table1.csv
GPI-2023-Web_#018_table3.csv GPI-2023-Web_#05_table1.csv
GPI-2023-Web_#019_table3.csv GPI-2023-Web_#06_table1.csv
GPI-2023-Web_#01_table1.csv GPI-2023-Web_#07_table1.csv
GPI-2023-Web_#020_table3.csv GPI-2023-Web_#08_table1.csv
GPI-2023-Web_#021_table3.csv GPI-2023-Web_#09_table1.csv
GPI-2023-Web_#022_table1.csv GPI-2023-Web_page39_w.table-000039.png
GPI-2023-Web_#023_table2.csv
[tables]$ grep -l Safety and Security domain *.csv
GPI-2023-Web_#011_table1.csv
GPI-2023-Web_#01_table1.csv
GPI-2023-Web_#023_table2.csv
GPI-2023-Web_#03_table1.csv
[tables]$ vi GPI-2023-Web_#01_table1.csv
虽然届时我可以选择具体的表格一和员额程序,但我想摘出一个名为“<代码>的考试、测验、测验、测验、测验、测验、测验和测验”的专门表格。 表1.1:安全和安保领域代码>和未加说明。
这是可能的吗?
Using PDE_pdfs2table_searchandfilter
在没有任何搜查之前,有希望。 字句和过滤器。 段 次 页 次 我实际工作。 仍然摘录了许多表格。
PS: The above PDF file can be downloaded from here: GPI-2023-Web.pdf