PDF⽂件格式解析(1)-了解PDF的语法格式
PDF⽂件格式解析(1)- 了解PDF的语法格式
PDF格式
由Adobe Systems Incorporated开发的PDF(便携式⽂档格式)被Adobe描述为⼀种通⽤的⽂档表⽰语⾔。PDF代表格式化的,⾯向页⾯的⽂档。这些⽂档可以是结构化的或简单的。它们可能包含⽂本,图像,图形和其他多媒体内容,例如视频和⾳频。⽀持注释,元数据,超⽂本链接和书签。更⾼版本提供了其他功能,例如,将地理空间信息嵌⼊到代表地图或其他地理空间图像(例如卫星照⽚)的⽂档中。
PDF的核⼼是源⾃PostScript页⾯描述语⾔的图像模型。请参阅后记格式族。该模型可以在完整,精确和专业的级别上以与设备⽆关和与分辨率⽆关的⽅式来描述⽂本和图形。与作为编程语⾔的PostScript不同,PDF基于结构化的⼆进制⽂件格式,该格式针对交互式查看的⾼性能进⾏了优化
最新的都已经到PDF2.0的格式了,但是PDF2.0的标准还没有⼴泛采⽤,所以本⽂的介绍还是以PDF1.7为解析参考蓝本。
我们看其中的⼀个例⼦ TABLE G.2 Objects in simple text string example
1. %PDF−1.4
2. 10 obj
3. << /Type /Catalog感恩节祝福语句子
4. /Outlines 20 R
5. /Pages 30 R
6. >>
7. endobj
攻壳机动队电影百度云8. 20 obj
9. << /Type /Outlines
10. /Count 0
11. >>
12. endobj
13. 30 obj
14. << /Type /Pages
15. /Kids [40 R]
16. /Count 1
17. >>
18. endobj
19. 40 obj
20. << /Type /Page
21. /Parent 30 R
22. /MediaBox [00612792]
23. /Contents 50 R
郫县怎么读
24. /Resources << /ProcSet 60 R
25. /Font << /F1 70 R >>
26. >>
27. >>
28. endobj
29. 50 obj
30. << /Length 73 >>
31. stream2011年节假日安排
32. BT
33. /F1 24 Tf
情书怎么写34. 100100 Td
35. (Hello World) Tj
36. ET
37. endstream
38. endobj
39. 60 obj
40. [/PDF /Text]
41. endobj
42. 70 obj
43. << /Type /Font
这段PDF代码的显⽰结果就是Hello
World,如下图。
从整体结构来看语法有点类似XML,HTML,基本都有节点控制。每个obj⼩节都会有个endobj。从上⾯的介绍来看PDF就像变成HTML⼀样是有固定格式的,所以接下来⼏个章节就围绕PDF的格式做⼀个简要的解析。44.
/Subtype /Type145.
/Name /F146.
/BaseFont /Helvetica 47.
/Encoding /MacRomanEncoding 48.
>>49.
endobj 50.
xref 51.
0 852.
0000000000 65535 f 53.
0000000009 00000 n 54.
0000000074 00000 n 55.
0000000120 00000 n 56.
0000000179 00000 n 57.
0000000364 00000 n 58.
0000000466 00000 n 59.
0000000496 00000 n 60.
山西面食trailer 61.
<< /Size 862.
/Root 1 0 R 63.
>>64.
startxref 65.
62566.
%%EOF
enter description here
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论