APache PDFbox API使用(一)-简介

APache PDFbox API使用(1)----简介

由于项目的需要,最近在学习APache  PDFbox API,Apache PDFbox API是Apache Java 开源社区中个一个项目,其受Apache 版权 V2的保护,其提供了下面的功能:

(1)文本的提取

即在PDF文件里面把文本内容提取出来。

(2) 合并和拆分PDF文档

可以把几个PDF合并成一个PDF文件,也可以把一个PDF文件拆分成多个PDF文件。

(3) 表单填充

从PDF文件的表单中提取数据或者写入数据到PDF表单中。

(4) PDF/A的校验

根据PDF/A ISO 标准校验PDF文档

(5)打印PDF

 通过Java的API去打印PDF文件 

(6) 把PDF转换成图片

把PDF文件转换成图片

(7) 创建PDF文件

(8) PDF签名


在本系列的文章中,我将会逐一的给大家展示其API的使用。当前最新的PDFbox API版本是1.8.5,大家可以去https://pdfbox.apache.org/downloads.html#recent 这个网站上面下载。如果大家英文比较好的话,可以去其官方网站去进一步了解其框架的架构,具体的使用方式等。