是否能用C++写一个将PDF转换成文字?该如何处理
是否能用C++写一个将PDF转换成文字?
看到网络上的pdftoWord,都是将PFD剪成图片,然后放到word里面
我现在想写一个软件,能够讲pdf里的文字抽取出来,像我们打字一样复制到word里面
用户可以转换之后,对需要的文字进行复制,修改等操作
请问这个想法是否能实现?如果能,应该怎么实现?
------解决方案--------------------
就是OCR啊
------解决方案--------------------
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
------解决方案--------------------
楼上加1
------解决方案--------------------
看到网络上的pdftoWord,都是将PFD剪成图片,然后放到word里面
我现在想写一个软件,能够讲pdf里的文字抽取出来,像我们打字一样复制到word里面
用户可以转换之后,对需要的文字进行复制,修改等操作
请问这个想法是否能实现?如果能,应该怎么实现?
------解决方案--------------------
就是OCR啊
------解决方案--------------------
这个分两种情况了。一种PDF就是以文字形式保存的,这样的容易做出来。第二种就是PDF以图片形式保存的,这样从图片中提取文字是比较困难的
------解决方案--------------------
楼上加1
------解决方案--------------------