求doc文件结构说明,该怎么处理

求doc文件结构说明
我今天刚来公司实习,公司让我分析doc、和ppt文件的内部结构,谁有中文的关于doc文件结构的说明书啊,或者c++打开doc文件获取内容的方法
------解决方案--------------------
要不看看这个?
http://www.doc88.com/p-27480968709.html
------解决方案--------------------
有资料了说一下啊
 如果是用到手机上为什么不用JAVA写呢,JAVA有现成的库可用,好像是NOPI吧
 如果是用C++的话,不用微软的COM好像是没有库的,只有用二进制来解析
如果是解析DOCX的话就简单多了,把它用ZIP解压,找到里面的DOCUMENT文件,递归读取里面<w:t>的数据就是文本了
------解决方案--------------------
引用:
Quote: 引用:

Quote: 引用:

有资料了说一下啊
 如果是用到手机上为什么不用JAVA写呢,JAVA有现成的库可用,好像是NOPI吧
 如果是用C++的话,不用微软的COM好像是没有库的,只有用二进制来解析
如果是解析DOCX的话就简单多了,把它用ZIP解压,找到里面的DOCUMENT文件,递归读取里面<w:t>的数据就是文本了

公司要做的是安卓和苹果手机都能用的,并且和公司的书包业务有联系,反正我时郁闷了好多天了 

目前我也没有资料 ,我就只是有个思路用openoffice库,或者自己去研究下openoffice是怎么做到的(我大概看了下源码,超级多,我的水平目前不好研究 ,郁闷)我刚问我们头了,头说只要我把word中得数据提取出来,显示格式不用管,感觉好痛苦,网上根本没什么资料


如果是只要文字的话,过断时间为发个给你,DOC的,是用二进制解析的,就是fopen,fread。
DOCX的就很简单了,你可以自己去做做,非常简单
------解决方案--------------------
引用:
Quote: 引用:

Quote: 引用:

Quote: 引用:

Quote: 引用:

有资料了说一下啊
 如果是用到手机上为什么不用JAVA写呢,JAVA有现成的库可用,好像是NOPI吧
 如果是用C++的话,不用微软的COM好像是没有库的,只有用二进制来解析
如果是解析DOCX的话就简单多了,把它用ZIP解压,找到里面的DOCUMENT文件,递归读取里面<w:t>的数据就是文本了

公司要做的是安卓和苹果手机都能用的,并且和公司的书包业务有联系,反正我时郁闷了好多天了 

目前我也没有资料 ,我就只是有个思路用openoffice库,或者自己去研究下openoffice是怎么做到的(我大概看了下源码,超级多,我的水平目前不好研究 ,郁闷)我刚问我们头了,头说只要我把word中得数据提取出来,显示格式不用管,感觉好痛苦,网上根本没什么资料


如果是只要文字的话,过断时间为发个给你,DOC的,是用二进制解析的,就是fopen,fread。
DOCX的就很简单了,你可以自己去做做,非常简单

嗯 ,那先谢谢啊 ,我要解析doc内容的,如果你发给我的可以参考   那我就学着去获取图片   就可以了   

这段时间有点忙,周末发给你。只有读取DOC的文字,没有其他格式的,例如:字体颜色没搞出来。如果你有这方面的资料的话,发个给我。
    不过说真的,现在解析DOC真的很麻烦而且估计过段时间就要被淘汰了,现在都在使用DOCX格式的。而且DOC格式的占用空间比较大,读取速度慢,最大容量小,等一些缺点
------解决方案--------------------
你好歹留个邮箱啊,不然我怎么发给你