注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

@fc_lamp

关注Web应用解决方案MySql/PHP/Python一盏名为"飞川"的灯~

 
 
 

日志

 
 

Python 实现word 操作,并获取word中图片  

2017-10-24 19:12:05|  分类: Web技术-Python |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
word操作的模块很多:win32、python-docx、textract

#coding:utf-8
__author__='fc_lamp'
'''
Python word 操作
'''
from docx import Document
import os
import zipfile
from snownlp import SnowNLP


'''
python-docx 方式
(通过 pip install python-docx安装)
python-docx只支持docx格式的word
可接合使用snownlp 模块来实现中文分词处理
'''
wordf = '1.docx'
doc = Document(wordf)

#段落
wordn =0
for i in doc.paragraphs:
#一段一文字
print i.text
#print i.style.name


#关于word中图片的获取.......
#转压缩文件,word就是压缩文件
os.rename('1.docx','1.zip')

#释放出所有文件(包括图片)
f = zipfile.ZipFile('1.zip','r')
for file in f.namelist():
#这里可以打印出所有文件路径(如:/word/media/image1.png)
print file
if '.png' in file:
#减压出文件(我只减压出图片文件)
f.extract(file)
f.close()

#然后,我们可按释放出的文件路径,就可去获取图片(一般在:\word\media\目录中)
#还原回word
os.rename('1.zip','1.docx')


  评论这张
 
阅读(15)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017