|
使用python-docx处理word的复选框, 碰到了个诡异的情况。如下:
正常读取时,显示的字串如下,无勾选状态,文字前有□,勾选状态下,则无□。
'□国有 □集体 私营 □其他'
以此逻辑,可以识别出word文档的复选框哪些选项是被勾选的,哪些未被勾选。
想尝试下其他勾选情况,于是取消勾选私营,勾上国有,存档。再运行查看时,诡异的情况出现了:
'国有 □集体 私营 □其他'
私营前面的□已经没了!
继续尝试,取消勾选国有,恢复勾选私营,存档。。。再运行读取:
'国有 □集体 私营 □其他'
国有前面的□也没了!
各位是否有碰到类似情况,有无解决方法?
附读取word的表格内容代码:
from docx import Document
import time,os,re
def proDocx(docName):
docunment=Document(docName)
iTable=docunment.tables
# 读表
for t in iTable:
table_list=[]
for i,row in enumerate(t.rows):
row_content=[]
for cell in row.cells:
c=cell.text
if c not in row_content:
row_content.append(c)
table_list.append(row_content)
return table_list
|
|