python提取word中表格内容，由于单元格中多余回车，导致获取单元格数据不准确

问题描述：

python操作word文档表格：

rows = len(tables[0].rows)    
for row in range(2, rows):
        colid = tables[0].cell(row,0).text.strip()
        colname =tables[0].cell(row,1).text.strip()
        datatype = tables[0].cell(row,2).text.replace("（","(").replace("）",")").strip()
        nullable =tables[0].cell(row,3).text.strip() 
        pkindex = tables[0].cell(row,4).text.replace("，",",").upper().strip()
conlist.extend([[colid, colname, datatype, nullable, pkindex]])
print("表格内容=",conlist)

想要达到的效果是
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT NULL', '']]
但由于表格中内容填写不规范，截图中圈红部分多了回车，导致最后打印结果为：
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK'],
['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT', ''], ['REGION', '地市', 'NUMBER(5)', ' NULL', '']]
请问下代码应该如何修改？

答

你将数据输出，看看多余的回车在数据里面表示什么，然后再针对性处理就行了

python提取word中表格内容，由于单元格中多余回车，导致获取单元格数据不准确

相关推荐