python提取word中表格内容,由于单元格中多余回车,导致获取单元格数据不准确

问题描述:

img

python操作word文档表格:

rows = len(tables[0].rows)    
for row in range(2, rows):
        colid = tables[0].cell(row,0).text.strip()
        colname =tables[0].cell(row,1).text.strip()
        datatype = tables[0].cell(row,2).text.replace("(","(").replace(")",")").strip()
        nullable =tables[0].cell(row,3).text.strip() 
        pkindex = tables[0].cell(row,4).text.replace(",",",").upper().strip()
conlist.extend([[colid, colname, datatype, nullable, pkindex]])
print("表格内容=",conlist)

想要达到的效果是
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT NULL', '']]
但由于表格中内容填写不规范,截图中圈红部分多了回车,导致最后打印结果为:
表格内容=[['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'PK'],
['APPLYORDERID', '申请单编号', 'NUMBER(14)', 'NOT NULL', 'INDEX'],
['REGION', '地市', 'NUMBER(5)', 'NOT', ''], ['REGION', '地市', 'NUMBER(5)', ' NULL', '']]
请问下代码应该如何修改?

你将数据输出,看看多余的回车在数据里面表示什么,然后再针对性处理就行了