在使用python读取用WPS打开的csv文件时读取到空白行的问题

在使用python读取用WPS打开的csv文件时读取到空白行的问题

问题描述:

在学习《python数据分析基础》2.6节:读取多个CSV文件时发现一个问题,这一节给了一个
脚本用于计算某路径下所有csv文件的行,列数.

import csv
import sys
import os
import glob
input_path=sys.argv[1]
file_counter=0
for input_file in glob.glob(os.path.join(input_path,'sales_*')):
    row_counter = 1
    with open(input_file,'r',newline='') as csv_in_file:
        filereader = csv.reader(csv_in_file)
        header=next(filereader,None)
        for row in filereader:
            row_counter+=1
        print('{0!s}:\t{1:d} rows \t{2:d} columns'.format(\
          os.path.basename(input_file),row_counter,len(header)))
    file_counter+=1
print('Number of files:{0:d}'.format(file_counter))

原本书中给的数据文件是这样的:
数据是书上给的,7行5列的数据,csv文件是我自己手动录入的..
数据是书上给的,7行5列的数据,csv文件是我自己手动录入的.

由于WPS表格单元格过小,在录入数据后拉伸各行列宽,高:
有部分空白行被我批量拉伸宽高时选中
有部分空白行被我批量拉伸宽高时选中

然后执行脚本,发现被批量拉伸宽高时选中的空白行也被计算入文件的行数:
图片说明

将这些被拉伸宽高的空白行删去后再次执行脚本,结果正常:
图片说明

综上,发现在WPS里打开CSV文件后如果在拉伸各行列的高宽时,选中了没有内容的空白行,
这些空白行会在文件读取对象中被迭代,导致空白行被计算,请问这是为什么?

1、这些空白行虽然没有数据,但是是数据,因为你已经操作过。
2、你可以保存成csv文件,然后用文本编辑器打开,nodepad++之类的,可以看到不可见字符,最后几行应该只有换行符。

你用记事本打开CSV会发现,有” , , , , , ,“这样的空行,你把它删除就可以了

感谢weixin_42920757 ,xingjianfengaa 两位道友的回答,用文本编辑器打开后发现的确存在不可见字符图片说明