如何去除文件中的“”问题?

如何去除文件中的“”问题?

问题描述:

原文件数据格式:userdata_31_clean.csv图片说明

数据提取代码:

import pandas as pd
table = pd.read_csv('userdata_31_clean.csv',sep = ',',encoding = 'utf-8')
len=table.shape[0]       #第二维长度
ind=pd.Series(list(range(len)))   #创建一个一维列表数组
data=pd.DataFrame(index=(range(len)),columns=('id','time','jd','wd'))   #data中加入一行数据
j=-1
for i in table.iloc[:,0]:     #使用iloc方法提取table读到的数据中的第0列并用i遍历
    a=i.split(';')             #列用“;”对i中数据进行分割
    c=[a[0],a[2],a[3],a[4]]      #创建一个数组由。。组成
    data.values[j]=c            #以行添加
    j=j+1
print(data.head())                #打印data的头

#data['id']=data['id'].astype('str')
ind=data['id'].drop_duplicates()    #对ID去重
for i in ind:
    data1=data.loc[data['id']==i,:]   #提取data["id"]=i的行
    name='userdata_'+i+'.csv'         #建立i变化的文件
    data1.to_csv(name,index=False,encoding="gbk")     #存储data1于name文件,非布尔类型

图片说明

提取结果:

图片说明

如何删除提取的数据中多余的""""""?

因为你源文件里面读出的数据里,双引号"本身也是字符串的一部分。所以写入到新的csv文件后,csv每个单元单元格的值也是带双引号的。这样的csv文件,当作文本打开时,就显示这个样子。
你可以修改源文件的数据,或者在读取值后,去除字符串与开头结尾的双引号:
c=[a[0].strip('"'),a[2].strip('"'),a[3].strip('"'),a[4].strip('"')]

replace方法,替换掉????