将文件夹的多个 csv 文件加载到一个数据框中

将文件夹的多个 csv 文件加载到一个数据框中

问题描述:

我在一个文件夹中保存了多个具有相同列布局的 csv 文件,并希望将其作为 Pandas 中的数据框加载到 python 中.

i have multiple csv files saved in one folder with the same column layout and want to load it into python as a dataframe in pandas.

这个问题真的很像这个线程.

我正在使用以下代码:

import glob
import pandas as pd
salesdata = pd.DataFrame()
for f in glob.glob("TransactionDataPromorelevant*.csv"):
    appenddata = pd.read_csv(f, header=None, sep=";")
    salesdata = salesdata.append(appenddata,ignore_index=True)

是否有更好的解决方案与其他软件包一起使用?

Is there a better solution for it with another package?

这需要很长时间.

谢谢

我建议使用列表理解和 concat:

I suggest use list comprehension with concat:

import glob
import pandas as pd

files = glob.glob("TransactionDataPromorelevant*.csv")
dfs = [pd.read_csv(f, header=None, sep=";") for f in files]

salesdata = pd.concat(dfs,ignore_index=True)