将文件夹的多个 csv 文件加载到一个数据框中
问题描述:
我在一个文件夹中保存了多个具有相同列布局的 csv 文件,并希望将其作为 Pandas 中的数据框加载到 python 中.
i have multiple csv files saved in one folder with the same column layout and want to load it into python as a dataframe in pandas.
这个问题真的很像这个线程.
我正在使用以下代码:
import glob
import pandas as pd
salesdata = pd.DataFrame()
for f in glob.glob("TransactionDataPromorelevant*.csv"):
appenddata = pd.read_csv(f, header=None, sep=";")
salesdata = salesdata.append(appenddata,ignore_index=True)
是否有更好的解决方案与其他软件包一起使用?
Is there a better solution for it with another package?
这需要很长时间.
谢谢
答
我建议使用列表理解和 concat
:
I suggest use list comprehension with concat
:
import glob
import pandas as pd
files = glob.glob("TransactionDataPromorelevant*.csv")
dfs = [pd.read_csv(f, header=None, sep=";") for f in files]
salesdata = pd.concat(dfs,ignore_index=True)