用正则表达式替换熊猫数据框不起作用
问题描述:
我的数据框有很多行.我想使用pd.replace替换整个列中的值.
I have dataframe with many rows. I want to use pd.replace to replace values in entire columns.
import pandas as pd
import re
list = ['MD 15241', 'MD', 'TD', 'TD 15487']
a = pd.DataFrame(list)
b = a.copy()
b.replace(r'[A-Z]{2}', 'USA', inplace = True)
b
输出
0
0 MD 15241
1 MD
2 TD
3 TD 15487
我尝试了r'MD'或r'TD',它可以工作.
I tried r'MD' or r'TD' , it works.
答
您需要在replace
方法中使用regex=True
:
b.replace(r'[A-Z]{2}', 'USA', inplace=True, regex=True)
b
#0
#0 USA 15241
#1 USA
#2 USA
#3 USA 15487