用正则表达式替换熊猫数据框不起作用

问题描述:

我的数据框有很多行.我想使用pd.replace替换整个列中的值.

I have dataframe with many rows. I want to use pd.replace to replace values in entire columns.

import pandas as pd
import re
list = ['MD 15241', 'MD', 'TD', 'TD 15487']
a = pd.DataFrame(list)
b = a.copy()

b.replace(r'[A-Z]{2}', 'USA', inplace = True)
b

输出

    0
0   MD 15241
1   MD
2   TD
3   TD 15487

我尝试了r'MD'或r'TD',它可以工作.

I tried r'MD' or r'TD' , it works.

您需要在replace方法中使用regex=True:

b.replace(r'[A-Z]{2}', 'USA', inplace=True, regex=True)

b
#0
#0  USA 15241
#1  USA
#2  USA
#3  USA 15487