正则表达式提取字符串
问题描述:
Elisabetta Mei,1,2 Dadi Beck,1,2 Connor M. Mosby,1 Monica Sami, 1 Chiara Mass,3 and Susan A. Sloan1,2,*
上面字段 我希望提取以下字段(我用Python):
Elisabetta Mei,1,2
Dadi Beck,1,2
Connor M. Mosby,1
Monica Sami, 1
Chiara Mass,3
Susan A. Sloan1,2,* (包括星号)
请问怎么用正则表达?
答
[A-Z][\w\.\s]*[\d,\*\s]+
答
import re
s = '你的字符串'
res = re.findall(r'.*?[0-9\*]+\s+', s+' ')
print(res)
得到的每个字段末尾的空格如果不要可以很容易去掉
答
[A-Za-z]+\s+[A-Za-z.\s0-9]+(,[0-9\*])+