Python 如何用正则表达式只保留字符串中汉字和换行符?
问题描述:
如题,要对一个文本进行处理,想到正则表达式应该可以但是不是很会,求大神指点一下
答
可以匹配输出所有的中文
import re
string = '465321fsdggsddf543@¥……¥……努力考上研究生¥¥!@$$#^%\nddd我所说的\n测试\n哈哈哈'
result = re.findall(u'[\u4e00-\u9fa5]',string)
ans = ''.join(result)
print(ans)
同时匹配中文和换行的,还没找到。