博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python 正则表达式 提取网页中标签的中文
阅读量:4445 次
发布时间:2019-06-07

本文共 517 字,大约阅读时间需要 1 分钟。

转载请注明出处 http://www.cnblogs.com/pengwang52/。

 

>>> p= re.compile(r'\
([^x00-xff]*)\<\/div\>')>>> text='
测试
学习正则
'>>> for m in p.finditer(text):... print m.group(1)...测试学习正则如果 用findall 输出为中文字符编码>>> m = re.findall(r'\
([^x00-xff]*)\<\/div\>','
测试
学习正则
')>>> print m['\xe6\xb5\x8b\xe8\xaf\x95', '\xe5\xad\xa6\xe4\xb9\xa0\xe6\xad\xa3\xe5\x88\x99']

 

转载于:https://www.cnblogs.com/pengwang52/p/7470752.html

你可能感兴趣的文章
java集合框架概述
查看>>
HP Vitrual Connect 配置快速参考
查看>>
ORA-04021等待锁定对象时超时
查看>>
Android学习笔记-事件处理机制
查看>>
阮一峰:为什么要写博客(转)
查看>>
Openstack_O版(otaka)部署_镜像服务glance部署
查看>>
28.openssl编程——CRL
查看>>
带分数(dfs,next_permutation)
查看>>
C++ string的用法和例子
查看>>
gcc g++编译问题。
查看>>
对nginx,uWSGI,django的理解
查看>>
反转一句话(仅反转各单词的顺序)
查看>>
P1546 最短网络(codevs | 2627村村通)
查看>>
502 Bad Gateway什么意思
查看>>
从接口测试谈游戏的自动化测试.
查看>>
ThinkGo:一个轻量级的 Go 语言 MVC 框架
查看>>
关于一个无极限分类的问题
查看>>
开源流媒体服务器--EasyDarwin
查看>>
Linux下高cpu占有率的调试方案
查看>>
PHP用户登录解析
查看>>