python 正则表达式提取网页中标签的中文-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

python 正则表达式提取网页中标签的中文

阅读量：4445 次

发布时间：2019-06-07

本文共 517 字，大约阅读时间需要 1 分钟。

转载请注明出处 http://www.cnblogs.com/pengwang52/。

>>> p= re.compile(r'\
     
      ([^x00-xff]*)\<\/div\>')>>> text='
      
       测试
      
 
      
       学习正则
      
'>>> for m in p.finditer(text):...     print m.group(1)...测试学习正则如果 用findall 输出为中文字符编码>>> m = re.findall(r'\
      
       ([^x00-xff]*)\<\/div\>','
       
        测试
       
 
       
        学习正则
       
')>>> print m['\xe6\xb5\x8b\xe8\xaf\x95', '\xe5\xad\xa6\xe4\xb9\xa0\xe6\xad\xa3\xe5\x88\x99']

转载于:https://www.cnblogs.com/pengwang52/p/7470752.html

你可能感兴趣的文章

java集合框架概述

HP Vitrual Connect 配置快速参考

ORA-04021等待锁定对象时超时

Android学习笔记-事件处理机制

阮一峰：为什么要写博客（转）

Openstack_O版(otaka)部署_镜像服务glance部署

28.openssl编程——CRL

带分数（dfs,next_permutation）

C++ string的用法和例子

gcc g++编译问题。

对nginx,uWSGI,django的理解

反转一句话（仅反转各单词的顺序）

P1546 最短网络（codevs | 2627村村通）

502 Bad Gateway什么意思

从接口测试谈游戏的自动化测试.

ThinkGo：一个轻量级的 Go 语言 MVC 框架

关于一个无极限分类的问题

开源流媒体服务器--EasyDarwin

Linux下高cpu占有率的调试方案

PHP用户登录解析

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-10-12 17:24:49 当前IP: 18.189.178.237 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我