python爬虫——正则表达式

一、匹配模式和描述。

模式 描述
\w 匹配字母数字及下划线
\W 匹配非字母数字下划线
\s 匹配任意空白字符,等价于[\t\n\r\f]
\S 匹配任意非空字符
\d 匹配任意数字,等价于[0-9]
\D 匹配任意非数字
\A 匹配字符串开始
\Z 匹配字符串结束,如果存在换行,只匹配到换行前的结束字符串
\z 匹配字符串结束
\G 匹配最后匹配完成的位置
\n 匹配一个换行符
\t 匹配一个制表符
^ 匹配字符串开头
$ 匹配字符串结尾
. 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符
[…] 用来表示一组字符,单独列出:[amk]匹配‘a’,'m’或者‘k’
[^…] 不在[]中的字符:[^abc]匹配a,b,c之外的字符
* 匹配0个或多个的表达式
+ 匹配1个或多个的表达式
? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪模式
{n} 精确匹配n个前面表达式
{n,m} 匹配n到m次由前面的正则表达式定义的片段,贪婪模式
a|b 匹配a或b
() 匹配括号内的表达式,也表示一个组

二、代码。
(1)re.match
re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
re.match(pattern,string,flag=0)
第一个参数是你写的正则表达式,第二个参数是所要匹配的字符串,其他格外参数。

最常规匹配

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
content = "Hello 123 4567 World_This is a Regex Demo"
result = re.match('^Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$',content)
print(result)
print(result.group())
print(result.span())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z1.py
<re.Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
Hello 123 4567 World_This is a Regex Demo
(0, 41)

泛匹配

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
content = "Hello 123 4567 World_This is a Regex Demo"
result = re.match('^Hello.*Demo$',content)
print(result)
print(result.group())
print(result.span())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z2.py
<re.Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
Hello 123 4567 World_This is a Regex Demo
(0, 41)

匹配目标

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import  re
content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^Hello\s(\d+)\sWorld.*Demo$',content)
print(result)
print(result.group(1))
print(result.span())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z3.py
<re.Match object; span=(0, 40), match='Hello 1234567 World_This is a Regex Demo'>
1234567
(0, 40)

贪婪匹配

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import  re
content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^He.*(\d+).*Demo$',content)
print(result)
print(result.group(1))
print(result.span())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z4.py
<re.Match object; span=(0, 40), match='Hello 1234567 World_This is a Regex Demo'>
7
(0, 40)

非贪婪匹配

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import  re
content = "Hello 1234567 World_This is a Regex Demo"
result = re.match('^He.*?(\d+).*Demo$',content)
print(result)
print(result.group(1))
print(result.span())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z5.py
<re.Match object; span=(0, 40), match='Hello 1234567 World_This is a Regex Demo'>
1234567
(0, 40)

匹配模式

#!/usr/bin/python
# -*- coding: UTF-8 -*-
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import  re
content = '''Hello 1234567 World_This  
is a Regex Demo
'''

result = re.match('^He.*?(\d+).*?Demo$',content,re.S)
print(result)
print(result.group(1))
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z6.py
<re.Match object; span=(0, 42), match='Hello 1234567 World_This  \nis a Regex Demo'>
1234567

转义

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re

content = 'price is $5.00'
result = re.match('price is \$5\.00',content)
print(result)
print(result.group())

总结:尽量使用泛匹配、使用括号得到匹配目标、尽量使用非贪婪模式、有换行符就用re.S。
(2)re.seach
扫描整个字符串并返回第一个成功的匹配

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re


content = 'Hello ,I love you!'
result  = re.search('I.*?\w\s\w{3}\D',content)

print(result)
print(result.group())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z8.py
<re.Match object; span=(7, 18), match='I love you!'>
I love you!

re.findall 搜索字符串,以列表形式返回全部能匹配的字符串

#!/usr/bin/python
# -*- coding: UTF-8 -*-
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re

html = '''
<input type="checkbox" value="66417@" name="Url" class="check">
<span class="songNum ">08.</span>
<a target="_1" href="/play/66417.htm" class="songName ">爱拼才会赢 </a>
</li>
<li>
<input type="checkbox" value="56770@" name="Url" class="check">
<span class="songNum ">09.</span>
<a target="_1" href="/play/56770.htm" class="songName ">单身情歌 </a>
</li>
<li>
<input type="checkbox" value="81667@" name="Url" class="check">
<span class="songNum ">10.</span>
<a target="_1" href="/play/81667.htm" class="songName ">千年等一回 《新白娘子传奇》电视剧主题曲 </a>
</li>
<li>
<input type="checkbox" value="1601@" name="Url" class="check">
<span class="songNum ">11.</span>
<a target="_1" href="/play/1601.htm" class="songName ">涛声依旧 </a>
</li>
<li>
<input type="checkbox" value="89467@" name="Url" class="check">
<span class="songNum ">12.</span>
<a target="_1" href="/play/89467.htm" class="songName cBlue">日不落 </a>
</li>
<li>
<input type="checkbox" value="49772@" name="Url" class="check">
<span class="songNum ">13.</span>
<a target="_1" href="/play/49772.htm" class="songName ">女人花 </a>
</li>
<li>
<input type="checkbox" value="220816@" name="Url" class="check">
<span class="songNum ">14.</span>
<a target="_1" href="/play/220816.htm" class="songName ">路灯下的小姑娘 </a>
'''
results = re.findall('<a.*?href="(.*?)".*?>(.*?) </a>',html,re.S)
print(results)
for result in results:
            print(result[0],result[1])
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z10.py
[('/play/66417.htm', '爱拼才会赢'), ('/play/56770.htm', '单身情歌'), ('/play/81667.htm', '千年等一回 《新白娘子传奇》电视剧主题曲'), ('/play/1601.htm', '涛声依旧'), ('/play/89467.htm', '日不落'), ('/play/49772.htm', '女人花'), ('/play/220816.htm', '路灯下的小姑娘')]
/play/66417.htm 爱拼才会赢
/play/56770.htm 单身情歌
/play/81667.htm 千年等一回 《新白娘子传奇》电视剧主题曲
/play/1601.htm 涛声依旧
/play/89467.htm 日不落
/play/49772.htm 女人花
/play/220816.htm 路灯下的小姑娘

re.sub 替换字符串每一个匹配的字符串后返回替换后的字符串

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re

content = "Extra string Hello 1234567 World_This is a Regex Demo Extra stings"
content = re.sub('\d+','哈哈哈',content)
print(content)
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z11.py
Extra string Hello 哈哈哈 World_This is a Regex Demo Extra stings

re.findall 搜索字符串,以列表形式返回全部能匹配的字符串

#!/usr/bin/python
# -*- coding: UTF-8 -*-
#!/usr/bin/python
# -*- coding: UTF-8 -*-
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re

html = '''
<input type="checkbox" value="66417@" name="Url" class="check">
<span class="songNum ">08.</span>
<a target="_1" href="/play/66417.htm" class="songName ">爱拼才会赢 </a>
</li>
<li>
<input type="checkbox" value="56770@" name="Url" class="check">
<span class="songNum ">09.</span>
<a target="_1" href="/play/56770.htm" class="songName ">单身情歌 </a>
</li>
<li>
<input type="checkbox" value="81667@" name="Url" class="check">
<span class="songNum ">10.</span>
<a target="_1" href="/play/81667.htm" class="songName ">千年等一回 《新白娘子传奇》电视剧主题曲 </a>
</li>
<li>
<input type="checkbox" value="1601@" name="Url" class="check">
<span class="songNum ">11.</span>
<a target="_1" href="/play/1601.htm" class="songName ">涛声依旧 </a>
</li>
<li>
<input type="checkbox" value="89467@" name="Url" class="check">
<span class="songNum ">12.</span>
<a target="_1" href="/play/89467.htm" class="songName cBlue">日不落 </a>
</li>
<li>
<input type="checkbox" value="49772@" name="Url" class="check">
<span class="songNum ">13.</span>
<a target="_1" href="/play/49772.htm" class="songName ">女人花 </a>
</li>
<li>
<input type="checkbox" value="220816@" name="Url" class="check">
<span class="songNum ">14.</span>
<a target="_1" href="/play/220816.htm" class="songName ">路灯下的小姑娘 </a>
</li>
'''
html = re.sub('<a.*?>|</a>','',html)
print(html)
results = re.findall('<span.*?/span>(.*?)</li>',html,re.S)
print(results)
for result in results:
    print(result.strip())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z12.py

<input type="checkbox" value="66417@" name="Url" class="check">
<span class="songNum ">08.</span>
爱拼才会赢 
</li>
<li>
<input type="checkbox" value="56770@" name="Url" class="check">
<span class="songNum ">09.</span>
单身情歌 
</li>
<li>
<input type="checkbox" value="81667@" name="Url" class="check">
<span class="songNum ">10.</span>
千年等一回 《新白娘子传奇》电视剧主题曲 
</li>
<li>
<input type="checkbox" value="1601@" name="Url" class="check">
<span class="songNum ">11.</span>
涛声依旧 
</li>
<li>
<input type="checkbox" value="89467@" name="Url" class="check">
<span class="songNum ">12.</span>
日不落 
</li>
<li>
<input type="checkbox" value="49772@" name="Url" class="check">
<span class="songNum ">13.</span>
女人花 
</li>
<li>
<input type="checkbox" value="220816@" name="Url" class="check">
<span class="songNum ">14.</span>
路灯下的小姑娘 
</li>

['\n爱拼才会赢 \n', '\n单身情歌 \n', '\n千年等一回 《新白娘子传奇》电视剧主题曲 \n', '\n涛声依旧 \n', '\n日不落 \n', '\n女人花 \n', '\n路灯下的小姑娘 \n']
爱拼才会赢
单身情歌
千年等一回 《新白娘子传奇》电视剧主题曲
涛声依旧
日不落
女人花
路灯下的小姑娘

re.compile 将正则字符串编译成正则表达式对象,以便于复用该匹配模式

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
content = "Hello 123 4567 World_This is a Regex Demo"
pattern = re.compile('^Hello\s\d{3}\s\d{4}\s\w{10}.*Demo$')
result = re.match(pattern,content)
print(result)
print(result.group())
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z13.py
<re.Match object; span=(0, 41), match='Hello 123 4567 World_This is a Regex Demo'>
Hello 123 4567 World_This is a Regex Demo

实例1:抓取豆瓣图书源代码中的信息。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import requests
import re
content = requests.get('http://book.douban.com').text
pattern = re.compile(r'<li.*?cover.*?href="(.*?)" title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?abstract">(.*?)</p>.*?</li>',re.S)
results = re.findall(pattern,content)
for result in results:
    url,name,author,date,data = result
    author = re.sub('\s','',author)
    date = re.sub('\s','',date)
    print(url,name,author,date,data)
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z14.py
https://book.douban.com/subject/30330291/?icn=index-editionrecommend 时间中的孩子 [英]伊恩·麦克尤恩 2018-11-1 
                  
                  ★成长是一种失去,失去童年的特权,失去没有束缚的时间,失去无力感的同时也失去了完美无缺的安全感与自由。
★成年人只是一种角色扮演,我们都是时间中的孩子。
★对《时间中的孩子》的记忆一直在我脑中萦绕不去,它深刻、唯美而感人。只有伊恩•麦克尤恩能如此坦白地讲述失去。——本尼 迪 克特•康伯巴奇(卷福)
★获英国惠特布莱德奖、法国费米娜奖
★对我而言,《...
                
https://book.douban.com/subject/30362020/?icn=index-editionrecommend 幼稚园:今日宜远游 韩寒主编 2018-11 
                  
                  ◆	「幼稚园」是韩寒全新文艺品牌,以“幼稚园里,一切仍旧来得及”作为概念,让读者找回成人世界里丢失的一系列有趣事物。
◆	《今日宜远游》是「幼稚园」系列的第一本。以“我还年轻,我渴望上路”为概念,呼吁大家去远游吧,和你最爱的一切在一起。
◆	这里是文艺icon的发源地, 我的「乐园」决不追随潮流。
◆	特邀民谣歌手周云蓬、陈鸿宇撰文独家首发。葛亮、吴浩然、...
                
https://book.douban.com/subject/30351554/?icn=index-editionrecommend 活好 [日]日野原重明 2018-10-1 
                  
                  105岁的智者日野原先生,将大半生时间献给服务他人,在即将离开这个美好的世界前,以对话的方式,将他关于死亡、生命、家庭、朋友、工作、孤独等的思考,向所有愿意聆听的人娓娓道来。提问的人有老人、孩子,也有很多仍在职场工作的人,在36个问答之中,你能看到关于人生疑问的几乎全部答案。愿日野原先生的临终告白,带你穿越人生的迷雾,领悟生命的意义,获得勇往...
                
https://book.douban.com/subject/30348482/?icn=index-editionrecommend 红楼梦日历:锦色版·二〇一九 红楼梦精雅生活设计中心 2018-10 
                  
                  2019年《红楼梦日历》以“锦色”为主题。曹雪芹善画,懂得用色,又通织造,在《红楼梦》中,他对色彩的应用,取法天然,精准传神。
日历选取《红楼梦》中52个中国传统色彩,按今人习惯分为7个色系,春季红,夏季绿蓝,秋季紫黄,冬季白黑,设“出处”“识色”“制色”“织造”“书中今日”等小栏目,从红楼锦色着眼,配以色谱、服饰织物图及历代古画,展示纷繁绚烂...
                
https://book.douban.com/subject/30221537/?icn=index-editionrecommend 奥斯曼帝国六百年 [英]帕特里克·贝尔福 2018-10 
                  
                  【内容简介】
奥斯曼帝国六百年,是三百年的强盛加上三百年的衰落的故事。它是一个地跨欧亚非的庞大帝国、世界的十字路口,国运兴衰牵动了世界历史的走向。
土耳其人的祖先来自中亚大草原。公元1300年左右,他们迁徙到亚洲的最西端,在此建立了自己的国家。土耳其人拥有草原民族一贯的凌厉作风,而他们的灵活与包容则在那个时代独树一帜。仅仅经过三位开国苏丹的励精...
                
https://book.douban.com/subject/30248315/?icn=index-latestbook-subject 沙岸风云 [法]朱利安·格拉克 2018-10 
                  
                  龚古尔文学奖获奖作品,“超现实主义第二浪潮”的主要旗手朱利安·格拉克的长篇小说代表作品,一部闪烁着超现实主义与象征主义精神的瑰丽而深沉的小说,一个回溯历史与影射现实的天方夜谭式的离奇故事。
内容简介
《沙岸风云》是一部闪烁着超现实主义与象征主义精神的瑰丽而深沉的小说,作者虚构了一个天方夜谭式的离奇故事,用以回溯历史与影射现实。小说描叙阿尔多青...
                
https://book.douban.com/subject/30231924/?icn=index-latestbook-subject 沃普萧丑闻 [美]约翰·契弗 2018-10 
                  
                  这一秒想放弃,下一秒又想再坚持一下吧——
这,就是我们不想离开的人生。
写给每一个深陷各自困境,却依旧扑腾不息的普通人
《沃普萧丑闻》是《沃普萧纪事》的续篇。圣博托尔夫斯的沃普萧一家离开新英格兰的村庄,四散至各地,或仰仗于喜怒无常的威权,或陷于酗酒和情欲的深渊无力自拔,或被美国国内收入署追究逃税责任、四处逃亡……
《沃普萧丑闻》拥有宏大却温柔的视...
                
https://book.douban.com/subject/30356987/?icn=index-latestbook-subject 传奇中的大唐 刘勃 2018-10-1 
                  
                  《战国歧途》作者刘勃,从唐传奇文本入手,借虚虚实实的故事,讲述唐代的政治、社会与人情。
缠绵悱恻的爱情故事背后,是唐代的门阀观念、科举制度与风月行业;龙女、狐精等非人物种,却无一不是世情人性的明镜;虬髯客、聂隐娘、昆仑奴等侠客故事当中,则藏着唐太宗的分身,藩镇与藩镇之间、藩镇和朝廷之间的复杂关系,或者对遥远世界的想象。
                
https://book.douban.com/subject/30318719/?icn=index-latestbook-subject 电幻国度 [瑞典]西蒙·斯托伦哈格 2018-10 
                  
                  直到战争结束后,人们才意识到,带来末日的并非战争。
「Sentre Stimulus TLE」头盔,这台原本将要引领人类走向伊甸园的虚幻装置,于1996年更新至Mode 6以后,以一种始料未及的方式彻底摧毁了人类世界。
欢迎进入「电幻国度」的时代。
◆    超一流瑞典视觉艺术大师的神级图像小说
◆    虽说是图像小说,但感觉已经超越图像小说这一概念本身了
◆    每个人都是先被这电影设...
                
https://book.douban.com/subject/30372295/?icn=index-latestbook-subject 旭日残阳 桑兵 2018-11 
                  
                  近代史大家还原从“帝制”走向“共和”的历史进程
聚焦武昌起事至清帝退位、民国肇建的关键历史节点
拆解辛亥政坛政治博弈,孙中山袁世凯间的政坛斗法
【内容介绍】
本书是桑兵教授多年来发表于学术期刊上的文章结集,共计八篇。晚清的政权鼎革是近代史上一场大戏,本书以“旭日残阳”譬喻共和登台与帝制终结,聚焦武昌起事至清帝退位、民国肇建的半年左右时间里,风起云...
                
https://book.douban.com/subject/30309769/?icn=index-latestbook-subject 玻璃剑2:生存之战 [法]西尔维亚娜•科尔贾特编&nbsp;/&nbsp;[意]劳拉•祖凯里绘 2018-12 
                  
                  四把从天而降的宝剑,开启中古时代的奇幻冒险
一篇反抗压迫、争取生命和自由的史诗
令人叹为观止的想象力、细腻旖旎的异世界风物
2011年意大利卢卡国际漫画节杰出绘画大奖
◎ 编辑推荐
☆《玻璃剑》的故事以中世纪为时代背景,运用令人叹为观止的丰富想象力,构建出了一个奇妙无比的幻想世界。动植物、人物服饰、房屋建筑都与现实世界迥然不同,或绚丽前卫、或古朴素雅、...
                
https://book.douban.com/subject/30346791/?icn=index-latestbook-subject 看见孩子,看见自己 【英】A.H.布拉夫曼著 2018-11 
                  
                  育儿过程中,你是否曾为如下问题苦恼过:孩子厌食、呕吐、咬人、尿裤子、极度害羞……
对于这些只有躯体症状却没有生理病因的问题,来自英国国家健康中心的心理咨询师布拉夫曼博士告诉你:只需要与不开心的孩子聊聊内心的冲突!
《看见孩子,看见自己》是布拉夫曼博士从事儿童与青少年心理咨询五十年之久的经验之作,他通过许多生动的案例告诉我们:如果孩子的情绪没有...
                
https://book.douban.com/subject/30284021/?icn=index-latestbook-subject 天堂的喷泉 [英]阿瑟·克拉克 2018-11-1 
                  
                  二千年前,在赤道附近的岛国塔普罗巴尼发生了一场血腥的宫廷政变,暴君卡利达萨借此上台执政。他并不满足于人间的欢乐,他要在高山之巅建造天国,向天神挑战,于是诞生了“天堂的喷泉”。
二千年后,国王与帝国早已化为尘土,人类迈向了太空时代。为方便快捷地进入太空,工程师摩根选中在“天堂的喷泉”旧址处建造登天电梯,继续前人未竟的勃勃野心。为了达成目标,他...
                
https://book.douban.com/subject/30364892/?icn=index-latestbook-subject 塑造神圣 包慧怡 2018-10 
                  
                  The senses and their understanding by the medieval laity is an exciting arena in which many authors of the golden age of Middle English vernacular literature exercised their exegetical ability and literary craftsmanship. This book examines the representation of the divine by the anonymous fourteenth-century Pearl-poet, through a close reading of his three “scriptural” Middl...
                
https://book.douban.com/subject/30282306/?icn=index-latestbook-subject 泰坦的女妖 [美]库尔特·冯内古特 2018-10 
                  
                  “《泰坦的女妖》,是我特别喜欢,也是写得特别愉快的一本书。”——库尔特•冯内古特
----
★ 入围雨果奖年度最佳长篇
★ SCIENCE FICTION网站百大最佳科幻小说
----
温斯顿•伦福德乘坐私人太空飞船进入时间同向曲面漏斗后,就一直以波现象的形式存在,在起点为太阳、终点为参宿四的一条变形螺线上断续跳动,直到被地球截断。
所以每隔五十九天,他就会在太阳系地球美国罗...
                
https://book.douban.com/subject/30322198/?icn=index-latestbook-subject 社会主义与“自然” 朱羽 2018-10 
                  
                  本书尝试从“自然”出发重构1950-1960年代中国社会主义文化政治,所采取的具体路径是:聚焦于1949年新中国成立之后、尤其是1956“社会主义改造基本完成”之后继续改造“内外自然”这一历史时期,以此一时期涌现出的新山水画、“大跃进”民歌壁画、“自然美”的争论以及社会主义新喜剧等文艺、美学实践为具体对象,考察其所呈现的独特文化—政治经验(国家建设、新...
                
https://book.douban.com/subject/30346621/?icn=index-latestbook-subject 正午时踏进光焰 郭爽 2018-11 
                  
                  ☼ 实力派新锐女作家郭爽首部小说作品集
☼ 格非 × 金宇澄 联合推荐
☼ 收入“华文世界电影小说奖”首奖作品《拱猪》
◆阴影先于光焰,被拋先于自由,尘埃般的生命先于同情或遗忘。郭爽 的传彩之笔,描摹出了我们这个时代最基本的轮廓。——格非
◆“一代过去,一代又来”,嗔 痴静默,万物为刍狗,整本小说像闪电忽然照彻了夜晚,让读者听见历史雷鸣、以及时间的喃喃自语,...
                
https://book.douban.com/subject/30244068/?icn=index-latestbook-subject 腐败与政府 [美]苏珊·罗丝-阿克曼&nbsp;/&nbsp;[美]邦妮·J.帕利夫卡 2018-10-31 
                  
                  《腐败与政府》第1版于1999年出版,已被翻译成17 种语言,这本书引发了学界和政界对腐败问题的广泛思考。
在1999年首版《腐败与政府》的基础之上,作者在第2版《腐败与政府》中对第1版内容进行了更新,不仅评估了第1版中提出的经验性基础结论,还结合新数据对老问题进行了再思考,提出了针对新问题的应对方法。比如,腐败的文化基础、民主社会下的腐败问题,以及如...
                
https://book.douban.com/subject/30345416/?icn=index-latestbook-subject 铁浆 朱西甯 2018-10 
                  
                  他是张爱玲心目中“沈从文最好的故事里的小兵”
最后一位民国小说家 朱西甯先生作品大陆首次出版
阿城专文赏读,白先勇、莫言、王德威赞誉的白话小说经典
【编辑推荐】
1、他在张爱玲心中,“永远是沈从文最好的故事里的小兵”——文学史上的一页传奇、最后一位民国小说家朱西甯先生作品大陆首次出版。书中附赠张爱玲致作者的第一封信件手稿,原版复刻,首次曝光。
2、“...
                
https://book.douban.com/subject/30357968/?icn=index-latestbook-subject 郑渊洁家庭教育课 郑渊洁 2018-11 
                  
                  郑渊洁首次公开分享家教理念和方法,写给所有中国父母的教育宝典。
中国童话大王郑渊洁小学辍学、自学成才的故事,想必大家都不陌生。而他的儿子竟然也是小学学历,策划了郑渊洁多本畅销书,创建公司出任CEO;而女儿郑亚飞却是学霸一枚,以全校第一名的成绩毕业,被美国六所名牌大学的本科同时录取。

本书由郑渊洁执笔,他的儿子郑亚旗策划,父亲郑洪升撰写后记,可...
                
https://book.douban.com/subject/30365801/?icn=index-latestbook-subject 冷场 李诞 2018-11-20 
                  
                  《脱口秀大会》主持人、网络人气吐槽大V李诞诚意新作,人间百态故事集。
韩寒监制,「ONE 一个」工作室出品。
一个平行宇宙中的李诞,嬉笑怒骂背后对人间的终极吐槽
摇摆不定的恋人、坚定信仰的窃贼,每个人都会从中找到自己
借字浇愁,犀利温柔。
《吐槽大会》常驻嘉宾、谐星李诞最新人间百态故事集。
情人们、狠人们、大人们,每个人都能从中发现自己。
“再错的事情人都...
                
https://book.douban.com/subject/30281339/?icn=index-latestbook-subject 万物皆数 [法]米卡埃尔·洛奈(MickaëlLaunay) 2018-12 
                  
                  你观察过鹦鹉螺的外壳吗?注意过松果表面的螺纹吗?侦探剧中确定嫌疑人位置的三角定位是什么原理?阿尔法狗的算法与数学有哪些关联?
在史前时代,数学是为了实际应用而出现的。数字被用来计算羊群的数量,几何图形被用来测量田地并绘制道路。自那时以来,很多艺术家、创作者、匠人或者单纯的梦想家和好奇者,在无意中踏入了数学的领地。他们是不自觉的数学家,是人类...
                
https://book.douban.com/subject/30324826/?icn=index-latestbook-subject 心碎博物馆 〔克罗地亚〕奥林卡·维斯蒂卡、德拉任·格鲁比希奇 2018-10-25 
                  
                  爱情已逝,爱的信物犹在。我们该如何对待过往的恋情,是选择遗忘还是悉心珍藏?也许,它除了承载一对恋人的感情,还能带给其他人慰藉的力量。
2006年,克罗地亚的一对艺术家情侣分手之后,选择以一种特殊的方式纪念这段恋情,他们发起了一个展览,展示那些恋旧的人不忍丢弃的东西。心碎博物馆由此诞生。
迄今为止,心碎博物馆已在全球30个国家和地区成功举办了50场展...
                
https://book.douban.com/subject/30326086/?icn=index-latestbook-subject 冰冻时光之窗 [乌克兰]尤里·维尼楚克 2018-11-1 
                  
                  两获BBC图书奖、文学大师尤里`维尼楚克精选集登陆中国。
当代乌克兰最政治不正确的作家,不屈不挠的偶像破坏者,后苏维埃cult、科幻、情色、反乌托邦。
-
欢迎来到怪诞瑰丽的异想世界。
-
☞内容介绍
-
作为维尼楚克的首个中译本,《冰冻时光之窗》选译了维尼楚克最具代表性的 的17个完整短篇以及5种长篇的精彩片段,包含了抒情与哲理故事、心理小说、奇幻寓言、黑色幽默与讽...
                
https://book.douban.com/subject/30365007/?icn=index-latestbook-subject 重新理解创业 周航 2018-10-20 
                  
                  易到用车创始人/顺为资本投资合伙人周航,首度复盘20年创业经历,全方位坦陈创业得与失。这不是一本创业成功手册,却是思想的一次出走。
20年创业经历的咀嚼与反思,从战略、品牌、竞争,到流量、领导力、团队管理等,多角度多维度的重新认知,如李开复所言,“都是真刀真枪打出来的经验,值得每一位创业者多读几遍,吸收内化”。
雷军、李开复、徐小平作序,梁建章、...
                
https://book.douban.com/subject/30338759/?icn=index-latestbook-subject 雷切帝国:正义号的觉醒 [美]安·莱基 2018-10-1 
                  
                  人工智能的每次觉醒,都是宇宙之中诞生了新的神明。
------------------
正义号,是雷切帝国用来征服宇宙的智能战舰,配备了几千名由人工智能控制的辅助士兵。在征服战争末期,帝国内部发生了一次不为人知的背叛,使整个正义号瞬间化为灰烬。
在正义号的那场毁灭性的爆炸中,只有辅助士兵布瑞克活了下来,并被指派了一项秘密任务。在执行任务的二十年间,布瑞克渐渐觉醒。一天...
                
https://book.douban.com/subject/30325328/?icn=index-latestbook-subject 悲伤的力量 [英]朱莉娅·塞缪尔 2018-12 
                  
                  面对并理解死亡带来的悲伤,获得生活的意义与力量。
这不光是勇敢者的功课,而是所有人的!
▼内容简介
“真正伤害着一个人、一个家庭,甚至一代人的,并不是悲伤所带来的痛苦本身,而是他们为了逃避痛苦所做的事情。” “悲伤不是可以靠斗争去克服的东西,死亡带来的悲伤也被深深误解。”
在这本书中,我们会读到15则关于爱,失亲,面对自己的死亡以及抚平悲伤的动人故...
                
https://book.douban.com/subject/30262584/?icn=index-latestbook-subject 血色子午线 [美]科马克·麦卡锡 2018-11 
                  
                  全书为主人公“少年”的经历,十几岁的他加入美国军事队伍,前往墨西哥,不久就遭到了印第安人的致命打击。后来他偶然加入了由罪犯、老兵和印第安人组成的赏金猎人队伍,这个队伍名义上的首领是美墨战争老兵格兰顿,实际上指点生死的是霍尔顿法官。这个猎人队伍在墨西哥境内四处猎杀印第安人,无分男女老幼。赤裸的暴力在荒野上纵横,二十八年后,全部队员都陆续消亡...
                
https://book.douban.com/subject/30156802/?icn=index-latestbook-subject 帝国 [波]雷沙德·卡普钦斯基 2018-10 
                  
                  《帝国》是卡普钦斯基横越俄罗斯的私人报告,这部纪实文学是卡普钦斯基倾尽全力与心血的著作,为读者全方位、多视角地解析了俄罗斯的过去。一路上,卡普钦斯基接触到的大多是普通的老百姓,他捕捉了苏联即将解体之际,那片土地满载的冲突与情感,以及人们对于未来的恐惧与希望。这份“报告”见证了冲突,见证了苦难,也见证了希望。
卡普钦斯基是波兰新闻和文学界一位...
                
https://book.douban.com/subject/30306720/?icn=index-latestbook-subject 萨申卡 [英]西蒙·塞巴格·蒙蒂菲奥里 2018-11 
                  
                  ★有关苏联上流社会的详细描述,大亨和秘密警察,以及许多行为反常的人物;
★斯大林、贝利亚、罗杜斯和科比洛夫等历史人物,以及苏联官僚体系中的习惯等细节;
★部分档案的内容属杜撰与虚构;
★萨申卡一家的故事是受到犹太人的真实故事之启发而来。
1916年冬天,俄国的圣彼得堡,正处于革命边缘。斯莫尔尼贵族女子学院外,一个英国女家庭教师正在等待她那年轻的学生...
                
https://book.douban.com/subject/30264643/?icn=index-latestbook-subject 民粹主义大爆炸 [美]约翰·朱迪斯 2018-11-1 
                  
                  混圈层,读政治基本盘,
想了解特朗普的总统升迁韬略?
请看《纽时》《华尔街日报》《经济学人》相中的预言神书。
在人性、资本、权力的三国演义,
要从边缘到中心,
重要的不只实力,更在游戏规则。
玩转规则,看懂政治,改变就这么简单。
在政治上,民粹主义更多指的是借助“平民”的手腕与方法,政论家们经常将“民粹主义”与“精英主义”分立看待。19世纪以来,“民粹...
                
https://book.douban.com/subject/30252310/?icn=index-latestbook-subject 犯罪小说集 [日]吉田修一 2018-10 
                  
                  【编辑推荐】
★  少女失踪案、保险杀人案、挪用公款案、乡村大型命案、前职业棒球选手行凶案。
★  即将改编为电影《乐园》,由绫野刚、杉咲花、佐藤浩市等出演。
【内容简介】
以五起案件作为切入口,本质写的是日本社会的各个层面。少女失踪案、保险杀人案、挪用公款案、乡村大型凶案、前职业棒球选手行凶案。每一起案件的罪犯,都是“普通人”。
普通人是如何犯下重大罪...
                
https://book.douban.com/subject/30280586/?icn=index-latestbook-subject 伊本·赫勒敦 [美]罗伯特·欧文(RobertIrwin) 2018-10-30 
                  
                  他被称为人类历史哲学和社会学的奠基人之一
.
汤因比认为他的著作堪与修昔底德、马基雅维利相媲美
.
伊本·赫勒敦(1332—1406),中世纪阿拉伯哲学家、历史学家、政治活动家。他总结了阿拉伯诸王朝兴衰的历史,提出了历史发展的循环的观点。他的学说为近世欧洲哲学家、历史学家和社会学家所推崇,被称为“人类历史哲学和社会学的奠基人之一&#34;。
.
英国当代历史学家汤因比曾...
                
https://book.douban.com/subject/30275097/?icn=index-latestbook-subject 凝视太阳 [英]朱利安·巴恩斯 2018-10-20 
                  
                  【编辑推荐】
★ 欧洲文学奇才朱利安•巴恩斯的前期作品。巴恩斯曾四次入围布克奖决选,并于2011年斩获桂冠。
★一部直击每个普通人生存野心与人际恐惧的温柔小说,对成长的憧憬,对成年的失望,那些无人倾听的秘密,能与谁分享?
★ 跳脱、轻盈又犀利的文笔,揭开女性不为人知的曲折内心。朱利安•巴恩斯是获得法国历史悠久的妇女文学奖的唯一英国作家,其他获奖者包括...
                
https://book.douban.com/subject/30355421/?icn=index-latestbook-subject 原节子 徐辰 2018-11 
                  
                  原节子,二十世纪日本最具代表性女演员之一,一生跨越大正、昭和、平成三个时代。年少时误打误撞进入电影界,懵懵懂懂中一炮而红。早期常以温婉贤淑的形象出现,后期角色多回归家庭。因参演小津安二郎的多部影片为后人熟知,更与黑泽明、木下惠介、成濑巳喜男等打造日本电影黄金时代的导演数次合作。事业如日中天之际选择息影,过起深居简出的生活,也为影迷留下无数...
                
https://book.douban.com/subject/30254236/?icn=index-latestbook-subject 4 3 2 1 [美]保罗·奥斯特 2018-11 
                  
                  四重人生变奏,一个辉煌构想。
美国当代小说大师保罗·奥斯特迄今最具雄心超级长篇。
如果人生不止一生。
.
《纽约时报》•《洛杉矶时报》•《波士顿环球报》•《全美独立书商》畅销书
.
1947年3月3日,在新泽西州纽瓦克的一间产科病房,露丝和斯坦利唯一的孩子阿奇•艾萨克•弗格森出生了。从那时起,弗格森的生活展开了四条彼此独立的平行路径。四个男孩是同一个男孩,由...
                
https://book.douban.com/subject/30356081/?icn=index-latestbook-subject 奈飞文化手册 [美]帕蒂·麦考德 2018-10-1 
                  
                  一本对奈飞文化进行深入解读的力作。2009年,奈飞公开发布了一份介绍企业文化的PPT文件,在网上累计下载量超过1500万次,被Facebook的CFO谢丽尔·桑德伯格称为“硅谷重要文件”。本书是奈飞前CHO,PPT的主要创作者之一帕蒂·麦考德对这份PPT文件的深度解读。
本书系统介绍奈飞文化准则,全面颠覆20世纪的管人理念。在这本书中,帕蒂·麦考德归纳出8条奈飞文化...
                
https://book.douban.com/subject/30282307/?icn=index-latestbook-subject 厨房太平记 [日]谷崎润一郎 2018-11 
                  
                  ★ 谷崎润一郎 唯一喜剧小说
★ 昭和变动期小说家宅邸女佣的日常生活
★ 几家欢喜几家忧的“昭和女佣列传”
《厨房太平记》为谷崎润一郎晚年(76岁)作品。以自身经历为创作原型,回想了昭和10年至昭和33年间,在千仓磊吉家中(主要在京都与热海)工作的几位女佣的故事。昭和时代,乡下出身的朴素可爱的青涩少女,来到大城市的富裕人家当女佣,渐渐成熟,作品生动描绘出...
                
https://book.douban.com/subject/30340107/?icn=index-latestbook-subject 直觉泵和其他思考工具 丹尼尔•丹尼特(DanielC.Dennett) 2018-11-1 
                  
                  享誉世界的哲学泰斗丹尼尔·丹尼特,融通计算机科学、心理学、神经科学、语言学、人工智能,倾囊相授他一生至今所搜集的各种好用的思考工具。这本书诞生于大学新生的课堂,力图做到“人人能懂”。

使用大量方便的、辅助性的思考工具,去拓展想象力、保持专注力,让我们妥当、优雅地思考真正的难题。利用各种思考工具,让你拨开各种思想的层层迷雾,你会发现,那么多明...
                
https://book.douban.com/subject/26905155/?icn=index-latestbook-subject 九故事 J·D·塞林格 2018-10-1 
                  
                  《麦田里的守望者》作者塞林格唯一的短篇小说集,被列入《西方正典》,收录其最负盛名的九个短篇故事,其影响不亚于《麦田里的守望者》,亦为其巅峰之作,用平静克制却又摄人心魄的语言勾画纯真与美在现实中的困境,述说人生的真相与寻求解脱的重要性,堪称美国文学艺术的典范。
《九故事》收录了塞林格在《纽约客》上发表的九个短篇故事,每个故事自成一体,又互相关...

实例2:判断国内电话号码。

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import  re
phone = str(input("请输入你的电话号码:"))
patten = re.compile('^0\d{2,3}\d{7,8}$|^1[3578]\d{9}$|^147\d{8}$')
match = patten.match(phone)
if match:
    print(match.group() + "是电话号码!")
else:
    print(str(phone) + "不是电话号码!")
D:\Anaconda3\python.exe C:/Users/lenovo/PycharmProjects/爬虫/z15.py
请输入你的电话号码:12345678999
12345678999不是电话号码!

猜你喜欢

转载自blog.csdn.net/qq_40909772/article/details/84574052