logging 模块
很多程序都有记录日志的需求
logging的日志可以分为 debug(), info(), warning(), error() and critical()5个级别1.输出到屏幕上
import logging #输出到屏幕上 只显示 warning error critical 不会显示 debug info logging.debug('user wrong 3 times') logging.info('user wrong 3 times')logging.warning('user wrong 3 times')logging.error('user wrong 3 times')logging.critical('user wrong 3 times')
2.输出到文件中
import logging #输出到文件中 显示 >= level(ERROR) 若是不设level 不会显示 debug info logging.basicConfig(filename='logmsg.log',level=logging.ERROR)logging.debug('user wrong 3 times')logging.info('user wrong 3 times')logging.warning('user wrong 3 times')logging.error('user wrong 3 times')logging.critical('user wrong 3 times')
3.输出日期格式
import logging logging.basicConfig(filename='logmsg.log', format='%(asctime)s - %(levelno)s - %(levelname)s - %(filename)s - %(message)s', datefmt='%m/%d/%Y %I:%M:%S %p', level=logging.DEBUG)# logging.basicConfig(format='%(asctime)s %(message)s',datefmt='%Y-%m-%d %I:%M:%S %p',level=logging.DEBUG)logging.debug('user wrong 3 times')logging.info('user wrong 3 times')logging.warning('user wrong 3 times')logging.error('user wrong 3 times')logging.critical('user wrong 3 times')除了加时间,还可以自定义一大堆格式,下表就是所有支持的格式%(name)s Logger的名字%(levelno)s 数字形式的日志级别%(levelname)s 文本形式的日志级别%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有 会乱码 %(filename)s 调用日志输出函数的模块的文件名%(module)s 调用日志输出函数的模块名%(funcName)s 调用日志输出函数的函数名%(lineno)d 调用日志输出函数的语句所在的代码行%(created)f 当前时间,用UNIX标准的表示时间的浮点数表示%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒%(thread)d 线程ID。可能没有%(threadName)s 线程名。可能没有%(process)d 进程ID。可能没有%(message)s 用户输出的消息
4.同时输出到屏幕和文件中:四个组件,类:logger handler filter formatter
1 import logging 2 from logging import handlers 3 4 class IgnoreBackupLogFilter(logging.Filter): 5 """忽略带db backup 的日志""" 6 def filter(self, record): #固定写法 7 return "db backup" not in record.getMessage() #如果是True就记录 8 9 # 1.生成logger对象10 logger= logging.getLogger('web')11 logger.setLevel(logging.DEBUG)12 13 #1.1 把filter对象添加到logger中14 logger.addFilter(IgnoreBackupLogFilter())15 16 #2.生成handler对象17 ch = logging.StreamHandler()18 # ch.setLevel(logging.INFO)19 # fh = logging.FileHandler('lweb.log')20 # RotatingFileHandler( filename[, mode[, maxBytes[, backupCount]]]) 按文件大小截断21 # fh = handlers.RotatingFileHandler('lweb.log',maxBytes=10,backupCount=3)22 # TimedRotatingFileHandler( filename [,when [,interval [,backupCount]]]) 按时间截断23 fh = handlers.TimedRotatingFileHandler('lweb.log',when='S',interval=5,backupCount=3)24 # fh.setLevel(logging.WARNING)25 26 #2.1把handler对象绑定到logger27 logger.addHandler(ch)28 logger.addHandler(fh)29 30 #3.生成formatter对象31 #3.1把formatter对象绑定到handler对象32 file_formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s', datefmt='%m/%d/%Y %I:%M:%S %p')33 console_formatter = logging.Formatter('%(asctime)s - %(name)s - %(lineno)s - %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p')34 ch.setFormatter(console_formatter)35 fh.setFormatter(file_formatter)36 37 logger.debug('user db backup wrong 3 times')38 logger.info('user wrong 3 times')39 logger.warning('user wrong 3 times')40 logger.error('user db backup wrong 3 times')41 logger.critical('user db backup wrong 3 times')42 43 # 没有给级别 之前 默认是 warning44 #handler的级别不能比全局低45 #像是一个漏斗 全局过滤之后 才到handler46 #全局设置为DEBUG后 console handler 设置为 INFO ,如果输出的日志级别为debug,那就不会在屏幕上打印
#注意:maxBytes用于指定日志文件的最大文件大小backupCount用于指定保留的备份文件的个数when参数是一个字符串 S秒 M分 H小时 D天 W每星期(interval==0时 代表星期一) midnight 每天凌晨interval是时间间隔
-------------------------------------------------------------------------------
re 模块
正则表达式:字符串的匹配规则1.re常见的匹配语法有以下几种
re.match 从头开始匹配 只匹配一个就返回 场景:手机号 re.search 全局匹配 只匹配一个就返回 re.findall 把所有匹配到的字符放到以列表中的元素返回 phones = re.findall('1[0-9]{10}', data) re.split 以匹配到的字符当做列表分隔符 re.sub 匹配字符并替换 re.fullmatch 全部匹配 re.match('[0-9]','123dasd') = <_sre.SRE_Match object; span=(0, 1), match='1'> re.search('[0-9]','abc1d3e') = <_sre.SRE_Match object; span=(3, 4), match='1'> # re.findall('[0-9]','abc1d3e') = ['1', '3']
注:match 和 search 返回是一个对象 是这样拿值的:需要先判断 否则会报错res = re.search('[0-9]','abs1d2')if res: print(res.group())re.match('sd','sd*sda') == re.search('^sd','sd*sda') == re.search('\Asd','sd*sda') == sd re.search('sd$','adssasd') == re.search('sd\Z','adssasd') == sd re.search('[0-9]','alex23') == re.search('\d','alex23') == 2
2.示例:
re.search('.','*a2a3sdas') == * #任意一个字符re.search('^sd','sd*sda') == sd #以什么开头re.search('sd$','sdasd') == sd #以什么结尾re.match('b$','b') == b #只匹配一个re.search('ab*','abblex') == abb #*前一个字符0次或多次 re.search('ab*','sdad') == are.search('ab+','sdad') == None re.search('ab+','sdabbbd') == abbb re.search('a+','sdaa') == aa #+前一个字符1次或多次re.search('.+','abcd') == abcd #匹配到所有re.search('a?','aasad') == a #?前一个字符0次或1次re.search('a{2}','dddaa') == aa #{m}前一个字符m次re.search('[0-9]','asd232') == 2 #[] 匹配0-9一次 [a-z]re.search('[a-z]{1,5}','2lex') == lex #{n,m}匹配前一个字符n到m次 re.search('[a|A]lex','alex') == alex #|或 匹配左或右的字符re.search('([a-z]+)([0-9]+)','alex123').groups() == ('alex', '123') #()()分组匹配re.search('\Aalex','alex') == alex #\A以什么开头re.search('sd\Z','adssasd') == sd #\Z以什么结尾re.search('\d','alex23') == 2 #\d匹配数字0-9 re.search('\d+','alex23') == 23re.search('\D','alex23') == a #匹配非数字re.search('\D+','@*&234alex23') == @*& re.search('\w+','!@#23saAS') == 23saAS #匹配[A-Z a-z 0-9]re.search('\W+','!$@23saAS') == !$@ #匹配非[A-Z a-z 0-9] 即:特殊字符 re.findall('\s','alex\njack\rma ck\tjack') == ['\n', '\r', ' ', '\t'] #匹配空白字符 \n \r \t s='61062019991011053' #分组,可定义成字典 re.search('(?P\d{3})(?P \d{3})(?P \d{4})',s).groups() == ('610', '620', '1999')re.search('(?P \d{3})(?P \d{3})(?P \d{4})',s).groupdict() == { 'province': '610', 'city': '620', 'born_year': '1999'}
3.常用的表达式规则
'.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,(re.S)则匹配任意字符,包括换行'^' 匹配字符开头,若指定flags MULTILINE,(re.M)这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)'$' 匹配字符结尾, 若指定flags MULTILINE(re.M) ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 会匹配到foo1'*' 匹配*号前的字符0次或多次, re.search('a*','aaaabac') 结果'aaaa''+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']'?' 匹配前一个字符1次或0次 ,re.search('b?','alex').group() 匹配b 0次'{m}' 匹配前一个字符m次 ,re.search('b{3}','alexbbbs').group() 匹配到'bbb''{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']'|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC''(...)' 分组匹配, re.search("(abc){2}a(123|45)", "abcabca456c").group() 结果为'abcabca45''\A' 只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的,相当于re.match('abc',"alexabc") 或^'\Z' 匹配字符结尾,同$ '\d' 匹配数字0-9'\D' 匹配非数字'\w' 匹配[A-Za-z0-9]'\W' 匹配非[A-Za-z0-9]'\s' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t''(?P...)' 分组匹配 re.search("(?P [0-9]{4})(?P [0-9]{2})(?P [0-9]{4})","371481199306143242").groupdict("city") 结果{ 'province': '3714', 'city': '81', 'birthday': '1993'}
4.分割:re.split() 替换:re.sub() 全部匹配:re.fullmatch() 全部匹配:pattern = re.compile() pattern.fullmatch() 效率高
s='alex22jack23jinxin50|mack-oldboy're.split('\d+|\||-',s) == ['alex', 'jack', 'jinxin', '', 'mack', 'oldboy']re.findall('\d+|\||-',s) = ['22', '23', '50', '|', '-'] s='alex22jack23jinxin50\mack-oldboy're.split('\\\\',s) == ['alex22jack23jinxin50', 'mack-oldboy'] s='9-2*5/3+7/3*99/4*2998+10*568/14're.split('\W+',s) == ['9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14']re.split('\W+',s,maxsplit=3) == ['9', '2', '5', '3+7/3*99/4*2998+10*568/14'] re.split('[-\*/\+]',s) == ['9', '2', '5', '3', '7', '3', '99', '4', '2998', '10', '568', '14']s = 'alex22jack23jinxin50\\mack-oldboy're.sub('\d+','_',s) == 'alex_jack_jinxin_\\mack-oldboy're.sub('\d+','_',s,count=2) == 'alex_jack_jinxin50\\mack-oldboy' re.fullmatch('\w+@\w+\.(com|cn|edu)','alex@oldboyedu.com') # 慢 规则需要转换成bytes需时间pattern = re.compile('\w+@\w+\.(com|cn|edu)') #快 规则转换bytes1次就可以了pattern.fullmatch('alex@oldboyedu.com') == <_sre.SRE_Match object; span=(0, 18), match='alex@oldboyedu.com'>
5.标识符 Flags
re.I #忽略大小写 re.IGNORECASEre.M #多行模式 re.MULTILINEre.S #改变.的行为,.是任意字符,除了换行符\n re.DOTALLre.X #可对正则 规则 注释 re.VERBOSE re.search('a','Alex',re.I) == A re.search('foo.$','foo1\nfoo2\n') == foo2 re.search('foo.$','foo1\nfoo2\n',re.M) == foo1 re.search('^s','\nsds',re.M) == s re.search('.','\n') == None re.search('.','\n',re.S) == \n re.search('.','alex') == a re.search('. #test','alex') == Nonere.search('. #test','alex',re.X) = a
注:
[^"] 表示不包含“这个字符
[^()] 表示不包含()这个括号
re.search(r'\\','asd2\sad') == <_sre.SRE_Match object; span=(4, 5), match='\\'> re.search('\\\\','asd2\sad') == <_sre.SRE_Match object; span=(4, 5), match='\\'> r:表示原生字符串