python-网站日志分析,状态吗,上载量等-第一篇
python----网站日志分析,状态吗,下载量等---第一篇
首先分析log文件的规律
判断 所需要的数据结构
注意 python中 定义的变量赋值的话,需要正确的,有可能就出错,这个是相当于c中的指针,
log = file('c://*******.log') datedict={} valuedict={} while True: line = log.readline() if len(line)==0: break str = line.split() try: code = str[-3] except IndexError: pass if code == '200': date = str[0] time = str[1] timeto = time.split(':')[0] if datedict.has_key(date): datedict2 = datedict[date] if datedict2.has_key(timeto): datedict2[timeto]=datedict2[timeto]+1 else: datedict2[timeto]=1 datedict[date]=datedict2 else: datedict[date]={} print datedict for key,value in datedict.items(): filename = "c://"+key+".txt" datefile= open(filename,'w') print >> datefile ,'time , count' valuedict=value for datekey in sorted(valuedict.keys()): print >>datefile,datekey,valuedict[datekey]
日志的分析,其实就是spilt(),正则表达式匹配,灵活的用dict,list等数据结构,
datedict2 = datedict[date]
这个地方 datedcit2是转向datedict对象的 如果定义为{}出错