用Python处理邮件


用Python处理邮件
2011年07月20日
  A.title1:link {font-size:17.9px;font-family:arial;font-weight:bold;text-decoration:none;color:#ffffff;}A.title1:visited {font-size:17.9px;font-family:arial;font-weight:bold;text-decoration:none;color:#ffffff;}A.title1:active {font-size:17.9px;font-family:arial;font-weight:bold;text-decoration:none;color:#ffffff;}A.title1:hover {font-size:17.9px;font-family:arial;font-weight:bold;text-decoration:none;color:#ffffff;}A.title2:link {text-decoration:none;color:#000000;font-size:12px}A.title2:visited {text-decoration:none;color:#000000;font-size:12px}A.title2:active {text-decoration:none;color:#ff0000;font-size:12px}A.title2:hover {text-decoration:none;color:#ff0000;font-size:12px}
  
  ChinaUnix.net首页 | 论坛 | 博客 | Linux | 人才 | 培训 | 精华 | Wiki | 读书 | 资料 | 手册 | 下载 | 搜索
  
  ChinaUnix首页 > 精华文章 > Python > 正文   
  
  
  总体来说python处理邮件还是比较方便的,库提供了很多工具.下面我把心得写出来,给新手一个启迪,也请高手给些更好的方法.
  先说接受邮件.  poplib 方法.
  1.poplib.POP3('这里填入你pop邮件服务器地址') 登陆服务器.
  2.poplib.user('用户名 ') poplib.pass_('密码')
  3.poplib.stat()方法返回一个元组:(邮件数,邮件尺寸)
  mailCount,size=poplib.stat()
  这样mailCount就是邮件的数量,size,就是所有邮件的大小.
  3.poplib.rert('邮件号码')方法返回一个元组:(状态信息,邮件,邮件尺寸) 
  hdr,message,octet=server.retr(1) 读去第一个邮件信息.
  hdr的内容就是响应信息和邮件大小比如'+OK 12498 octets'
  message 是包含邮件所有行的列表.
  octet 是这个邮件的内容.
  得到的message是邮件的原始内容,也就是没有解码过的,里面的内容和标题基本上都是base64编码的,下面说说如何处理原始邮件.
  python 的email库里提供了很多处理邮件的方法,我们先把原始邮件转成email实例,这样就可以用库方法处理邮件.
  email.message_from_string() 这个方法能把String的邮件转换成email.message实例.
  比如我们上面的message,向下面这样调用.
  mail=email.message_from_string(string.join(message,'\n'))
  这样我们就生成了一个email.Message实例
  现在我们来提取邮件内容,和标题,mail支持字典操作.比如下面的操作.
  mail['subject'] ,mail.get('subject')
  mail['To'],mail.get('to')'
  mail.keys() ,mail.items() 等等.
  中文邮件的标题和内容都是base64编码的.解码可以使用email.Header 里的decode_header()方法.
  比如 print mail['subject']   显示的都未处理的编码.
  '=?GB2312?B?UmU6IFtweXRob24tY2hpbmVzZV0g?=\n\t=?GB2312?B?y63E3LDvztLV0tbQzsS1xFBZVEhPTrP10afRp8+wtcTXysHP?='
  email.Header.decode_header(mail['subject']) 下面是解码后的信息.
  [('Re: [python-chinese] \xcb\xad\xc4\xdc\xb0\xef\xce\xd2\xd5\xd2\xd6\xd0\xce\xc4\xb5\xc4PYTHON\xb3\xf5\xd1\xa7\xd1\xa7\xcf\xb0\xb5\xc4\xd7\xca\xc1\xcf', 'gb2312')]
  返回的是一个列表,里面的内容保存在一个元组里,(解码后的字串,字符编码)
  显示解码后的标题就象下面这样
  print email.Header.decode_header(mail['subject'])[0][0]
  Re: [python-chinese] 谁能帮我找中文的PYTHON初学学习的资料
  上面的mail标题编码是'gb2312'的,在我的winxp机器上可以直接显示,如果编码是别的比如'utf-8'编码,那么显示出来的就是乱码了.所以我们需要使用unicode()方法,unicode('这里是string','这里是编码,比如UTF-8'),比如
  subject=email.Header.decode_header(mail['subject'])[0][0]
  subcode=email.Header.decode_header(mail['subject'])[0][1])
  print unicode(subject,subcode)
  Re: [python-chinese] 谁能帮我找中文的PYTHON初学学习的资料
  下面看如何处理邮件内容.
  mail里有很多方法,熟悉这些方法处理邮件就很容易了。
  get_payload() 这个方法可以把邮件的内容解码并且显示出来.第一个可选择参数是mail实例,第二个参数是decode='编码' ,一般都是,'base64'编码
  is_multipart(),这个方法返回boolean值,如果实例包括多段,就返回True,
  print mail.is_multipart()
  true  ,这说明这个mail邮件包含多个字段。我下面的函数就可以处理,显示邮件的全部内容。
  def showmessage(mail):
  if mail.is_multipart():
  for part in mail.get_payload():
  showmessage(part)
  else:
  type=mail.get_content_charset()
  if type==None:
  print mail.get_payload()
  else:
  try:
  print unicode(mail.get_payload('base64'),type)
  except UnicodeDecodeError:
  print mail
  最后,有点要说明,如果邮件里的中文用mail.Header.decode_header()方法,和unicode()方法都不能正常显示,那么说明这个中文无法处理了,显示出来就是乱码.比如:看看看见,最终处理完成后,还是乱麻。
  >;>;>;mail.get('subject')
  'Re: [python-chinese] =?UTF-8?B?wrnDmMOTw5p4bWzCscOgw4LDq8K1w4TDjg==?=\n\t=?UTF-8?B?w4rDjMOi?='
  >;>;>;decode_header( mail.get('subject'))
  [('Re: [python-chinese]', None), ('\xc2\xb9\xc3\x98\xc3\x93\xc3\x9axml\xc2\xb1\xc3\xa0\xc3\x82\xc3\xab\xc2\xb5\xc3\x84\xc3\x8e\xc3\x8a\xc3\x8c\xc3\xa2', 'utf-8')]
  >;>;>;print decode_header( mail.get('subject'))[1][0]
  鹿

猜你喜欢

转载自rrkn06rrkn.iteye.com/blog/1359858