一尘不染

如何在python中使用imaplib获取电子邮件正文?

python

我想从IMAP4服务器获取整个邮件。在python文档中,如果发现此代码有效:

>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]

我想知道我是否总是可以相信data [0] [1]返回消息的主体。当我运行“ RFC822.SIZE”时,我只有一个字符串而不是一个元组。

我已经浏览了rfc1730,但无法弄清楚“ RFC822”的正确响应结构。也很难从imaplib文档中得知获取结果的结构。

这是我在获取时得到的RFC822

('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])

但是当我获取时,RFC822.SIZE我得到:

('OK', ['1 (RFC822.SIZE 847403)'])

如何正确处理data [0]列表?我可以相信,当它是一个元组列表时,元组正好有3个部分,第二个部分是有效载荷?

也许您知道imap4更好的库?


阅读 147

收藏
2020-12-20

共1个答案

一尘不染

不…imaplib是一个非常不错的库,它的imap太难以理解了。

您可能希望检查一下t == 'OK',但是data[0][1]可以像我用过的一样工作。

这是我用来提取通过电子邮件收到的签名证书的快速示例,虽然不是防弹的,但适合我的目的:

import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM

def getMsgs(servername="myimapserverfqdn"):
  usernm = getpass.getuser()
  passwd = getpass.getpass()
  subject = 'Your SSL Certificate'
  conn = imaplib.IMAP4_SSL(servername)
  conn.login(usernm,passwd)
  conn.select('Inbox')
  typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
  for num in data[0].split():
    typ, data = conn.fetch(num,'(RFC822)')
    msg = email.message_from_string(data[0][1])
    typ, data = conn.store(num,'-FLAGS','\\Seen')
    yield msg

def getAttachment(msg,check):
  for part in msg.walk():
    if part.get_content_type() == 'application/octet-stream':
      if check(part.get_filename()):
        return part.get_payload(decode=1)

if __name__ == '__main__':
  for msg in getMsgs():
    payload = getAttachment(msg,lambda x: x.endswith('.pem'))
    if not payload:
      continue
    try:
      cert = load_certificate(FILETYPE_PEM,payload)
    except:
      cert = None
    if cert:
      cn = cert.get_subject().commonName
      filename = "%s.pem" % cn
      if not os.path.exists(filename):
        open(filename,'w').write(payload)
        print "Writing to %s" % filename
      else:
        print "%s already exists" % filename
2020-12-20