使用电子邮件包,我们可以读取.eml文件。然后,使用该
BytesParser库来解析文件。最后,
plain在
get_body()方法和
get_content()方法中使用首选项(用于纯文本),以获取电子邮件的原始文本。
import emailfrom email import policyfrom email.parser import BytesParserimport globfile_list = glob.glob('*.eml') # returns list of fileswith open(file_list[2], 'rb') as fp: # select a specific email file from the list msg = BytesParser(policy=policy.default).parse(fp)text = msg.get_body(preferencelist=('plain')).get_content()print(text) # print the email content>>> "Hi,>>> This is an email>>> Regards,>>> Mister. E"当然,这是一个简化的示例-没有提及HTML或附件。但是它基本上完成了问题的要求和我想做的事情。
这是您遍历几封电子邮件并将其另存为纯文本文件的方式:
file_list = glob.glob('*.eml') # returns list of filesfor file in file_list: with open(file, 'rb') as fp: msg = BytesParser(policy=policy.default).parse(fp) fnm = os.path.splitext(file)[0] + '.txt' txt = msg.get_body(preferencelist=('plain')).get_content() with open(fnm, 'w') as f: print('Filename:', txt, file = f)


