传入的HTML或XML实体始终会转换为相应的Unipre字符。Beautiful Soup 3有许多重叠的实体处理方式,已被删除。
BeautifulSoup构造函数不再识别smartQuotesTo或convertEntities参数。
(Unipre,Dammit仍然具有smart_quotes_to,但现在的默认设置是将智能引号转换为Unipre。)如果要在输出时将这些Unipre字符转换回HTML实体,而不是将其转换为UTF-8字符,则需要使用输出格式化程序。
资料来源:http :
//www.crummy.com/software/BeautifulSoup/bs4/doc/#entities



