Beautiful Soup文档¶
Beautiful Soup 是一个用于从HTML和XML文件中提取数据的Python库。它与您最喜欢的解析器一起提供导航,搜索和修改解析树的习惯方法。它通常节省程序员工作的小时或天。
这些说明说明了Beautiful Soup 4的所有主要特点,举例。我告诉你图书馆是什么好,它是如何工作,如何使用它,如何使它做你想要的,以及当它违反了你的期望做什么。
本文档中的示例在Python 2.7和Python 3.2中的工作方式应该相同。
您可能正在寻找 Beautiful Soup 3 的文档。如果是这样,你应该知道Beautiful Soup 3不再被开发,并且Beautiful Soup 4被推荐为所有新的项目。如果你想了解Beautiful Soup 3和Beautiful Soup 4之间的区别,请参阅 将代码移植到BS4。
获得帮助¶
如果你对Beautiful Soup有问题,或遇到问题,发送邮件到讨论组。如果您的问题涉及解析HTML文档,请务必提及该文档的 diagnose()函数说什么。