Scrapy 1.3 文档¶
本文档包含您需要了解的关于Scrapy的所有内容。
获得帮助¶
遇到麻烦?我们想帮助!
尝试 常问问题 - 它有一些常见问题的答案。
在 StackOverflow using the scrapy tag 中询问或搜索问题,
搜索 archives of the scrapy-users mailing list 或 post a question 中的信息。
在 #scrapy IRC channel 中提出一个问题,
在我们的 issue tracker 中报告Scrapy的错误。
第一步¶
基本概念¶
内置服务¶
解决具体问题¶
- 经常问的问题
获取常见问题的解答。
- 调试蜘蛛
了解如何调试您的scrapy蜘蛛的常见问题。
- 蜘蛛合同
了解如何使用合同测试您的蜘蛛。
- 常见做法
熟悉一些Scrapy常用做法。
- 广泛爬行
调整Scrapy以并行爬取许多域。
- 使用Firefox刮
了解如何使用Firefox和一些有用的附加组件。
- 使用Firebug进行刮
学习如何有效地使用Firebug。
- 调试内存泄漏
了解如何查找和摆脱爬网程序中的内存泄漏。
- 下载和处理文件和图像
下载与您抓取的项目相关联的文件和/或图片。
- 部署蜘蛛
部署Scrapy蜘蛛并在远程服务器中运行它们。
- AutoThrottle扩展
根据负载动态调整抓取速度。
- 基准
检查Scrapy如何在硬件上执行。
- 作业:暂停和恢复爬网
了解如何暂停和恢复大型蜘蛛的抓取。