找回密码
 立即注册

设置

2022-2-21 06:16| 发布者: 笨鸟自学网| 查看: 14013| 评论: 0

摘要: Scrapy设置允许您自定义所有Scrapy组件的行为,包括核心、扩展、管道和spider本身。设置的基础结构提供了键值映射的全局命名空间,代码可以使用该命名空间从中提取配置值。可以通过下面描述的不同机制填充设置。这些 ...


SPIDER_LOADER_CLASS

违约: 'scrapy.spiderloader.SpiderLoader'

将用于加载spider的类,该类必须实现 SpiderLoader API .

SPIDER_LOADER_WARN_ONLY

违约: False

默认情况下,当Scrapy试图从 SPIDER_MODULES 如果有的话,它会很响地失效。 ImportError 例外。但是您可以选择沉默这个异常,并通过设置将它变成一个简单的警告 SPIDER_LOADER_WARN_ONLY = True .

注解

一些 scrapy commands 使用此设置运行到 True 已经(即,它们只会发出警告,不会失败),因为它们实际上不需要加载蜘蛛类来工作: scrapy runspider , scrapy settings , scrapy startproject , scrapy version .

SPIDER_MIDDLEWARES

违约:: {{}}

包含项目中启用的蜘蛛中间件及其订单的dict。有关详细信息,请参阅 激活蜘蛛中间件 .

SPIDER_MIDDLEWARES_BASE

违约::

{
    'scrapy.spidermiddlewares.httperror.HttpErrorMiddleware': 50,
    'scrapy.spidermiddlewares.offsite.OffsiteMiddleware': 500,
    'scrapy.spidermiddlewares.referer.RefererMiddleware': 700,
    'scrapy.spidermiddlewares.urllength.UrlLengthMiddleware': 800,
    'scrapy.spidermiddlewares.depth.DepthMiddleware': 900,
}

包含spider中间件的dict,默认情况下在scrappy中启用,以及它们的顺序。低阶更接近发动机,高阶更接近蜘蛛。有关详细信息,请参阅 激活蜘蛛中间件 .

SPIDER_MODULES

违约: []

Scrapy将在其中查找蜘蛛的模块列表。

例子::

SPIDER_MODULES = ['mybot.spiders_prod', 'mybot.spiders_dev']

STATS_CLASS

违约: 'scrapy.statscollectors.MemoryStatsCollector'

用于收集统计信息的类,必须实现 统计收集器API .

STATS_DUMP

违约: True

转储 Scrapy stats (对着残破的木头)一旦蜘蛛完成。

有关详细信息,请参阅: 统计数据集合 .

STATSMAILER_RCPTS

违约: [] (空表)

蜘蛛完成爬取后发送残缺数据。见 StatsMailer 更多信息。


上一篇:链接提取器下一篇:例外情况

Archiver|手机版|笨鸟自学网 ( 粤ICP备20019910号 )

GMT+8, 2025-9-1 08:55 , Processed in 0.013783 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2017 Discuz Team. Template By 【未来科技】【 www.wekei.cn 】

返回顶部