srapy自定义起始url

# -*- coding: utf-8 -*-
import scrapy
from scrapy.http import Request
from scrapy.core.engine import ExecutionEngine

class ChoutiSpider(scrapy.Spider):
    name = 'baidu'
    allowed_domains = ['baidu.com']
    start_urls = ['http://baidu.com/']

    def start_requests(self):

        for url in self.start_urls:
            yield Request(url,dont_filter=True,callback=self.parse1)
            #yield 返回一个生成器，生成器可以被循环

    def parse(self, response):
        pass

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/catherine007/p/8624805.html

推荐文章
【Hutool】工具类之日期时间工具-DateUtil
正则表达式
kafka connector
kafka 入门
debezium、kafka connector 解析 mysql binlog 到 kafak
实时监听 mysql 操作，Linux 版
实时监听数据库变化
软件版本 Alpha、Beta、Rc
shiro 学习
font-family 字体
webpack 打包报错：One CLI for webpack must be installed. These are recommended choices, delivered as separate packages
safari下载中文文件名乱码
解析查询 queryString 请求参数的函数
CSS 命名规范
微信公众号替换title
Date——js 获取当前日期到之后一个月30天的日期区间
windows 环境下切换 python2 与 pythone3 以及常用命令
请求报错合集
安装 python pip Django
一个运营应该每天什么时候做哪些内容呢？
生活中残忍的真相
@ControllerAdvice 拦截异常并统一处理
自律的人生
50建议
公众号自动发送红包
增加记忆力方式
MySQL行转列与列转行
微人生的活法
人生三出戏
很重要的一点是关注并坚持去做那些短期看不到效果，但对你影响深远的事情。