来自官网的诠释:
爬取的主要目标就是从非结构性的数据源中提取结构性数据, 如网页. Scrapy提供Item类来满足这样的需求.
Item对象是一种简单的容器, 保存了爬取到的数据,
其提供了类似于词典的API, 以及用于声明可用字段的简单语法
Item是一种数据容器, 是作为蜘蛛与管道之间的数据载体, 蜘蛛对收集的数据结构进行分析后提取出具体的数据结构并生成对应的Item实例,然后由Scrapy引擎传递给对应的管理进行后处理.
声明Item
Item使用简单的class定义语法和Field对象来进行声明
Item字段 (item fields)
import scrapy class Product(scrapy.Item): name = scrapy.Field() price = scrapy.Field() stock = scrapy.Field() last_updated = scrapy.Field(serializer=str)