基于Spark的电影推荐系统(Scrapy爬虫)

第三部分-Scrapy爬虫(简介)

软件架构: Scrapy框架+Python3+
项目描述: 爬取国外电影网站的电影数据 ,保存到本地MySQL服务器

技术选型:

主要开发工具:

  • JetBrains PyCharm : 开发IDE

开发环境

项目架构

项目流程图

更多文章:基于Spark的电影推荐系统:https://blog.csdn.net/liuge36/column/info/29285

原文地址:https://www.cnblogs.com/liuge36/p/12614769.html