个人 圈外同学 一个简单的数据分析

原文:圈外的微信群,这里只是作为笔记。



一、背景


1、目标

对拉勾网的【数据分析岗位】上海地区企业分析,需要知道招聘【数据分析岗位】的上海公司所属【行业类型】

2、大致流程

  1. 后羿采集器抓取数据
  2. Excel对数据分列
  3. Excel建立数据透视表,计算值



二、数据采集


1、准备工具

  1. 目标数据:https://www.lagou.com/jobs/list_数据分析师/p-city_3?&cl=false&fromSearch=true&labelWords=&suginput=

  2. 爬虫工具:后羿采集器

2、选择模式,打开后羿采集器,选择右边的智能采集模式,点击开始采集


3、填入数据地址,填入准备好的数据地址,点击开始创建


4、去页面广告

  1. 点击按钮预执行操作


  2. 选择底部左边按钮点击

  3. 再点击页面的按钮给也不要

  4. 选择左上角的操作提示中的点击一下

5、清空所有数据,自定义数据列。

  1. 点击清空所有,即可清空所有字段。
  2. 点击添加字段,然后鼠标移动到需要抓取的数据那儿即可添加字段。


6、开始采集,保存,然后导出Excel




三、数据分析


1、数据拆分,打开Excel -> 选中目标列 -> 数据 -> 分列 -> 下一步 -> 选择需要的分隔符 -> 下一步 -> 完成


  1. 分隔符的设置


  2. 原始数据


  3. 处理后的数据


2、建立数据透视表,选择目标列 -> 数据 -> 数据透视表 -> 确定

  1. 字段列表,选中要显示的字段
  2. 数据透视表区域,把字段列表的字段,拖入到数据透视表区域那个区域中
原文地址:https://www.cnblogs.com/guxingy/p/13129701.html