使用 python 进行微信好友分析

使用 python 进行微信好友分析

1. 使用到的库

① wxpy:初始化微信机器人

② openpyxl:保存微信好友数据为Excel表格

③ pyecharts:生成可视化的地图

④ wordcloud、matplotlib、jieba:生成词云图

特别提醒】:pyecharts 库用的是0.5.x版本,而在 pip 中安装的为1.x.x版本,因此需要自行到【官网】中下载。

2. 基本功能

① 分析微信好友数据

② 生成词云图

③ 生成地图展示

3. 代码实现

此处使用类来实现

(1) 导入模块

 

1 #  导入模块

2 from wxpy import Bot

3 import openpyxl

4 from pyecharts import Map

5 from wordcloud import WordCloud

6 import matplotlib.pyplot as plt

7 import jieba

 

 

(2) 初始化机器人和获取微信好友的源信息

此处调用 Bot() 方法,需要扫码登陆微信网页版,后续操作才能进行。

 

 1 def __init__(self, ToExcelFile="", ToCityFile="", ToMapProvinceFile="", ToMapCityFile=""):

 2     ''' 初始化机器人和其他参数 '''

 3     # 初始化机器人,需要扫码

 4     self.bot = Bot()

 5     # 获取我所有的微信好友信息 - 存储基础信息(未处理)

 6     self.allFriends_Info = self.bot.friends()

 7     # 我的微信好友个数

 8     self.allFriends_Num = len(self.allFriends_Info)

 9     # 保存微信好友信息的表格文件路径(.xlsx)

10     self.ExcelFile = ToExcelFile

11     # 保存城市词云图的文件路径(.png/.jpg)

12     self.WCOfCityFile = ToCityFile

13     # 保存省份地图的文件路径(.html)

14     self.MapProvinceFile = ToMapProvinceFile

15     # 其他可用参数

16     self.MapCityFile = ToMapCityFile

17     # 自动调用run方法,使得在实例化对象后自动运行其他函数

18     self.run()

 

 

(3) 统计和处理微信好友的信息

除了列出的还有 个性签名、头像其他属性。

 

 

1 def getFriendsInfo(self):

 2     ''' 获取微信好友的全部信息 '''

 3     # 存储微信好友的信息(经过信息处理的)

 4     self.friendsInfo = []

 5     # 定义列标题

 6     self.infoTitle = ['NickName', 'RemarkName', 'Sex', 'Province', 'City']

 7     for aFriend in self.allFriends_Info:

 8         # 获取昵称

 9         NickName = aFriend.raw.get(self.infoTitle[0], None)

10         # 获取备注

11         RemarkName = aFriend.raw.get(self.infoTitle[1], None)

12         # 获取性别

13         Sex = {1:"", 2:"", 0:"其他"}.get(aFriend.raw.get(self.infoTitle[2], None), None)

14         # 获取省份

15         Province = aFriend.raw.get(self.infoTitle[3], None)

16         # 获取城市

17         City = aFriend.raw.get(self.infoTitle[4], None)

18         lisTmp = [NickName, RemarkName, Sex, Province, City]

19         self.friendsInfo.append(lisTmp)

 

 

(4) 保存微信好友的信息

在这保存为Excel表格,在代码中插入表头行,为了便于阅读。

 

 

1 def saveFriendsInfoAsExcel(self, ExcelName):

 2     ''' 保存微信好友的信息到 Excel 表格中 '''

 3     # 生成openpyxl对象

 4     workbook = openpyxl.Workbook()

 5     # 激活表格

 6     sheet = workbook.active

 7     # 设置表格标题

 8     sheet.title = 'WeChatFriendsInfo'

 9     # 填充列标题到第一行

10     for _ in range(len(self.infoTitle)):

11         sheet.cell(row=1, column=_+1, value=self.infoTitle[_])

12     # 填充微信好友信息,从第二行开始

13     for i in range(self.allFriends_Num):

14         for j in range(len(self.infoTitle)):

15             sheet.cell(row=i+2, column=j+1, value=str(self.friendsInfo[i][j]))

16     # 若文件名非空,则保存到该路径下

17     if ExcelName != "":

18         workbook.save(ExcelName)

19         print(">>> Save WeChat friends' information successfully!")

 

 

(5) 分析微信好友的信息

1 def quiteAnalyzeFriendsInfo(self):

2     ''' 分析数据,一步到位,直接了当 '''

3     print(self.allFriends_Info.stats_text())

 

(6) 生成city词云图

 

 

1 def creatWordCloudOfCity(self, CityName):

 2     ''' 使用获取的数据生成city词云图 '''

 3     # 获取所有的城市

 4     cityStr = ""

 5     for i in range(self.allFriends_Num):

 6         if self.friendsInfo[i][4] not in cityStr:

 7             cityStr += " " + self.friendsInfo[i][4]

 8     #jieba库精确模式分词

 9     wordlist = jieba.lcut(cityStr)

10     cityStr = ' '.join(wordlist)

11     # 加载背景图片

12     #cloud_mask = np.array(Image.open(BackGroundFile))

13     #设置词云图属性

14     font = r'C:WindowsFontssimfang.ttf' # 设置字体路径

15     wc = WordCloud(

16         background_color = 'black',     # 背景颜色

17         #mask = cloud_mask,             # 背景图片

18         max_words = 100,                # 设置最大显示的词云数

19         font_path = font,               # 设置字体形式(在本机系统中)

20         height = 300,                   # 图片高度

21         width = 600,                    # 图片宽度

22         max_font_size = 100,            # 字体最大值

23         random_state = 100,             # 配色方案的种类

24         )

25     # 生成词云图

26     myword = wc.generate(cityStr)

27     #展示词云图

28     plt.imshow(myword)

29     plt.axis('off')

30     plt.show()

31     # 若文件名非空,则保存到该路径下

32     if CityName != "":

33         #保存词云图

34         wc.to_file(CityName)

35         print(">>> Creat WeChat wordcloud of city successfully!")

 

 

(7) 生成province地图

 

 

1 def creatMapProvince(self, MapFile):

 2     ''' 使用获取的数据生成province地图 '''

 3     # 获取所有省份

 4     provinceList, provinceNum = [], []

 5     for i in range(self.allFriends_Num):

 6         if self.friendsInfo[i][3] not in provinceList:

 7             provinceList.append(self.friendsInfo[i][3])

 8             provinceNum.append(0)

 9     for i in range(self.allFriends_Num):

10         for j in range(len(provinceList)):

11             if self.friendsInfo[i][3] == provinceList[j]:

12                 provinceNum[j] += 1

13     # 生成 Map

14     map = Map("各省微信好友分布", width=1000, height=800)

15     map.add("", provinceList, provinceNum, maptype="china", is_visualmap=True, visual_text_color='#000')

16     # 若文件名非空,则保存到该路径下

17     if MapFile != "":

18         map.render(MapFile)

19         print(">>> Creat WeChat Map of Provinces seccessfully!")

 

 

(8) 生成city地图

 

1 def creatMapCity(self, MapFile):

 2         ''' 使用获取的数据生成city地图 '''

 3         # 获取所有省份

 4         CityList, CityNum = [], []

 5         for i in range(self.allFriends_Num):

 6             if self.friendsInfo[i][4] not in CityList:

 7                 CityList.append(self.friendsInfo[i][4])

 8                 CityNum.append(0)

 9         for i in range(self.allFriends_Num):

10             for j in range(len(CityList)):

11                 if self.friendsInfo[i][4] == CityList[j]:

12                     CityNum[j] += 1

13         for i in range(len(CityList)):

14             CityList[i] += ''

15         # 生成 Map

16         map = Map("各市微信好友分布", width=1000, height=800)

17         map.add("", CityList, CityNum, maptype="广东", is_visualmap=True, visual_text_color='#000')

18         # 若文件名非空,则保存到该路径下

19         if MapFile != "":

20             map.render(MapFile)

21             print(">>> Creat WeChat Map of Cities seccessfully!")

 

 

有了上述实现各个功能的方法,那么就差一个调用各种方法的方法了。

(9) run方法

 

 

1 def run(self):

 2     # 获取微信好友信息

 3     self.getFriendsInfo()

 4     print(">>> Get WeChat friends' information successfully!")

 5     print(">>> Members:", self.allFriends_Num)

 6     # 保存微信好友信息

 7     self.saveFriendsInfoAsExcel(self.ExcelFile)

 8     # 分析微信好友信息

 9     self.quiteAnalyzeFriendsInfo()

10     # 使用微信好友的 city 产生词云图

11     self.creatWordCloudOfCity(self.WCOfCityFile)

12     # 生成微信好友的 province 地图

13     self.creatMapProvince(self.MapProvinceFile)

14     # 生成微信好友的 city 地图

15     self.creatMapCity(self.MapCityFile)

 

对于文件路径,在main函数中传递即可。【注】:上述代码都在类中,在此处结束,下面为main函数

 

1 if __name__ == "__main__":

2     ToExcelFile = "./WeChatAnalyze//FriendsInfo.xlsx"      # 微信好友信息的Excel表格保存路径

3     ToPictureFile = "./WeChatAnalyze//CityWordCloud.png"   # 微信好友信息city词云图保存路径

4     ToMapFileProvince = "./WeChatAnalyze//WeChatProvinceMap.html" # 微信好友信息province地图保存路径

5     ToMapFileCity = "./WeChatAnalyze//WeChatCityMap.html"  # 微信好友信息city地图保存路径

6     # WeChatRobot对象实例化

7     robot = WeChatRobot(ToExcelFile, ToPictureFile, ToMapFileProvince, ToMapFileCity)

 

是不是觉得Main函数很简短,哈哈,没错,就是这么简!

接下来看看实现的效果吧!

参考文献:

① 用python玩微信:https://segmentfault.com/a/1190000014203617

② pyecharts 中部分import 不到:https://blog.csdn.net/weixin_38617311/article/details/81146748

③ pyecharts 中地图显示不全:https://blog.csdn.net/xiamoyanyulrq/article/details/80025105

 

 总代码:

 

  1 from wxpy import *
  2 
  3 #初始化机器人,选择缓存模式(扫码)登录
  4 
  5 bot=Bot(cache_path=True)
  6 
  7 #获取我的所有微信好友信息
  8 
  9 friend_all=bot.friends()
 10 
 11 print(friend_all[0].raw)#friend_all[0]是我的微信昵称,.raw 则是获取我的全部信息
 12 
 13 ############运行后会自动弹出二维码页面,手机扫描登陆即可###########
 14 
 15 lis=[]
 16 
 17 for a_friend in friend_all:
 18 
 19     NickName=a_friend.raw.get('NickName',None)
 20 
 21     #Sex=afriend.raw.get('Sex',None)
 22 
 23     Sex={1:"",2:"",0:"其他"}.get(a_friend.raw.get('Sex',None),None)
 24 
 25     City=a_friend.raw.get('City',None)
 26 
 27     Province=a_friend.raw.get("Province",None)
 28 
 29     Sigenature=a_friend.raw.get("Signature",None)
 30 
 31     HeadImgFlagUrl=a_friend.raw.get("HeadImgFlagUrl",None)
 32 
 33     HeadImgFlag=a_friend.raw.get("HeadImgFlag",None)
 34 
 35     list_0=[NickName,Sex,City,Province,Sigenature,HeadImgFlagUrl,HeadImgFlag]
 36 
 37     lis.append(list_0)
 38 
 39 def lis2e07(filename,lis):
 40 
 41     import openpyxl
 42 
 43     wb = openpyxl.Workbook()
 44 
 45     sheet = wb.active
 46 
 47     sheet.title = 'list2excel07'
 48 
 49     file_name = filename +'.xlsx'
 50 
 51     for i in range(0, len(lis)):
 52 
 53         for j in range(0, len(lis[i])):
 54 
 55                 sheet.cell(row=i+1, column=j+1, value=str(lis[i][j]))
 56 
 57     wb.save(file_name)
 58 
 59     print("写入数据成功!")
 60 
 61 lis2e07('list3',lis)
 62 
 63 #######################粗略获取好友信息###############################
 64 
 65 Friends=bot.friends()
 66 
 67 data=Friends.stats_text(total=True,sex=True,top_provinces=30,top_cities=300)
 68 
 69 print(data)
 70 
 71 ######可以从存储在本地的 excel 中读取数据进行分析在执行以
 72 
 73  
 74 
 75 from pandas import read_excel
 76 
 77 df=read_excel('list4.xlsx',sheet_name='list2excel07')
 78 
 79 print(df.tail(7))
 80 
 81 df.city.count()
 82 
 83 df.city.describe()
 84 
 85 import pandas as pd
 86 
 87 #count=df.city.value_count()#对dataframe对 dataframe 进行全频率统计,排除了 nan
 88 
 89 city_list=df['city'].fillna('NAN').tolist()#将dataframe的列转化为list,其中nan用NAN替换
 90 
 91 count_city=pd.value_counts(city_list)#对list进行全频率统计
 92 
 93 from pyecharts import WordCloud
 94 
 95 name=count_city.index.tolist()
 96 
 97 value=count_city.tolist()
 98 
 99 wordcloud=WordCloud(width=1300,height=620)
100 
101 wordcloud.add("",name,value,word_size_range=[20,100])
102 
103 wordcloud.show_config()
104 
105 wordcloud.render(r'cy.html')
106 
107 province_list=df['province'].fillna('NAN').tolist()
108 
109 count_province=pd.value_counts(province_list)#对list进行全频率统计
110 
111 from pyecharts import Map
112 
113 value=count_province.tolist()
114 
115 attr=count_province.index.tolist()
116 
117 map=Map("各省微信好友分布",width=1000,height=600)
118 
119 map.add("",attr,value,maptype='china',is_visualmap=True,visual_text_color='#000',is_label_show=True)#显示地图上的省份
120 
121 map.show_config()
122 
123 map.render(r'FriendMap.html')

成果图如下:

原文地址:https://www.cnblogs.com/Exin/p/10966040.html