大三下每周总结--第四周

本周主要学习了,进行了大数据实验三,对数据进行了地域维度优化,提取关键字和行业分类操作,收获很多。

主要用到了:

1.调用百度地图API

通过调用百度地图API,给百度地图API一个地点名称,获取经纬,再根据经纬获取改地点详细信息,还有很多用法,给百度地图API打一波广告,用处很大。

2.提取关键字

主要用的是jieba类库,通过python实现调用,对一个字段进行提取关键字处理,当然这只是他的功能之一,后面我有时间会去研究研究他的其他用法

3.行业分类

这种模糊分类,网上有很多种方法,我的方法是简单的相似度匹配,利用python的匹配函数,他会返回一个相似度数值,通过判断这个数值大小,从而判断谁更相似,当然这个对比标准数据,需要你自己去寻找,不得不说python还是强大啊。

相关代码作者的大数据学习练习3--第一天 大数据学习练习3--第二天大数据学习练习3--第三天三篇博客中有详细代码,这里就不贴了,到此结束。

原文地址:https://www.cnblogs.com/my---world/p/12508009.html