2013-11-01 《其实这算不算爬虫我也不知道》

        程序内容是按专辑从落网(http://www.luoo.net/)下载所有音乐。实现起来其实很容易。

        因为这网站上的MP3不是以一个一个.mp3形式的链接打开的,而是嵌入在播放器里的,所以我们先找到播放器的链接,然后看播放器是怎么访问MP3文件的。
        于是就查看页面源代码,结果发现这家伙太好找了:


        直接就叫mp3player,简直体贴。

        打开播放器之后就要找MP3链接了,查看页面元素,看打开这个网页之后我们都访问了哪些东西。
        不过这里因为我们是页面内容都加载好了才查看页面元素的,所以有些缓存里的东西就没有再一次下载,为了看到MP3的链接,我们换一首歌来听。


        一下就抓到了,一点成就感都没有……
        剩下的也不用多说了,这个MP3的链接这么好懂……
        于是直接上代码……
        依旧是新浪图床

原文地址:https://www.cnblogs.com/chihane/p/3415114.html