2048

Life is short I use Python


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 日程表

  • 站点地图

  • 公益 404

  • 搜索

Python爬虫--美团美食信息

发表于 2018-04-25 | 热度: ℃
美团网的美食信息,
阅读全文 »

Python爬虫之淘宝(二)

发表于 2018-04-18 | 分类于 Python | 热度: ℃
上一篇介绍了如何用 selenium 自动化工具去帮助爬取淘宝商品的各项数据,但是,我发现,淘宝的网页源代码中就包含有宝贝信息,信息被放在了 script 标签中,既然信息被包含在源代码中,那就证明可以通过正则或者其它的网页解析方式可以获取到需要的信息,因此这篇就来写一写对于淘宝商品来说更为简单的小爬虫。
阅读全文 »

Python爬虫之淘宝(一)

发表于 2018-04-17 | 分类于 Python | 热度: ℃
淘宝网也是动态加载的网页,虽然其页面数据也是通过 Ajax 获取的,但是若想像前面一样去分析 Ajax ,在淘宝这里是很复杂的,因为其参数会包含加密密钥,自己构造 Ajax 参数过于复杂。所以并不建议使用和爬取今日头条一样的方法来爬取淘宝。
阅读全文 »

Python爬虫--京东商品评论

发表于 2018-04-15 | 分类于 Python | 热度: ℃
京东网站是我经常去购物的网站,现在来爬京东商品的评论。有时候网速慢,打开评论的时候还要等一会,一直在加载,也证明了其评论是网页动态加载的。
阅读全文 »

爬虫之今日头条街拍

发表于 2018-04-11 | 分类于 Python | 热度: ℃
前面的爬虫都是静态页面,遇到动态页面该如何爬取,当时困惑了好久,不知道如何下手,参考了几篇其他大佬的文章,才慢慢有一点懂。
阅读全文 »

爬虫之猫眼排行榜TOP100

发表于 2018-03-29 | 分类于 爬虫 | 热度: ℃
爬虫初体验。
阅读全文 »
123
Tang

Tang

26 日志
10 分类
16 标签
RSS
Creative Commons
京ICP备19002475号 © 2020 Tang
| 博客全站共22.8k字
载入天数...载入时分秒...
0%