Python爬虫之淘宝(二)
上一篇介绍了如何用 selenium 自动化工具去帮助爬取淘宝商品的各项数据,但是,我发现,淘宝的网页源代码中就包含有宝贝信息,信息被放在了 script 标签中,既然信息被包含在源代码中,那就证明可以通过正则或者其它的网页解析方式可以获取到需要的信息,因此这篇就来写一写对于淘宝商品来说更为简单的小爬虫。
Python爬虫之淘宝(一)
淘宝网也是动态加载的网页,虽然其页面数据也是通过 Ajax 获取的,但是若想像前面一样去分析 Ajax ,在淘宝这里是很复杂的,因为其参数会包含加密密钥,自己构造 Ajax 参数过于复杂。所以并不建议使用和爬取今日头条一样的方法来爬取淘宝。