Python-100-Days/Day66-75/05.解析动态内容.md

557 B
Raw Blame History

解析动态内容

根据权威机构发布的全球互联网可访问性审计报告全球约有四分之三的网站其内容或部分内容是通过JavaScript动态生成的这就意味着在浏览器窗口中“查看网页源代码”时无法在HTML代码中找到这些内容也就是说我们之前用的抓取数据的方式无法正常运转了。解决这样的问题基本上有两种方案一是JavaScript逆向工程另一种是渲染JavaScript获得渲染后的内容。

JavaScript逆向工程

使用Selenium