youbbs avatar

Chrome headless 模式,爬虫、网页截图、生成PDF 利器

🕝 by youbbs

从 Chrome 59 开始具有 Headless 模式。这是一种在无需显示headless的环境下运行 Chrome 浏览器的方式。从本质上来说,就是不用 chrome 浏览器来运行 Chrome 的功能!它将 Chromium 和 Blink 渲染引擎提供的所有现代 Web 平台的功能都带入了命令行。

下图是Headless 模式具有的功能:

对于前端用大量js 渲染的网页可以用Chrome headless 来渲染以得到最终的显示效果。可以配合 selenium 在linux 服务器端自动运行,据测试,服务器最小内存为256MB,使用 python + selenium 驱动简单,使用 go + selenium 驱动能省点内存和CPU。

参考: https://developers.google.com/web/updates/2017/04/headless-chrome https://github.com/tebeka/selenium https://pypi.org/project/selenium/

💘 相关文章

评论

共2条关于"Chrome headless 模式,爬虫、网页截图、生成PDF 利器"的评论

root avatar
#1 root 回复

简单说有什么作用?采集?

写一条评论

Based on Golang + fastHTTP + sdb | go1.16.3 Processed in 0ms