youbbs
youbbs
4707 2 0

Chrome headless 模式,爬虫、网页截图、生成PDF 利器

从 Chrome 59 开始具有 Headless 模式。这是一种在无需显示headless的环境下运行 Chrome 浏览器的方式。从本质上来说,就是不用 chrome 浏览器来运行 Chrome 的功能!它将 Chromium 和 Blink 渲染引擎提供的所有现代 Web 平台的功能都带入了命令行。

下图是Headless 模式具有的功能:

对于前端用大量js 渲染的网页可以用Chrome headless 来渲染以得到最终的显示效果。可以配合 selenium 在linux 服务器端自动运行,据测试,服务器最小内存为256MB,使用 python + selenium 驱动简单,使用 go + selenium 驱动能省点内存和CPU。

参考:
https://developers.google.com/web/updates/2017/04/headless-chrome
https://github.com/tebeka/selenium
https://pypi.org/project/selenium/

0

See Also

Nearby


Discussion (2)

root
root 2018-11-11 07:09

简单说有什么作用?采集?

0
youbbs
youbbs 2018-11-11 09:23

@root 采集、功能测试、截图

0
Login Topics