Chrome headless 模式,爬虫、网页截图、生成PDF 利器
从 Chrome 59 开始具有 Headless 模式。这是一种在无需显示headless的环境下运行 Chrome 浏览器的方式。从本质上来说,就是不用 chrome 浏览器来运行 Chrome 的功能!它将 Chromium 和 Blink 渲染引擎提供的所有现代 Web 平台的功能都带入了命令行。
下图是Headless 模式具有的功能:
对于前端用大量js 渲染的网页可以用Chrome headless 来渲染以得到最终的显示效果。可以配合 selenium 在linux 服务器端自动运行,据测试,服务器最小内存为256MB,使用 python + selenium 驱动简单,使用 go + selenium 驱动能省点内存和CPU。
参考:
https://developers.google.com/web/updates/2017/04/headless-chrome
https://github.com/tebeka/selenium
https://pypi.org/project/selenium/
0
See Also
- Chrome 再催 Flash Player 退出历史舞台,2020年12月开始将不再受支持
- chromedp: 纯go 驱动Chrome 开发者工具
- IE的老大位置不会保持太久,Chrome竞争力加强,apple相当凶猛,移动互联网的趋势越来越明显!
- 把 PDF 转换成仅人眼可读
- 自己撸一份反爬虫方案
Nearby
- 上一篇 › Go 开源9周年
- 下一篇 › 怎样使用其它语言插入数据
简单说有什么作用?采集?
@root 采集、功能测试、截图