最近偶然看到很强大的网页抓取工具 headless chrome。学习了一下,很快就写了个小网页放到网上。
很简单的功能,输入一个网址,生成手机和桌面版本的全屏截图。(支持某些不存在的站点)
放出地址, 请各位把玩把玩 http://www.91urls.com
我在想这个东西有没有往后做的可能,比如把大家生成截图的网址列出来,大家可以点赞、收藏、评论。 问题是 url 可能包罗万象,没有集中的兴趣点。
各位有什么想法,一起探讨一下,顺便帮我带点流量过来。
1
onsale 2018 年 1 月 16 日
|
2
onsale 2018 年 1 月 16 日
|
3
zhtphoenix OP @onsale 下一步可以做抓取页面内容进行分析
|
4
7654 2018 年 1 月 16 日
用这个可以上班摸鱼哈
|
5
Sanko 2018 年 1 月 16 日 via Android
花式看 yellow pic
|
6
northisland 2018 年 1 月 16 日
@我扶奶奶过哈登
|
7
zhtphoenix OP 兄弟们太火爆了,把我服务器搞挂了。。并发时性能还有问题
|
8
zhtphoenix OP 得先优化一下并发的性能了
|
9
AlwaysBee 2018 年 1 月 16 日
不错啊,之前一直用着 Full page screen capture 这个插件
|
10
Pudge1337 2018 年 1 月 16 日 via Android
不错,好玩!
|
11
miaomiao888 2018 年 1 月 17 日
|
12
NUT 2018 年 1 月 17 日
ajax 这种没处理好。 都是白的
|
13
mclxly 2018 年 1 月 17 日
提个建议: 我之前想做的,是每天发送一张截图给微信,例如 jd 的产品价格页。
|
14
shapl 2018 年 1 月 17 日
怎么自己发了那么多请求???
|
15
kimown 2018 年 1 月 17 日
LZ 是依据什么判断页面已经加载完毕,然后截图的,例如页面是纯数据填充的,但由于网速,后端接口需要 10s 后才返回,那 LZ 什么时候截图呢
|
16
nine99 2018 年 1 月 17 日
好厉害!!非常好用!!就是如果需要登入的网站是不是就用不了?
|
18
whileFalse 2018 年 1 月 17 日
看楼主的域名,果断生成了个 91p0rn 的截图。
|
19
timeisweapon 2018 年 1 月 17 日
不错
|
20
keventseng 2018 年 1 月 17 日
这是已经崩了吗?
|
21
shenyu1996 2018 年 1 月 17 日
使用的 puppeteer 么?后台的服务器是 linux 么,昨天我也在搞这个抓了下 b 站我账号下的动态更新,windows 下运行没问题,但是想跑在服务器上有点麻烦
|
22
julu 2018 年 1 月 17 日
体验了下,很实用
|
23
Sunrise837 2018 年 1 月 17 日
类似 360IE 插件有个功能 保存网页为图片。
|
24
v9ex 2018 年 1 月 17 日
测试了下草榴,发现可以,服务器在香港?
https://ww4.sinaimg.cn/large/a15b4afegy1fnjgknhx3vj20dc0hs75d |
25
zhtphoenix OP @shenyu1996 是 puppeteer, 在 ubuntu 上跑的
|
26
LeungJZ 2018 年 1 月 17 日
挂了。
|
27
zhtphoenix OP @v9ex 阿里云新加坡服务器
|
28
stalon 2018 年 1 月 17 日
https://developers.google.com/web/updates/2017/04/headless-chrome
Taking screenshots To capture a screenshot of a page, use the --screenshot flag: chrome --headless --disable-gpu --screenshot https://www.chromestatus.com/ # Size of a standard letterhead. chrome --headless --disable-gpu --screenshot --window-size=1280,1696 https://www.chromestatus.com/ # Nexus 5x chrome --headless --disable-gpu --screenshot --window-size=412,732 https://www.chromestatus.com/ Running with --screenshot will produce a file named screenshot.png in the current working directory. If you're looking for full page screenshots, things are a tad more involved. There's a great blog post from David Schnurr that has you covered. Check out Using headless Chrome as an automated screenshot tool . |
29
ArchiTech 2018 年 1 月 17 日
|
30
marcomarco 2018 年 1 月 17 日
有点意思,收藏了,希望拓展出更多功能,比如一键给整站截图 手动斜眼
|
31
hydyy 2018 年 1 月 17 日
好玩好玩
|
32
jkjoke 2018 年 1 月 17 日
挺不错的
|
33
MonoLogueChi 2018 年 1 月 17 日 via Android
|
34
xuyl 2018 年 1 月 17 日
|
35
woffee 2018 年 1 月 17 日
上班呢,楼上干什么呢(斜眼笑
|
36
livc 2018 年 1 月 17 日
不错,收藏了。
|
37
nexusone 2018 年 1 月 17 日
楼主的这个很 nice 啊,但是楼上的咱就别拿黄网做测试了
|
38
zhtphoenix OP @nexusone 老实说我做了这个后,才发现了好多本来不知道的小黄网,精神食粮更丰富了,感谢兄弟们
|
39
exuxu 2018 年 1 月 17 日
什么?小黄网,哪里哪里?
|
40
wvidc 2018 年 1 月 17 日
|
41
shawn2333 2018 年 1 月 18 日 via iPhone
需要点一下“阅读全文”的怎么搞
|
42
mydns 2018 年 1 月 18 日
|
43
pandasoda 2018 年 1 月 18 日
做的不错,就是截图的网站标题有些移位
|
44
zhtphoenix OP @pandasoda 已经 fix, 谢谢
|
45
issue 2018 年 1 月 18 日
一些建议:
1.自动补全 http:// 2.params 支持中文 3.自动加载更多时,等它加载完再截图 4.有些网站需要登录 5.屏蔽一些关键词 47xxxxx62 |
46
zhtphoenix OP @ArchiTech 赞赞赞
|
47
zhtphoenix OP @laoganbu 难得的建设性意见,谢谢
|
48
mervin24 2018 年 1 月 25 日
检测广告法不错 加淘宝天猫上广告法检测
|
49
livc 2018 年 2 月 24 日
这么快就挂了?
|
50
xshwy 2019 年 6 月 16 日
不知道怎么刷到这条,发现现在成了瑟情网站…
|