V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
marchbook
V2EX  ›  Python

怎样用Python 写一个爬图片的程序?

  •  
  •   marchbook · 2013 年 3 月 1 日 · 33803 次点击
    这是一个创建于 4707 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我是一名Python初学者,看基础知识到模块,类 ,列表元组字典,还没用过Python 标准库,

    我很喜欢杉本有美大妹子,想从贴吧抓取她的全部写真照,这样就不用一张张右键,我该怎么一步步做呢?求v2ex大大们指点迷津. 抓完了我会放在这里供大家下载.

    http://tieba.baidu.com/p/2166231880
    29 条回复    1970-01-01 08:00:00 +08:00
    spark
        1
    spark  
       2013 年 3 月 1 日   ❤️ 3
    去看看以下三个:
    * requests
    * PyQuery
    * Scrapy
    marchbook
        2
    marchbook  
    OP
       2013 年 3 月 1 日
    @spark 今晚看 :D
    manoon
        3
    manoon  
       2013 年 3 月 1 日
    如果仅此而已。。不需要python

    firefox有个downthemall的插件。。

    其实。。光用BS就足够了哟。以前抓过豆娘的~~~哈哈。
    skydiver
        4
    skydiver  
       2013 年 3 月 1 日
    @manoon BS 是什么?
    manoon
        5
    manoon  
       2013 年 3 月 1 日
    @skydiver
    Beautiful Soup
    AWSAM
        6
    AWSAM  
       2013 年 3 月 1 日
    跑下题.
    右键-使用迅雷下载全部链接-jpg-确定。
    over
    wenbinwu
        7
    wenbinwu  
       2013 年 3 月 1 日
    @AWSAM 呵呵,我是想介绍firefox扩展给他的:)
    for4
        8
    for4  
       2013 年 3 月 2 日
    for4
        9
    for4  
       2013 年 3 月 2 日   ❤️ 1
    linzhi
        10
    linzhi  
       2013 年 3 月 2 日
    LZ 赤裸裸的
    marchbook
        11
    marchbook  
    OP
       2013 年 3 月 2 日
    大家好,我是撸主,谢谢大家的提点, 写这个东西,一来是为了杉本有美大妹子,二来是训练一下Python技能,撸主想当一条码农.
    Myfreedom614
        12
    Myfreedom614  
       2013 年 3 月 2 日   ❤️ 1
    .Net版本的软件我倒是有,python(Github)有很多人写过了 http://openszone.com/tbalbumassistant/
    zhy0216
        13
    zhy0216  
       2013 年 3 月 2 日
    这算是为了妹子写程序么? 哈哈~
    marchbook
        14
    marchbook  
    OP
       2013 年 3 月 2 日
    @zhy0216 巴扎黑!
    lrz0lrz
        15
    lrz0lrz  
       2013 年 3 月 4 日
    imcj
        16
    imcj  
       2013 年 3 月 4 日
    linnchord
        17
    linnchord  
       2013 年 3 月 4 日
    requests+pyquery +1

    Scrapy复杂了点,小规模玩票不适用。
    C0VN
        18
    C0VN  
       2013 年 3 月 4 日 via Android
    自己想解决方案嘛!

    不过就是取得页面内容,然后匹配找出说有符合要求的图片url,需要翻页再找到下一页的url。需要用到urllib2和re,麻烦点自己正则匹配,或着其他库方便点。

    我之前写过一抓取虎扑相册图片的脚本。
    marchbook
        19
    marchbook  
    OP
       2013 年 3 月 15 日
    @xavierskip 多谢多谢,前段时间做别的事,这才记起来.
    marchbook
        20
    marchbook  
    OP
       2013 年 3 月 15 日
    @xavierskip 可否分享一下源码
    marchbook
        21
    marchbook  
    OP
       2013 年 3 月 15 日
    @Myfreedom614 咦,python开源版的有没有?
    C0VN
        22
    C0VN  
       2013 年 3 月 16 日 via Android
    fuckwaytoexplore
        23
    fuckwaytoexplore  
       2013 年 3 月 16 日   ❤️ 1
    楼主用的女人图片,站长快点来删了。
    wenLiangcan
        24
    wenLiangcan  
       2013 年 3 月 16 日   ❤️ 1
    cooiky
        25
    cooiky  
       2013 年 3 月 20 日
    @imcj 邀请码?
    imcj
        26
    imcj  
       2013 年 3 月 21 日
    @cooiky 需要邀请码可以联系@sohoer,不保证,XD。
    xiaowangge
        27
    xiaowangge  
       2013 年 3 月 27 日
    marchbook
        29
    marchbook  
    OP
       2013 年 3 月 27 日
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3235 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 12:16 · PVG 20:16 · LAX 04:16 · JFK 07:16
    ♥ Do have faith in what you're doing.