abusizhishen
V2EX  ›  问与答

用 Python 写一个爬虫,爬取视频资源并保存,视频按分类存放在硬盘上,目录创建失败致无法保存

  •  
  •   abusizhishen · Dec 23, 2017 · 3446 views
    This topic created in 3107 days ago, the information mentioned may be changed or developed.

    部分分类名称含有特殊字符、导致创建目录出错。有什么好用的模块或方法能检测并修正目录吗?

    11 replies    2017-12-24 14:16:40 +08:00
    lishunan246
        1
    lishunan246  
       Dec 23, 2017   ❤️ 1
    slugify
    abusizhishen
        2
    abusizhishen  
    OP
       Dec 23, 2017
    创建目录之前检测一遍,有特殊字符就替换或者去掉,再去创建目录
    Kilerd
        3
    Kilerd  
       Dec 23, 2017
    md5(name) 满分答案
    Kilerd
        4
    Kilerd  
       Dec 23, 2017
    然后用一个 sqlite 数据库记住 名字 => md5 目录的对应关系
    abusizhishen
        5
    abusizhishen  
    OP
       Dec 23, 2017 via Android
    @lishunan246 一会看下
    abusizhishen
        6
    abusizhishen  
    OP
       Dec 23, 2017 via Android
    @Kilerd 复杂了,我保存在本地,直接浏览的
    lniwn
        7
    lniwn  
       Dec 23, 2017 via iPhone
    @abusizhishen 先创建目录,如果失败了再检测并替换非法字符。
    manzhiyong
        8
    manzhiyong  
       Dec 23, 2017
    一般我的目录名都是数字,是附件数据库 id 除以某个数(目录下存放文件数)的值。
    frank611
        9
    frank611  
       Dec 23, 2017 via Android
    ???
    Arnie97
        10
    Arnie97  
       Dec 24, 2017 via Android
    直接正则替换掉特殊字符不能满足需求?
    abusizhishen
        11
    abusizhishen  
    OP
       Dec 24, 2017 via Android
    @Arnie97 如果有模块能提供这个功能更好
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2333 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 16:08 · PVG 00:08 · LAX 09:08 · JFK 12:08
    ♥ Do have faith in what you're doing.