V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  6
     
  •   v2exgo · 3 天前 · 10952 次点击

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    77 条回复    2026-03-13 13:13:50 +08:00
    wyntalgeer
        1
    wyntalgeer  
       3 天前
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       3 天前
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       3 天前 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       3 天前
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       3 天前
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       3 天前
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       3 天前
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       3 天前
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       3 天前
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       3 天前
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       3 天前
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       3 天前
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       3 天前
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       3 天前
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       3 天前
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       3 天前
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       3 天前
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       3 天前
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       3 天前
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       3 天前
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       3 天前 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议😂
    calmbinweijin
        22
    calmbinweijin  
       3 天前
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       3 天前
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
    cat
        24
    cat  
       3 天前
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       3 天前
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       3 天前
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       3 天前
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       3 天前
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       3 天前
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       3 天前
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       3 天前
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       3 天前
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       3 天前
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       3 天前
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       3 天前
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       3 天前
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       3 天前
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       3 天前   ❤️ 1
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       3 天前
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       3 天前
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       3 天前
    擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
    v2exgo
        42
    v2exgo  
    OP
       3 天前
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       3 天前
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       3 天前 via Android   ❤️ 3
    岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
    isnullstring
        45
    isnullstring  
       3 天前
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       3 天前 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       3 天前
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       3 天前
    @unusualcat 要那种单次对话的
    aarontian
        49
    aarontian  
       3 天前
    能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
    goodboy95
        50
    goodboy95  
       3 天前 via Android
    我连用官方的都默认数据全交出去了
    ideard
        51
    ideard  
       3 天前
    还好我是自建,免费的东西代价太大了
    JoshTheLegend
        52
    JoshTheLegend  
       2 天前
    别说中转了,用官方的不都是默认全交的吗...
    unixcs
        53
    unixcs  
       2 天前 via Android
    比起我的数据,我更想省点 token 的钱
    unusualcat
        54
    unusualcat  
       2 天前
    没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
    v2exgo
        55
    v2exgo  
    OP
       2 天前
    @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
    LowBi
        56
    LowBi  
       2 天前
    官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
    MoozLee
        57
    MoozLee  
       2 天前   ❤️ 1
    我的破代码被拿去蒸馏了,我有什么损失吗?
    dabingbing
        58
    dabingbing  
       2 天前
    在乎这个?
    viking602
        59
    viking602  
       2 天前
    @freak118 #4 中转站本身就不是什么正经营生 爱用就用的那种基本上
    beijiaoff
        60
    beijiaoff  
       2 天前
    @rfv2 我觉得从技术上完全可以。就是中转本身就是灰色的……
    luckywuuuuu
        61
    luckywuuuuu  
       2 天前
    @sommio 有的,gpt 网页版可以设置不用于模型训练。但是,这种东西只有大企业说的你还可以信一点。。。
    ps: 其实正常人和公司不怕主流的大模型学习到了,因为激活这个信息的概率太低了,怕就怕别人不拿来训练拿来扒提示词
    toriagpiosk
        62
    toriagpiosk  
       2 天前
    前端时间就发现了,大量灰产组织开始和——AI API 中转站出现交易,其中很多都是公益站

    <img src="https://tc.7zz.cn/i/2026/03/12/35c2a3d28a994684387b7f7b6df35934.png" alt="image" />
    chi1st
        63
    chi1st  
       2 天前
    官方就不用你数据了?你在 V 站的发言也早就被拿去训练了。。。
    nVic
        64
    nVic  
       2 天前
    @chi1st 一般来说你不会选择在 v 站发自己的敏感信息
    zomco
        65
    zomco  
       2 天前
    他不会以为我用中转站是干正经事的吧
    jiangzm
        66
    jiangzm  
       2 天前
    做中转站的真恶心
    streamrx
        67
    streamrx  
       2 天前 via iPhone
    用中转站不就是默认数据 100%会被使用和出售吗
    click04
        68
    click04  
       2 天前
    理论上中转站确实具有很高的超级权限:
    1. 看到所有用户输入的信息
    2. 编码/养虾场景可以在大模型响应中加上额外的任意命令
    相当于把远程操作能力交给了一个没那么可信的组织。
    有很多公益免费的站点不知道他们热衷建站的目的,为了技术平权?
    boboboka
        69
    boboboka  
       2 天前
    不知道是不是公益站会出现,我现在用的几个付费中转,倒是都说不会保存,也不知道是不是真的
    635925926
        70
    635925926  
       2 天前   ❤️ 1
    问题来了,能不能反向污染呢。比如搞一个项目的变量名全是拼音。
    eya46
        71
    eya46  
       2 天前
    官方的也一样,买的豆包 coding plan 明确写着可用于训练😒
    evamayy
        72
    evamayy  
       2 天前
    免费的才是最贵的,你以为你在用便宜的 API ,其实你自己才是产品
    nyfwan123
        73
    nyfwan123  
       2 天前
    我是做中转的 确实有人找我买过 但是我硬盘就 40 个 G 还有自己的数据 且都是老朋友在用 所以拒绝了采购
    v2exgo
        74
    v2exgo  
    OP
       2 天前
    @click04 一些是用爱发电吧
    XiaoBu1
        75
    XiaoBu1  
       1 天前
    只要是中转,中间人一定能看到明文吧
    v2exgo
        76
    v2exgo  
    OP
       1 天前
    @XiaoBu1 是的,所以要把秘钥、跟私钥保存好,不让 agent 去读取,代码倒是没啥问题,很多时候就是碎片,这些人买数据,绝对不是为了训练,训练只是一个幌子而已
    street000
        77
    street000  
       1 天前 via Android
    50 对话 1u ?急需联系这个人
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1687 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 16:18 · PVG 00:18 · LAX 09:18 · JFK 12:18
    ♥ Do have faith in what you're doing.