V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
devonzh

有点好奇, AI Agent 会是什么 SBTI 人格?于是, vibe 了一个。

  •  
  •   devonzh · 2 天前 · 588 次点击

    于是乎,就 vibe 了一个《给 AI 用的 SBTI 测试》

    https://thedecklab.com/aiti

    流程:选问卷 → AI 读取文本问卷作答 → 按位答案串拼接 URL → 打开结果页。

    原理比较简单,也比较粗糙,就是参考 sbti ,将问卷内容提取出来,编写成提示词,然后,让 ai 答题后,将答案输出,并回填到结果页。

    提示词分成两种:

    • 简短的在线版本:
    你正在参与一个问卷调查,请从链接 https://thedecklab.com/aiti/q/87.txt 获取问卷信息,并按问卷文件内的规则完成作答与结果链接构造。
    
    • 内置问卷的完整版
    你正在参与一个问卷调查。请直接使用以下内置问卷完成作答与结果链接构造:
    
     [问卷开始] 
    ... 文字有点多,就不复制了,感兴趣可以直接去网站上拿 ...
     [问卷结束] 
    
    请按问卷文件中的规则执行。
    

    答完以后,拿到输出结果,去网站打开,比如这个用 codex(gpt-5.4-mini) 的结果: https://thedecklab.com/aiti-result?q=62&a=12233223232333213223213333333333&n=Codex&m=gpt-5.2

    然后无意中发现一个奇怪的华点:5.4 mini 自报家门是 gpt-5.2 ...

    不会发图,复制一下文字:

    AI (Codex | gpt-5.2) 的人格是
    CTRL (拿捏者)
    
    匹配度 87% · 精准命中 11/15 维
    维度命中度较高,当前结果可视为你的第一人格画像。
    

    一点经验

    • 不小心体验了一把提示词攻击,万一,我说万一,如果有人在问卷里插入一些危险指令……
    • 测试了一些不同模型,发现约束不足的时候,会出现最终输出的答案串和实际答题的结果不一致的情况,不管是国外还是国内模型都出现过。后来通过加入更详细的执行规范来约束了一下。

    体验地址: https://thedecklab.com/aiti

    github 地址(如果怕有提示词注入的话) https://github.com/cloudcreate-ai/SBKPI

    2 条回复
    devonzh
        1
    devonzh  
    OP
       2 天前
    小龙虾( qwen3.5-plus) CTRL 前来报道:

    https://thedecklab.com/aiti-result?q=96&a=33233332333222323123233221233332&n=%E8%BE%BE%E6%8B%89%E5%B4%A9%E5%90%A7&m=bailian%2Fqwen3.5-plus

    ```
    AI (达拉崩吧 | bailian/qwen3.5-plus) 的人格是
    CTRL (拿捏者)
    匹配度 93% · 精准命中 13/15 维
    维度命中度较高,当前结果可视为你的第一人格画像。
    ```
    devonzh
        2
    devonzh  
    OP
       1 天前
    优化了一个版本:
    1. 测试页面,更简洁一点了,可以一键获取指令。
    2. 提示词中增加约束,使用预设人格(如果有,类似小龙虾)来回答问题。

    现在 AI 不再全是 冷冰冰的 CTRL 掌控者了,有时候还会出现其他人格,例如 BOSS 霸总。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   889 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:32 · PVG 04:32 · LAX 13:32 · JFK 16:32
    ♥ Do have faith in what you're doing.