WithoutSugarMiao 最近的时间轴更新
WithoutSugarMiao

WithoutSugarMiao

V2EX 第 637956 号会员,加入于 2023-07-11 10:54:39 +08:00
今日活跃度排名 3687
寻个队友一起体验一下这个游戏
游戏  •  WithoutSugarMiao  •  10 天前  •  最后回复来自 YFZZ
4
[年度游戏投票] 今年的年度游戏是 33 吗?
游戏  •  WithoutSugarMiao  •  2025 年 11 月 26 日  •  最后回复来自 zhuyihapi
39
现在的主流读书 APP 为什么不提供上下滑动翻页?
程序员  •  WithoutSugarMiao  •  2025 年 11 月 11 日  •  最后回复来自 emiyamuto
9
WithoutSugarMiao 最近回复了
5 小时 46 分钟前
回复了 milkleeeeee 创建的主题 问与答 有没有什么办法能测出来模型的真假?
没有,我是高强度用 AI 的。对于这种问题,个人的感觉是“怕就别用,用就别怕”。
16 小时 53 分钟前
回复了 ruicky 创建的主题 问与答 如果有个工具可以自动写公众号文章,会有人用吗?
openclaw 就能做这个事情,而且完全自主独立生成。我测试我的龙虾第一个功能就是用生成公众号文章测的,不过意义不大,我之后也不会用 AI 文章污染我的公众号。
2 天前
回复了 PhpBB 创建的主题 怀旧游戏 美国麻将 居然有 强制旁观 的规则 ?
这是不让手把一吧。中国麻将应该也有这种规则
3 天前
回复了 PeanutMi 创建的主题 职场话题 年后第一次逛 v2ex,天塌了
今天刚入职新公司第一天就新公司给我的感觉还不错
5 天前
回复了 Haoxueren 创建的主题 职场话题 入职手续办理一半,还是决定跑路了
@duuu 不是国家规定,是行业潜规则。一般来说就算八折,也是前三个月,转正还要看绩效,基本可以认为是想白嫖劳动力了,很难给你转正。估计用完就解约了。楼主走的没毛病。(不过这么重要的事情,入职前没先沟通吗?
@Bssn 不好说 看你要求。你如果想去大厂,我觉得可能得去外包。中小厂 完全靠缘分。把我另一个别人贴子的回复中的那两个课学习一下,实验作业做一下,我觉得找个岗位还是没问题的。
@dawnzhu #31 很正常 因为 AI 的能力太强,如果是小规模应用,完全没有微调的必要,就像 @123zouwen 回复的一样,如果你想在自己的公司使用,那么你懂公司的业务,用通过的 LLM ,用现成的 MCP 、skill ,完全 cover 的住。

但是这个东西的复杂度曲线 就像传统项目一样,你在公司用 你不用考虑 QPS 上来了怎么办,并发度高怎么办,分布式同步怎么办。因为公司就那些人。但是你要想做个企业级项目,比如豆包,比如千问, 那要考虑的东西就多太多了。微调只是最基础的部分。

还有一点就是,可能很多人觉得微调很难,又要理解模型,又得调整参数。实际上现在微调的门槛很低,LLM 发展这几年,早就有傻瓜式微调框架了。甚至一行代码不用写,你都能调出来一个差不多的模型。
@dawnzhu 一定会,我建议你看看 我在帖子里写的项目,阿里云的那个课程或者 hello-agents 。几乎所有的 agent 课程里必然会设计到微调,涉及到大模型的理解。
@yungyu 你说的完全风马牛不相及,你也没点进去我在回复中提到的课程,李宏毅的课 [第八讲:通用模型的终身学习] 你可以先看下。一句话总结,我部署了微调后的小模型进行专门的用户关注点预测,作为一个 function call 来给大模型使用。

我从 1 月份到现在 面试了十多家,拿了三个 offer ,你说的这些框架在面试中完全无人在意,或者说根本不会在意这些框架本身(但是现在大部分的商业级 agent 构建,确实有借鉴最初 langchain 的几大组件)。比如最开始 langchain 最火,你用了,然后 langgraph 又火了,你换不换,autogen 又火了继续换吗?现在 claude / openai 的 SDK 最火 又接着换?那如果后续还有其他框架比这俩 SDK 还火,怎么办呢?

agent 开发的门槛,并不在你说的框架熟练度和前面那个哥们说的 业务适配什么的。给你分享点我常遇到的问题。

你能讲讲 transformer 架构吗? gpt 和 transformer 有啥区别啊?为什么 temperature 会影响输出?
RAG 方面,你怎么做的分块?为什么考虑使用这种分块方式?如何优化召回率?使用 rerank 了吗?能说几个比较有新意的 rerank 方法吗?向量数据库怎么选啊?为啥用 milvus ?稀疏向量和稠密向量啥区别啊? RAG 和微调啥区别啊?你数据集怎么弄的啊?你微调的关键参数都有啥啊?你如何评估微调效果呢? agent 有什么构建模式吗?输出 token 超出了模型限制怎么办呢?

好多好多问题呀,我的感觉是基本围绕着四个方向,基础、RAG 、微调、Agent ,一次正经的面试中,这几个方向是一定一定都会被问到的。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   967 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 19:31 · PVG 03:31 · LAX 12:31 · JFK 15:31
♥ Do have faith in what you're doing.