我这里整理了很多文言文的资料,如果用本地知识库的话,直接把文言文导进去,但是搜索输出用现代文,是不是效果不太好?
这种情况是应该先翻译之后再导进去,还是说有什么针对文言文的嵌入模型?
这里完全不懂,真诚求教
这种情况是应该先翻译之后再导进去,还是说有什么针对文言文的嵌入模型?
这里完全不懂,真诚求教
1
nomagick Feb 23, 2025
不可能好,文言文的语料一共才多少你想想
统称文言文,实际诗词曲赋体裁众多,从古到今几千年用法不一,使用场景不同语气用词各不相同,再加上誊抄时错误百出 真要想做好,要先把大量语料从白话文翻译回文言文,用生成数据训练, 但翻译要怎么翻译,本质上就是重新定义文言文的过程 |
2
TimePPT PRO 没明白你啥需求,文言文翻译?
|
3
grimpil OP @TimePPT 就是想把这些文言文的资料作为本地知识库,基于里面的内容用 AI 进行文本生成,创作新的内容。实际使用起来效果不好,感觉可能是搜索知识库的时候存在匹配问题
|