V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
multiarrow
V2EX  ›  分享创造

[开源]使用自然语言进行文件搜索的工具

  •  
  •   multiarrow · 2 天前 · 639 次点击

    网上好像没这类软件,所以我写了一个

    主要功能

    使用自然语言针对文件内容搜索

    适用场景

    • 文件很多
    • 文档、图片、音频混合搜索

    地址

    https://github.com/moyangzhan/mango-desk

    image

    8 条回复    2026-01-22 14:50:10 +08:00
    yeqizhang
        1
    yeqizhang  
       2 天前 via Android
    能使用本地的模型那就好了,我看我手机上的相册也支持搜索内容,应该用了本地模型
    multiarrow
        2
    multiarrow  
    OP
       2 天前
    默认情况下都是在本地运行,不依赖网络。

    不过如果要语义搜索图片跟音频的话,需要用到远程模型,这个要启用并配置 key ,目前这一块默认是关闭的。
    chennqqi
        3
    chennqqi  
       2 天前
    感觉随便整个本地小模型生成 Everything 语句?
    multiarrow
        4
    multiarrow  
    OP
       2 天前
    @chennqqi 也不是不行。。。不过只适合至少懂点技术的
    yeqizhang
        5
    yeqizhang  
       2 天前 via Android
    @multiarrow 是有本地分析图片内容构建索引吗?远程模型只是转一下命令内容?
    multiarrow
        6
    multiarrow  
    OP
       1 天前
    @yeqizhang 远程模型是用来识别图片和音频内容的,构建索引是在本地进行的
    chpw98hv
        7
    chpw98hv  
       1 天前
    我做了一个类似的软件 https://github.com/diqbpow3c/LocalSearch 。支持混合检索( BM25 关键词检索和基于 embedding 的语义检索同时进行)。软件支持 CPU 和 GPU 运行,Windows, Linux, MacOS 都能用
    multiarrow
        8
    multiarrow  
    OP
       1 天前
    @chpw98hv 确实是类似软件,话说你不考虑加个中文说明嘛
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1021 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 23:23 · PVG 07:23 · LAX 15:23 · JFK 18:23
    ♥ Do have faith in what you're doing.