协会地址:上海市长宁区古北路620号图书馆楼309-313室
Milvus—— 全球首个专注海量向量数据处理的开源数据库,赋能非结构化数据高效检索
“上海开源创新菁英奖” 的设立,旨在发掘和表彰开源领域的突破性成果,激励更多开发者与机构投身开源技术创新,推动开源生态的繁荣与发展。
本次巡礼的获奖项目 ——Milvus,作为全球首个专注于处理海量向量数据的开源数据库,在开源领域占据举足轻重的地位。截至 2025 年 6 月,其 GitHub 星标数量已突破 3.5 万,稳居产品级向量数据库项目首位,被全球广泛部署,为生成式 AI、语义理解等领域提供了强大的技术支撑,影响力深远。
项目目标
Milvus 致力于解决图像、文本、音频、视频等非结构化数据的高效检索问题,针对海量向量数据处理场景进行深度优化,目标是为企业和开发者提供一个高性能、分布式、云原生的向量数据库解决方案,以满足生成式 AI、语义理解等任务中对非结构化数据快速检索与分析的需求,推动相关技术的普及与应用。
项目核心内容
Milvus 是全球首个专注于处理海量向量数据的开源数据库,专为非结构化数据的高效检索场景设计,具备高性能、分布式、云原生等特性。其核心内容包括对图像、文本、音频、视频等非结构化数据的向量处理与检索支持,可应用于生成式 AI、语义理解等多种任务。最新稳定版本 Milvus 2.6 在性能和功能上实现了多项突破,如内存减少 72%、搜索速度比 Elasticsearch 快 4 倍,并引入 RaBitQ 1bit 向量量化、JSON Path Index、Decay Function、Streaming Service 等新能力,同时通过冷热数据分层实现用户资源使用减半。
项目网站:https://milvus.io
项目源码:https://github.com/milvus-io/milvus
技术创新
1. 性能与效率的显著提升:Milvus 2.6 版本实现了内存减少 72%,搜索速度比 Elasticsearch 快 4 倍,大幅提升了数据处理与检索的效率。例如,大模型玩家 minimax 使用基于 Milvus 的 Zilliz cloud 的 MinHash + LSH 功能,完成大模型预训练数据的高质量去重,处理速度提升超过 2 倍,成本降低 3–5 倍,充分体现了其在性能和成本控制上的优势。
2. 全新技术能力的引入:引入 RaBitQ 1bit 向量量化技术,在保证检索精度的前提下进一步提升效率;JSON Path Index 功能增强了对 JSON 数据类型的处理与检索能力;Decay Function 为数据检索提供了更灵活的权重调整方式;Streaming Service 则优化了流式数据的处理能力,这些创新技术拓展了 Milvus 的应用场景和处理能力。
3. 成本优化的技术方案:通过冷热数据分层技术,Milvus 2.6 实现用户资源使用减半,显著降低了用户的成本。如博世 BOSCH 与 Milvus 合作,在智能驾驶领域实现数据挖掘革新,降低数据采集成本 80%,节约千万元数据存储成本,充分体现了该技术在成本控制上的显著效果。
4. 海量数据的高效检索能力:Milvus 能够实现毫秒级检索数十亿数据,博世 BOSCH 借助其这一能力,在智能驾驶领域高效处理海量数据,推动了数据挖掘的革新;联想将 Milvus 用于物料管理以及新员工辅助决策、项目复盘,最终实现周转率提升 10%,复盘效率提升 20%,展现了其在不同场景下处理海量数据的高效性。
结语
Milvus不仅填补了全球专注海量向量数据处理的开源数据库空白,为非结构化数据的高效检索提供了强有力的解决方案,还通过持续的技术创新,在性能、效率、成本控制等方面不断突破,已在智能驾驶、大模型训练、企业管理等多个领域得到成功应用,为相关行业的发展注入了强大动力。
“上海开源创新菁英奖” 将继续秉持支持开源创新的决心,鼓励更多像 Milvus 这样的优秀开源项目涌现,助力开源技术不断进步,为科技发展和产业升级提供坚实的支撑。
声明:
- 本栏目展示的信息、观点及数据等内容均由奖项报名人直接提供。
- 本栏目旨在为优秀的开源项目及其贡献者提供一个展示平台,旨在增进公众对开源生态的了解,促进行业内的知识分享与经验交流,所有信息均不构成任何投资建议。
- 您如对展示内容的准确性、真实性或其他方面存有异议或疑问,欢迎通过以下邮件地址与我们联系反馈:shopen_awards@shanghaiopen.org.cn







