开场介绍
活动由微软 MVP 成员顾钧先生主持开场环节。“数据与AI新技术论坛”作为上海开源信息技术协会打造的垂直领域交流平台,聚焦基础软件、数据智能、智能制造等核心技术议题,为软件开发人员、开源技术爱好者及企业技术决策者构建深度对话空间。
上半场分享
Infiniflow 联合创始人张颖峰以“2025 年 RAG 技术展望”开启首场主题演讲。通过“Naive RAG +RLM=REASONING?”的设问切入,系统构建技术演进框架:从“Question-Search-Read-Reason-Answer”推理链出发,深度解析 Agentic Reasoning 体系的技术内核与迭代终止机制;在记忆架构层面,创新性划分 Memory 与 Context 的存储层级,探讨多模态记忆实现路径;最终基于 ViDoRe Benchmark 与 Col-xx 模型验证,提出 RAG 技术的三大演进方向。
CloudPilot AI 高级工程师周仁天(Karpenter 核心贡献者)分享“大模型弹性扩缩容”工业级解决方案。针对 LLM 部署中资源利用率低、冷启动慢等痛点,通过 Kserve 架构的弹性调度算法优化,实现 GPU 资源动态分配效率提升。其技术方案具备四大特性:高确定的资源弹性,集群高资源利用率,极致成本优化,配置简化。
Velox 核心贡献者段蒙带来了“Velox 在 Data For AI 场景的探索”为议题的分享。段先生以 Velox Overview、Velox for Big Data、Velox for AI 的顺序带领各位听众嘉宾步步推进,深入探索 Velox 这一高性能查询引擎库内部运行逻辑(plan fragment 转化为 pipeline),数据库运行流程图,与在以生成式推荐场景为主的训练数据预处理场景的运用。
下半场分享
Apache IoTDB PMC 成员田原带来了时序数据库与 AI 融合创新实践。基于工业设备"数字心电图"的生动类比,剖析 AI 技术对时序数据处理与分析的重要意义,并现场演示 IoTDB AINode 模块的相关功能。
飞致云副总经理朱飞鸽女士强调 RAG 作为大语言模型的“外挂”,以“索引,检索和生成”的逻辑链提高语言模型在特定任务上的性能和准确性,并给出了 RAG 检索增强生成原理解析;从而引出呈现逐步优化递进的开源三件套工具介绍,阐明 MaxKB 的四大核心优势;最后模拟两个具体应用场景进行实操演示,增强观众体验感。
现场讨论环节
在最后的开放研讨环节,参会者就相关议题展开了深度交流。
-----
“数据与 AI 新技术论坛”系列活动聚焦三大维度:技术底层架构解析(如分布式训练框架、AI 编译器优化)、前沿应用场景实践(智能决策系统、生成式 AI 工程化)、开发效能提升方案(MLOps 全流程、低代码 AI 工具链),欢迎大家后续多多参与。
----
视频回放 (点击查看回放)
----
感谢协办方模速空间、EMQ、EPIC、PROPELLER
合作社区微软MVP、创业磨坊
欢迎更多社区联合共建!
----
文|顾钧、刘亦凡
排版|王欣瑜、回丽微
摄影|回丽微、摄像|蒋艾雯
直播|麦鸽企业直播、陆炎(直播间互动)
签到|傅悦晨、活动反馈问卷|曹素妍
活动组织|顾钧、Ming AI、XINYI
整体物料设计|XINYI