THREE-MONTH REPORT

实习十二周工作内容总结

刘晓枫

2025年6月 - 2025年8月

汇报目录

1. 十二周工作历程总览

2. 核心成果一:双轨并行的 Agentic Workflow 构建

3. 核心成果二:一体化知识库体系建设

4. 核心成果三:MCP服务与工具链

5. 核心成果四:Dify应用

1. 十二周工作历程总览

第1-4周:探索与原型

熟悉业务,启动向量知识库探索。基于LangGraph构建了“代码理解与注释”工作流的雏形,实现核心功能并完成初步的MCP工具封装。

第5-8周:并行与演进

工作分化为两条主线:启动全新的 **ReAct Agent** 构建并迅速封装;“代码助手”工作流的知识库从本地全面升级并接入RAGFlow。

第9-12周:深化与落地

两条主线均完成关键迭代:1. **“代码助手”工作流** 升级为自省式RAG,并进行系统化测试。 2. **ReAct Agent** 成功接入Nacos MCP Router并部署,增加黑名单机制,正式应用于Dify工作流。

2. 核心成果一:双轨并行的 Agentic Workflow 构建

工作流 A: 算法代码助手

目标:结合业务知识,提供深度代码分析与优化建议

  • 核心功能: 自动化代码理解、生成注释、代码溯源、结合业务背景生成代码优化报告。
  • 技术演进:
    • 知识库后端: 本地 Chroma/Faiss -> RAGFlow。
    • RAG架构: 基础RAG -> 自省式RAG (Self-Reflective RAG),实现多轮检索与信息评估筛选,提升复杂问题理解能力。
  • 最终状态: 封装为可独立调用的MCP工具,为Dify应用提供核心代码分析能力。

工作流 B: 通用ReAct Agent

目标:构建能自主调用MCP工具解决复杂问题的智能体

  • 核心架构: 基于ReAct模式(推理->行动->观察),实现自主决策循环。
  • 技术演进:
    • 服务接口: Flask -> FastAPI -> MCP工具,提升性能。
    • 工具调用: 本地调用 -> Nacos MCP Router,实现对线上所有MCP工具的调用。
    • 稳定性: 增加黑名单机制,避免Agent陷入自我调用的死循环。
  • 最终状态: 成功部署至开发机,作为核心组件应用于“算法问题排查”等Dify工作流。

3. 核心成果二:一体化知识库体系建设

从本地探索到接入企业级RAG平台,为不同AI应用提供精准、高质量的数据支持

本地化探索 (v1.0)

使用 ChromaDBFaiss 攻克代码分块策略,保证了代码块语义完整性,为后续工作奠定基础。

云端化升级 (v2.0)

全面转向 RAGFlow 平台,构建了服务于代码助手、历史问答等多个专用知识库,实现统一管理。

自动化与质量控制

开发MCP工具实现知识自动沉淀,并增加QA质量判断机制,避免知识库被低质内容污染。

4. 核心成果三:MCP服务与工具链

为Agent提供强大的“双手”,实现与企业内部系统的高效交互

核心MCP工具封装

  • Agent即工具:将“算法代码助手”和“ReAct Agent”两个LangGraph工作流封装为高阶MCP工具,实现复杂能力的原子化调用。
  • 知识库管理工具:开发支持RAGFlow文档增、改、查的系列工具,打通知识沉淀闭环。
  • 基础设施工具:开发Git仓库查询等工具,为Agent提供更广泛的信息获取能力。

服务架构演进

  • 服务发现:与同事协作完成MCP服务拆分,并全面切换至Nacos作为注册中心。
  • 服务部署:将自研的MCP工具及服务成功部署至开发机,完成线上验证。
  • 经验输出:MCP工具封装等内容总结至语雀,为团队提供可复用、可参考的经验。

5. 核心成果四:Dify应用

将Agent能力落地为实际应用,解决具体业务问题

应用一:代码业务分析助手

基于“算法代码助手”工作流(工作流A)构建的应用。

实现流程:

  1. Dify接收用户问题(代码+业务)。
  2. 调用已封装的“代码助手”MCP工具。
  3. 工具内部执行自省式RAG,工具调用,形成报告等。
  4. Dify代码节点提取JSON报告中的核心内容。
  5. 格式化输出,生成最终的优化建议。

应用二:算法问题排查工作流

(由豪佶主导)深度集成“ReAct Agent”工作流(工作流B)的应用。

实现流程:

  1. Dify接收问题,解析参数。
  2. RAG检索初步信息。
  3. 调用日志提取等基础工具。
  4. 调用“ReAct Agent”MCP工具执行复杂任务。
  5. 将高质量QA上传至RAGFlow。
  6. 整合信息,输出最终排查结论。

谢谢!

期待您的批评指正