从 Action 描述到 Command 的小模型 SFT 全流程实战
记录如何将 Qwen3-4B-Instruct 打造成稳定的指令模型,涵盖数据分析、LoRA 训练、推理上线与踩坑复盘,适合有基础的 AI 工程师快速复现。
专注于 MCP、AI Agent、LLM 技术分享
记录如何将 Qwen3-4B-Instruct 打造成稳定的指令模型,涵盖数据分析、LoRA 训练、推理上线与踩坑复盘,适合有基础的 AI 工程师快速复现。
深入探索 Elasticsearch 中 HNSW 算法的核心原理,从 RAG 检索效率瓶颈出发,详解分层导航小世界网络的构建与查询机制。
深入探索 vLLM 推理框架的核心参数配置,包括 max-num-batched-tokens、max-num-seqs、max-model-len 和 gpu-memory-utilization 的原理和调优策略。
记录一次使用AI编程去完整的实现一个Agent实践,从草图到 V1.0,体验 bolt.new + Claude + Copilot 的开发流程。
实战演示如何将通过 Node-RED 创建的 MCP 设备服务成功接入到 Dify 平台。
详细介绍 Node-RED MCP 插件的安装、配置和使用,包含常见问题的解决方案。
从零开始构建 MCP Server,详细介绍 Model Context Protocol 的实现原理和实践方法。
深入分析 MCP 的 SSE+HTTP 传输协议运行机制,从开发 Dify OpenAPI 转 MCP SSE 插件的角度详解实现过程。
详细介绍两种方式将本地工具集成到 Dify 平台:OpenAPI 模式和 MCP SSE 模式,包含完整代码示例和配置步骤。
记录在 Flink 实时数据处理中遇到的 KeyBy 数据倾斜问题,深入分析 Flink KeyGroup 分配机制,并提供了自定义 Key 重平衡的解决方案。
记录一次数据同步中遇到的 FastJSON 序列化 ByteBuffer 导致的 Bug,从问题发现到源码分析,最终找到解决方案的完整过程。
记录一次生产环境中Java服务假死问题的完整排查过程,从发现问题到最终解决,涉及K8S监控、线程堆栈分析、网络超时配置等技术要点。
专注于最新的 AI Agent 和 MCP 技术,提供实用的开发指南和最佳实践。
所有文章都基于实际项目经验,提供可执行的代码示例和详细的实现步骤。
探索各种工具的集成方案,如 Node-RED、Dify 等,构建完整的技术生态。