Xunberg's Tech Blog

专注于 MCP、AI Agent、LLM 技术分享

开始阅读最新文章

最新文章

LLM 2025-10-09

从 Action 描述到 Command 的小模型 SFT 全流程实战

记录如何将 Qwen3-4B-Instruct 打造成稳定的指令模型，涵盖数据分析、LoRA 训练、推理上线与踩坑复盘，适合有基础的 AI 工程师快速复现。

SFT Qwen3-4B-Instruct LoRA 指令模型 Hugging Face PyTorch Agent

LLM 2025-09-20

从 RAG 检索效率瓶颈，到 HNSW 算法的深度解密

深入探索 Elasticsearch 中 HNSW 算法的核心原理，从 RAG 检索效率瓶颈出发，详解分层导航小世界网络的构建与查询机制。

HNSW Elasticsearch 向量检索 RAG

LLM 2025-07-22

驾驭 vLLM 大模型推理：一次关于并发、长度与显存的探索之旅

深入探索 vLLM 推理框架的核心参数配置，包括 max-num-batched-tokens、max-num-seqs、max-model-len 和 gpu-memory-utilization 的原理和调优策略。

vLLM 大语言模型推理优化显存管理

AI编程 2025-07-06

Agent实战：用 Vibe Coding 方式开发移液枪自动化调参系统

记录一次使用AI编程去完整的实现一个Agent实践，从草图到 V1.0，体验 bolt.new + Claude + Copilot 的开发流程。

AI编程 Agent 自动化

AI Agent 2025-07-09

AI Agent 实战：Node-RED MCP 服务接入 Dify

实战演示如何将通过 Node-RED 创建的 MCP 设备服务成功接入到 Dify 平台。

Dify Node-RED 集成

实战指南 2025-07-08

Node-RED MCP 插件实践指南

详细介绍 Node-RED MCP 插件的安装、配置和使用，包含常见问题的解决方案。

Node-RED 插件实践

MCP 教程 2025-05-08

从0-1实现一个满足 MCP 协议的 Server

从零开始构建 MCP Server，详细介绍 Model Context Protocol 的实现原理和实践方法。

Python FastAPI MCP

技术深度 2025-04-28

深度解析 MCP SSE+HTTP 传输协议：从理论到实践

深入分析 MCP 的 SSE+HTTP 传输协议运行机制，从开发 Dify OpenAPI 转 MCP SSE 插件的角度详解实现过程。

MCP SSE HTTP 深度解析

集成指南 2025-04-10

Dify 本地工具与 MCP 集成完整指南

详细介绍两种方式将本地工具集成到 Dify 平台：OpenAPI 模式和 MCP SSE 模式，包含完整代码示例和配置步骤。

Dify MCP 本地工具集成

技术深度 2023-07-11

Flink KeyBy 数据倾斜问题深度解析与优化实践

记录在 Flink 实时数据处理中遇到的 KeyBy 数据倾斜问题，深入分析 Flink KeyGroup 分配机制，并提供了自定义 Key 重平衡的解决方案。

Flink 数据倾斜实时计算

Bug修复 2024-08-17

FastJSON ByteBuffer 序列化Bug深度解析与修复

记录一次数据同步中遇到的 FastJSON 序列化 ByteBuffer 导致的 Bug，从问题发现到源码分析，最终找到解决方案的完整过程。

FastJSON ByteBuffer Bug修复

故障排查 2022-03-05

Java服务假死问题排查实战：从线程堆栈到超时配置

记录一次生产环境中Java服务假死问题的完整排查过程，从发现问题到最终解决，涉及K8S监控、线程堆栈分析、网络超时配置等技术要点。

Java 故障排查 K8S

关于项目

🚀

技术前沿

专注于最新的 AI Agent 和 MCP 技术，提供实用的开发指南和最佳实践。

💡

实战导向

所有文章都基于实际项目经验，提供可执行的代码示例和详细的实现步骤。

🔧

工具整合

探索各种工具的集成方案，如 Node-RED、Dify 等，构建完整的技术生态。