LLM 技术

大语言模型技术的深度探索与实践

技术分享

从 RAG 检索效率瓶颈,到 HNSW 算法的深度解密

深入探索 Elasticsearch 中 HNSW 算法的核心原理,从 RAG 检索效率瓶颈出发,详解分层导航小世界网络的构建与查询机制。

从 Action 描述到 Command 的小模型 SFT 全流程实战

记录如何将 Qwen3-4B-Instruct 打造成稳定的指令模型,涵盖数据分析、LoRA 训练、推理上线与踩坑复盘,适合有基础的 AI 工程师快速复现。

关于 LLM

🧠

大语言模型

深入探索 LLM 的部署、优化和推理技术,包括 vLLM、Transformers 等框架的使用心得。

性能优化

从显存管理到并发处理,分享大模型部署和推理过程中的性能调优经验和最佳实践。

🚀

应用实践

记录 LLM 在实际项目中的应用经验,包括模型选择、部署方案和效果评估等实战分享。