Large Language Models

AI大模型
技术架构

深入解析大模型训练、推理优化、RAG系统、Agent架构与向量数据库的核心技术原理与工程实践。

Articles

技术专题

🧠

LLM 训练系统

深度解析大语言模型预训练、SFT、RLHF的核心算法与分布式训练架构,涵盖数据 pipeline、梯度压缩、混合精度等关键技术。

预训练 SFT RLHF

LLM 推理优化

从 KV Cache 到 PagedAttention,从 Tensor Parallel 到 Continuous Batching,全面解析大模型推理性能优化的核心技术与工程实践。

vLLM 量化 TensorRT
📚

RAG 检索增强

深入探讨 RAG 系统的核心组件:文档分块、嵌入模型、向量检索、重排序与混合检索策略,构建高效精准的检索增强生成系统。

向量检索 混合检索 重排序
🤖

Agent 智能体

从单Agent到多Agent系统,深度解析规划、记忆、工具调用与协作机制,探索自主Agent在复杂任务中的架构设计与实现。

ReAct 工具调用 多Agent
🔢

向量数据库

全面对比 FAISS、Pinecone、Milvus、Qdrant 等主流向量数据库的核心算法、索引结构与适用场景,选型与优化指南。

HNSW ANN 索引
🧩

MoE 混合专家架构

解析 Mixtral / DeepSeek-MoE 的稀疏门控机制、Expert 并行、Top-K 路由策略,以及 MoE 在训练稳定性与推理效率上的工程权衡。

MoE 稀疏计算 Expert Parallel
🔒

LLM 安全对齐

深度解析 RLHF、DPO 与 Constitutional AI 的对齐技术演进,从 ChatGPT 到 Claude 的工程实践与优缺点对比。

RLHF DPO Constitutional AI
📜

长上下文窗口

解析 LLM 上下文扩展技术:RoPE 位置编码、YaRN / LongRoPE 插值、NTK-aware Scaling 与 StreamingLLM 状态缓存,突破 100K+ token 上下文瓶颈。

RoPE 上下文扩展 StreamingLLM
👁️

多模态 AI 系统

从 CLIP 到 GPT-4V、从 LLaVA 到 Gemini,深度解析视觉编码、跨模态对齐、音频理解与端到端多模态生成的核心架构与训练策略。

CLIP 视觉编码 LLaVA
📊

LLM 评测体系

全面解析 MMLU、GSM8K、HumanEval、BIG-bench 等主流评测基准的设计原理、覆盖缺陷与下一代评测趋势,建立可信的模型能力评估框架。

MMLU 评测基准 Big-Bench
🔬

模型蒸馏与压缩

从知识蒸馏(KD)到量化感知训练(QAT),从剪枝到结构化稀疏,全面解析中小型模型研发中的模型压缩关键技术路线。

量化 剪枝 知识蒸馏
✏️

Prompt 工程实践

系统梳理 Chain-of-Thought、Tree-of-Thought、ReAct、Reflexion 等高级 Prompt 技术,构建可复用的 Prompt 设计与优化方法论,提升 LLM 推理可靠性。

CoT ToT ReAct