Large Language Models

AI大模型
技术架构

深入解析大模型训练、推理优化、RAG系统、Agent架构与向量数据库的核心技术原理与工程实践。

Articles

技术专题

🧠

LLM 训练系统

深度解析大语言模型预训练、SFT、RLHF的核心算法与分布式训练架构，涵盖数据 pipeline、梯度压缩、混合精度等关键技术。

预训练 SFT RLHF

⚡

LLM 推理优化

从 KV Cache 到 PagedAttention，从 Tensor Parallel 到 Continuous Batching，全面解析大模型推理性能优化的核心技术与工程实践。

vLLM 量化 TensorRT

📚

RAG 检索增强

深入探讨 RAG 系统的核心组件：文档分块、嵌入模型、向量检索、重排序与混合检索策略，构建高效精准的检索增强生成系统。

向量检索混合检索重排序

🤖

Agent 智能体

从单Agent到多Agent系统，深度解析规划、记忆、工具调用与协作机制，探索自主Agent在复杂任务中的架构设计与实现。

ReAct 工具调用多Agent

🔢

向量数据库

全面对比 FAISS、Pinecone、Milvus、Qdrant 等主流向量数据库的核心算法、索引结构与适用场景，选型与优化指南。

HNSW ANN 索引

🧩

MoE 混合专家架构

解析 Mixtral / DeepSeek-MoE 的稀疏门控机制、Expert 并行、Top-K 路由策略，以及 MoE 在训练稳定性与推理效率上的工程权衡。

MoE 稀疏计算 Expert Parallel

🔒

LLM 安全对齐

深度解析 RLHF、DPO 与 Constitutional AI 的对齐技术演进，从 ChatGPT 到 Claude 的工程实践与优缺点对比。

RLHF DPO Constitutional AI

📜

长上下文窗口

解析 LLM 上下文扩展技术：RoPE 位置编码、YaRN / LongRoPE 插值、NTK-aware Scaling 与 StreamingLLM 状态缓存，突破 100K+ token 上下文瓶颈。

RoPE 上下文扩展 StreamingLLM

👁️

多模态 AI 系统

从 CLIP 到 GPT-4V、从 LLaVA 到 Gemini，深度解析视觉编码、跨模态对齐、音频理解与端到端多模态生成的核心架构与训练策略。

CLIP 视觉编码 LLaVA

📊

LLM 评测体系

全面解析 MMLU、GSM8K、HumanEval、BIG-bench 等主流评测基准的设计原理、覆盖缺陷与下一代评测趋势，建立可信的模型能力评估框架。

MMLU 评测基准 Big-Bench

🔬

模型蒸馏与压缩

从知识蒸馏（KD）到量化感知训练（QAT），从剪枝到结构化稀疏，全面解析中小型模型研发中的模型压缩关键技术路线。

量化剪枝知识蒸馏

✏️

Prompt 工程实践

系统梳理 Chain-of-Thought、Tree-of-Thought、ReAct、Reflexion 等高级 Prompt 技术，构建可复用的 Prompt 设计与优化方法论，提升 LLM 推理可靠性。

CoT ToT ReAct

共 12 篇 · 第 1 / 2 页

AI大模型技术架构