CS336 Lecture 01 - 课程介绍

Stanford CS336: Language Models From Scratch（2026 春季）第一讲，介绍课程背景、目标与语言模型的基础概念。

交互式执行过程

下面的内容是可以逐步交互浏览的——你可以使用键盘方向键或点击控制面板来逐步查看代码的执行过程：

CS336 是斯坦福大学的「Language Models From Scratch」课程，旨在从零开始构建和理解语言模型。本课程采用 "from scratch" 的教学理念，让学生深入理解语言模型的底层原理，而非仅仅停留在 API 调用层面。

语言模型是一种能够理解和生成人类文本的统计模型。它通过计算给定上下文中下一个词的概率分布，来实现对语言的理解和生成。

在现代 AI 研究中，越来越多地依赖 API 和高层抽象虽然提高了开发效率，但也带来了一些问题：

本课程将涵盖以下核心主题：