大数据算法 课程总结笔记 I(期末部分)

这是我在 2026 年春季于中科大学习丁虎老师的《大数据算法》课程时整理的期末考试复习笔记。非常喜欢的好课。只是可惜讲义编写得比较潦草。这里的笔记尽可能指出讲义中各种概念的几何意义与机器学习意义,并尝试找出各种定义、定理的动机。 6 VC 维 VC 维及其几何概念 VC 维和核心集(coreset)是描述模型表达能力的数学工具。 直观来看,VC 维描述的是一个分类器在任意的正负类指定下,能够区分(称为“打散”)的最大数据点数目。如: 在二维平面上,二维直线可以打散(不共线的)3 个点,但不能打散(任何分布下的)4 个点,因此二维直线的 VC 维为 3; X 是二维平面 , 是二维平面里的一个圆,那么 X 是三维平面 , 是三维平面里的一个球,那么 X 是二维平面 , 是二维平面里的一个多边形,那么 ...

June 8, 2026 · 2 min