大数据算法 课程总结笔记 I(期末部分)

这是我在 2026 年春季于中科大学习丁虎老师的《大数据算法》课程时整理的期末考试复习笔记。非常喜欢的好课。只是可惜讲义编写得比较潦草。这里的笔记尽可能指出讲义中各种概念的几何意义与机器学习意义,并尝试找出各种定义、定理的动机。 6 VC 维 VC 维及其几何概念 VC 维和核心集(coreset)是描述模型表达能力的数学工具。 直观来看,VC 维描述的是一个分类器在任意的正负类指定下,能够区分(称为“打散”)的最大数据点数目。如: 在二维平面上,二维直线可以打散(不共线的)3 个点,但不能打散(任何分布下的)4 个点,因此二维直线的 VC 维为 3; X 是二维平面 , 是二维平面里的一个圆,那么 X 是三维平面 , 是三维平面里的一个球,那么 X 是二维平面 , 是二维平面里的一个多边形,那么 ...

June 8, 2026 · 2 min

实分析 课程总结笔记

这是我在 2025 年春季于中科大学习于树澄老师的《实分析》[1] 课程时整理的期末考试复习笔记。课程录像已有同学上传到 Bilibili. 实分析复习笔记 期中部分 Lebesgue 测度的建立 1. 集合论基础:规定一类集合的代数性质,使得简单生成元上的性质可被推广 集合的运算,集合列的极限,点集拓扑 作业 1a.3:上下极限的等价表述 :事件无穷多次发生 :事件从某时刻开始一直在发生 ...

June 10, 2025 · 6 min

ARAP 曲面参数化算法实现笔记

同步一下之前(2024春)写过的文章,这是我当时在 计算机图形学 课上完成的作业报告,作为最难的一次作业,当时写了非常长的报告。 本次作业要求实现 ARAP,ASAP 与 Hybrid 三种非固定边界的曲面参数化算法。我在理解并实现了这些参数化算法的基础上,对 ASAP 做了迭代方法和单一方程组方法的两种实现,并对这些算法做了进一步研究。 这次作业在数学方面的知识对我来说还有许多我个人不太能独立理解的部分。感谢 @suchiwz 助教的耐心解答,让我能够对论文的各种细节做出能让我满意的理解。在本次作业报告中,我也会试着用刚做完 Homework 4 的大一学生也能理解的语言讲解我对这篇论文的理解。 0. 准备工作 本次作业新增了四个模型。它们的共同特点都是有比较好的切割(没有像 Bunny Head 那样过细的瓶颈了),并且都有各自的难点,如下表所示: 模型 特点 Cow 面数较多;网格较复杂,难以避免重叠;切割后仍保留了较多模型本身的几何特征(头部、眼睛、肢体),易于观察展开算法对形状的处理,确认算法的保形效果。 Beetle 高亏格曲面(即存在多条边界的曲面) Isis 有较多“细长”的三角形 Gargoyle 网格顶点数、面数非常多 Beetle 模型打破了 “模型只有一个边界” 的假设,因此我们需要对 Homework4 的边界映射算法做出调整,对每个边界都进行一次遍历,并取长度最长的边界作为映射的边界。相应地,对 Tutte 参数化中用到边界相关的代码进行调整,不再视不为主要边界的点位边界。这样,Tutte 参数化的结果就能够较好地处理 Beetle 模型,并将其作为 ARAP 的 Initial Guess 了。下图是 Floater 参数化处理后的 Beetle 模型。 ...

May 20, 2024 · 3 min