欢迎来到雨伞咖啡店!☕☂️

Tech & Art & Kawaii blog, by @rubatotree

大数据算法 课程总结笔记 I(期末部分)

这是我在 2026 年春季于中科大学习丁虎老师的《大数据算法》课程时整理的期末考试复习笔记。非常喜欢的好课。只是可惜讲义编写得比较潦草。这里的笔记尽可能指出讲义中各种概念的几何意义与机器学习意义,并尝试找出各种定义、定理的动机。 6 VC 维 VC 维及其几何概念 VC 维和核心集(coreset)是描述模型表达能力的数学工具。 直观来看,VC 维描述的是一个分类器在任意的正负类指定下,能够区分(称为“打散”)的最大数据点数目。如: 在二维平面上,二维直线可以打散(不共线的)3 个点,但不能打散(任何分布下的)4 个点,因此二维直线的 VC 维为 3; X 是二维平面 , 是二维平面里的一个圆,那么 X 是三维平面 , 是三维平面里的一个球,那么 X 是二维平面 , 是二维平面里的一个多边形,那么 ...

June 8, 2026 · 2 min

图形已死,all in AI具身 II: 机器人会梦到怎样的现实呢

图 1 玩音乐的最终归宿是转行具身智能。[1] TODO Table of Contents References References [1] 山下清悟, “超かぐや姫!.” [Online]. Available: https://www.netflix.com/title/81756595 [2] J. Park and H. Kang, “RenderMem: Rendering as Spatial Memory Retrieval.” [Online]. Available: https://arxiv.org/abs/2603.14669 [3] R. I. C. Muchacho and F. T. Pokorny, “Walk on Spheres for PDE-based Path Planning.” [Online]. Available: https://arxiv.org/abs/2406.01713 [4] C. Jambon, M. S. Nabizadeh, and M. Konaković Luković, “Walk on Decomposed Subdomains: A Hybrid Monte Carlo–Deterministic Solver for Elliptic PDEs,” ACM Trans. Graph., vol. 45, no. 4, July 2026, doi: 10.1145/3811340. [5] Heskey0, “具身智能 - 9 个方向讲透 2025-2026 灵巧手智能.” [Online]. Available: https://zhuanlan.zhihu.com/p/2046746760459171551

June 7, 2026 · 1 min

图形已死,all in AI具身 I: RoboSplat 论文阅读与杂谈

这周组会上导师提到现在做 Rendering 已经很难有价值和影响力了,也很难找到好的课题,应该 all in 具身智能。感觉自己从一个转型阵痛期的组跳进了另一个转型阵痛期的组。不过转型是正确的,具身方向的确好发有影响力的论文,就业前景也比传统图形学好。虽然私心比较喜欢简洁优雅但没用的图形学,但确实应该现实一点。我们该思考一下怎样把已有的图形学、渲染经验搬到具身智能的应用上。 组里同学分享的 RoboSplat [1] 一文确实相当契合 CG for embodied 的愿景,因此我们从这篇论文开始了解我们能够做什么。 论文概要 本文的目标是通过输入场景的多视角 RGB 图片和单次示教样本(Expert Demonstration,人工操作机械臂完成一次任务,得到每帧的机械臂状态数据和单监督视角 RGB 图像序列)训练 VLA 模型泛化完成不同干扰场景下的同一任务。本文试图解决的干扰场景分为物体位姿移动(Object Pose)、监督相机移动(Camera View)、光照条件改变(Lighting)、物体种类改变(Object Type)、周边环境改变(Appearance)、机械臂外观改变(Cross Embodiment)六种。 图 1 论文 teaser,展示了 RoboSplat 的训练过程。 本文做到泛化的具体方法则是做数据增强,从单次示教样本中根据这几种干扰情况生成上千条增强样本 (augmented demonstrations)。以往生成增强样本的思路是直接在 2D 图像空间做生成式编辑,而本文考虑将多视角图片训练成 3DGS 场景(并在语义上分离场景、物体、机械臂,给机械臂绑骨),去在 3DGS 场景中做编辑模拟这些干扰,再合成回样本图像序列。这样做的好处是保证了图像之间场景的一致性,且不会有抖动等情况出现,因此能准确指导 VLA 模型学习到正确的操作策略。 本文对这几种任务做了测试: Pick Object(抓取物体):机械臂需要抓起放置在 30cm*40cm 范围桌面上的目标物体。 难点: 测试基本的空间 3D 定位与抓取能力。 Close Drawer(关闭抽屉):机械臂需要推关一个抽屉。抽屉的位置在 15cm*40cm 范围内随机变化,且抽屉在 Z 轴方向的旋转角度在 [-pi/8, pi/8] 之间随机偏转。 ...

June 4, 2026 · 2 min

SIGGRAPH 2026 论文笔记 III: Monte Carlo PDE & 几何

1. Monte Carlo PDE Probe-based Walk on Spheres for Efficient Path Reusing [Project] 我自己的文章。 利用路径信息重用高效优化 Walk on Spheres 系列算法。 考虑到 Walk on Spheres 的采样过程,每一步都要在球面上均匀采样一个点作为该点解值的一个无偏估计。由 Off-center 形式的平均值公式可以得到实际上在球内的偏心点按 Poisson Kernel 分布在球面上采样一个点得到的结果也是解值的无偏估计。因此 WoS 均匀采样得到的解值可以为球内每个点所重用,在算法上就是得到一条完整路径后将求解值 Splat 回路径上的每个球内。这个算法被我们称为 Naive Path Reuse,不清楚现在 sig 上那篇 Talking to Neighbors 有没有扩展成这样的形式。 图 1 我们的 Naive Path Reuse 算法 然后考虑到这样 Splat 的开销过于大(球内每个点都需要查询并访存一次),正好 25 年 11 月又出来了 Harmonic Caching 的文章,发现后者正好可以将 Splat 的任务转化为求解几个 Fourier 系数的任务。因此和 HC 类似地在求解域预放置一些探针球,游走时取一个探针球做 Poisson Kernel 采样找到边界,若不存在探针球就 Fallback 到传统的 WoSt 算法,可以验证这个行为仍然是满足布朗运动的。找到 Dirichlet 边界后就将求解到的结果送回探针球中贡献 Fourier 系数。然后就非常快了。 ...

May 29, 2026 · 3 min

SIGGRAPH 2026 论文笔记 II: Rendering

1. 材质,外观,可微渲染 Fiber-level Woven Fabric Capture from a Single Microscopic Image [1] 另一位助教 @JerryShen 的文章之一。这篇没有上 Sig26,只是录进了 ToG,但也放在这里。 从单张显微图像通过可微渲染重建织物的纤维级几何和材质。 对于几何建模了基本可微的五层结构: 编织模式 Pattern:平纹、斜纹等纹理模式,直接预设好,用预训练的 CNN 分类; 中心线层 Yarn Centerline:每根纤维从侧面看高度关于路径长度的函数,用抛物线和圆混合; 纤维截面层 Cross-sectional Fiber Distribution:在中心线周围生成 根纤维,纤维的螺旋扭转 、偏移 、周期性挤压变形等都是可微参数; 随机噪声层 Randomized Variation:用柏林噪声和白噪声让纤维的半径和纵向产生变化、噪声种子本身不可微但强度可微。 飘散纤维层 Flyaway Model:额外手动添加飘散出来的断线等纤维(定义有毛发 Hair 和环路 Loop 两种),模拟现实材质情况。这一层没法可微优化出来。 ...

May 28, 2026 · 3 min

SIGGRAPH 2026 论文笔记 I: 3D Gaussians

写一些笔记记录一下领域的最新进展。会持续更新,主页的 blog 发表日期仅供参考~ 1. 正向渲染加速 Gaussian Point Splatting [1] [Project] 本文用蒙特卡洛方法代替深度排序,加速了超大 3DGS 场景在 GPU 上的正向渲染过程。目前仅支持正向渲染。 本文注意到单个 Gaussian Splat 到屏幕空间的行为可以等价于在屏幕空间上按一个 Gaussian 分布放回采样 个点的结果的期望( 和 Gaussian 的参数相关)。而一系列 Gaussians 做 Alpha Blending 的行为可以等价于,对每个 Gaussian 采样 个点,然后对每个像素取深度上最靠前的点 作为 Splat 结果的无偏估计值。 ...

May 27, 2026 · 5 min

实分析 课程总结笔记

这是我在 2025 年春季于中科大学习于树澄老师的《实分析》[1] 课程时整理的期末考试复习笔记。课程录像已有同学上传到 Bilibili. 实分析复习笔记 期中部分 Lebesgue 测度的建立 1. 集合论基础:规定一类集合的代数性质,使得简单生成元上的性质可被推广 集合的运算,集合列的极限,点集拓扑 作业 1a.3:上下极限的等价表述 :事件无穷多次发生 :事件从某时刻开始一直在发生 ...

June 10, 2025 · 6 min

用 FPGA 写 Flappy Bird

同步一下之前(2024冬)写过的文章~ 不知不觉快到期末了,也做完了本学期数字电路实验课程的最后一个实验。我选择了实验中分值最高的,组队用 FPGA 完成一个能在 VGA 屏幕上显示的小游戏。正好,在多年前我用 Gamemaker 复刻过一个 Flappy Bird,于是决定把它搬到 FPGA 上。 ...

January 10, 2025 · 16 min

ARAP 曲面参数化算法实现笔记

同步一下之前(2024春)写过的文章,这是我当时在 计算机图形学 课上完成的作业报告,作为最难的一次作业,当时写了非常长的报告。 本次作业要求实现 ARAP,ASAP 与 Hybrid 三种非固定边界的曲面参数化算法。我在理解并实现了这些参数化算法的基础上,对 ASAP 做了迭代方法和单一方程组方法的两种实现,并对这些算法做了进一步研究。 这次作业在数学方面的知识对我来说还有许多我个人不太能独立理解的部分。感谢 @suchiwz 助教的耐心解答,让我能够对论文的各种细节做出能让我满意的理解。在本次作业报告中,我也会试着用刚做完 Homework 4 的大一学生也能理解的语言讲解我对这篇论文的理解。 0. 准备工作 本次作业新增了四个模型。它们的共同特点都是有比较好的切割(没有像 Bunny Head 那样过细的瓶颈了),并且都有各自的难点,如下表所示: 模型 特点 Cow 面数较多;网格较复杂,难以避免重叠;切割后仍保留了较多模型本身的几何特征(头部、眼睛、肢体),易于观察展开算法对形状的处理,确认算法的保形效果。 Beetle 高亏格曲面(即存在多条边界的曲面) Isis 有较多“细长”的三角形 Gargoyle 网格顶点数、面数非常多 Beetle 模型打破了 “模型只有一个边界” 的假设,因此我们需要对 Homework4 的边界映射算法做出调整,对每个边界都进行一次遍历,并取长度最长的边界作为映射的边界。相应地,对 Tutte 参数化中用到边界相关的代码进行调整,不再视不为主要边界的点位边界。这样,Tutte 参数化的结果就能够较好地处理 Beetle 模型,并将其作为 ARAP 的 Initial Guess 了。下图是 Floater 参数化处理后的 Beetle 模型。 ...

May 20, 2024 · 3 min

Hello, World!

前言 你好!我正在尝试使用 Typst 构建博客! 感谢 George Honeywood [1] 的分享和室友 @Vertsineu 的帮助~ 图 1 你好,世界! 本页面实际构建日期为 2026 年 5 月 11 日,为了同步一些早期的文章同时保持次序,将本文章的发布日期设置在了一个有意义的日子。 Table of Contents 前言 References References [1] George Honeywood, “Typst and Hugo.” [Online]. Available: https://george.honeywood.org.uk/blog/typst-and-hugo/

July 30, 2022 · 1 min