Vuiora / Blog

暴论之成果科学范式

2026-02-19T00:00:00+00:00

成果科学范式：一种面向创新的科学方法论

引言：科学方法的历史局限

传统科学范式自近现代以来在科学实践中占据主导地位，其核心特征是以理论理解和实验过程分析为中心。科研者被要求掌握理论框架、熟悉实验细节，并通过系统化方法验证自然规律。这种范式在推动科学知识累积、建立共同体认知以及形成可重复性研究方面发挥了显著作用。然而，随着科学研究对象的复杂化和技术工具的迅速发展，传统范式在效率、跨学科应用和快速创新方面显现出局限。具体而言，科研过程的高度依赖理论理解和实验分析往往造成创新速度的滞后，使得新问题的探索难以与研究资源和时间要求同步。这一现实提示我们，需要一种能够兼顾科学严谨性与实践效率的新型方法论。

第一章：成果科学范式的提出

针对上述问题，我们提出成果科学范式（Outcome-Driven Scientific Paradigm）。该范式的核心原则在于：科研活动的评价标准不再仅限于对实验过程的精确掌控或理论机制的全面理解，而是以已有成果是否能够被显式应用于新研究、推动新成果产生为核心指标。在这一范式下，科研者不必深入理解每一个方法或模型的内部机理，而是通过其应用效果体现科学实践能力。例如，在统计或数据科学研究中，研究者可以不掌握贝叶斯模型的完整数学推导，但能够利用其完成预测任务、优化决策或生成实验结果，即可被视为实践了该方法。旧成果成为科研操作的工具，其价值在于应用而非单纯理解。

更进一步，成果科学范式将科研实践的定义扩展到“使用成果即研究”的层面。即当科研者操作某项技术、方法或工具本身，就已经在实践科学并推动科学发展。以人工智能研究为例，使用GPT技术进行实验或分析，即使科研者未完全理解模型内部机制，依然体现了科学实践。GPT技术的设计思路、论文思路及方法逻辑已经融入科学研究过程，科研者通过使用它便在实践科学，将技术使用本身视作范式实体。换言之，科研不再完全依赖理论理解或实验重构，操作成果本身构成科学实践和创新行为。这一扩展强化了成果科学范式作为方法论实体的独立性，使科研者能够在高复杂性技术环境下快速开展研究，同时保留理论生成和方法优化的潜力。

第二章：对基础理论突破的影响

一种常见的质疑是，成果科学范式可能削弱基础理论的突破。对此，需要从方法论和创新机制两个层面进行分析。创新过程可以通过成果对照实验系统化理解：科研者将旧成果应用于新问题，并对结果进行对照分析，从而揭示方法的适用边界、潜在缺陷和优化空间。这一过程为理论发展提供间接证据，使基础理论能够在实践验证中不断延展。换言之，理论创新并非必须依赖对方法内部机理的深度理解，而是可以通过成果的应用与对照实验间接推动。实践与结果成为理论生成的重要源泉，这一观点与传统科学范式中“理论先行”的逻辑形成鲜明对照。

第三章：方法论特征与跨学科应用

成果科学范式具有显著的方法论特征。首先，它强调成果操作性与可重复性，使科研活动能够更高效地跨越学科边界。传统范式在跨学科问题中往往要求研究者重新掌握理论体系，而成果范式允许科研者直接调用已有工具与方法应用于新领域。其次，该范式支持快速迭代的创新循环：旧成果用于新问题探索，产生新成果，再通过对照实验验证并优化方法。理论理解成为辅助而非前提，创新以成果为核心驱动力。这种循环机制不仅提高了科研效率，也保证了科研活动的严谨性。

在现代科研环境中，尤其是大数据、人工智能和高通量实验条件下，成果科学范式展现出独特优势。复杂问题和跨学科挑战要求科研方法能够快速适应新条件，而传统范式在此类问题上常表现为效率低下。成果范式通过强调成果应用、对照分析和迭代优化，使科研活动既保持可验证性，又具备高度灵活性，为快速创新提供方法论保障。

第四章：理论与实践的关系

成果科学范式并非排斥理论或实验方法。相反，它提供了一种以成果为主导的科学实践逻辑。在这一逻辑下，理论的作用是辅助实践，而实践和成果生成是创新的核心。通过持续应用旧成果和对照实验，理论可以被自然延展和优化，形成新的知识结构。更进一步，在成果科学范式扩展下，科研活动可通过“使用成果即研究”的方式开展。科研者操作技术或工具本身，即完成了科学实践，这种实践同时生成数据、结果及方法优化信息，为理论延展提供基础。这种方法论的核心在于：理论创新与成果生成并非线性关系，而是通过实践—验证—迭代循环共同推进。科研活动因此不仅关注知识积累，也重视成果的实际应用与操作能力。

第五章：科学评价体系的重构

成果科学范式对科学评价体系提出了新的视角。在传统范式下，科研评价往往基于理论深度、实验方法严谨性或发表数量。成果范式则将成果生成能力、方法应用效率和创新贡献作为核心评价指标。这一转变有助于打破学科壁垒，激励跨学科合作，并引导科研者将研究重心从过程分析转向结果驱动的创新。更重要的是，这种评价逻辑使科学实践能够快速响应社会需求和技术发展，缩短理论生成与应用之间的距离。

第六章：结论与展望

综上所述，成果科学范式是一种面向创新与应用的科学方法论，其核心在于以成果为中心推动科学实践，并将使用成果本身上升为科学研究的范式实体。它重构了科研逻辑，使实践与成果成为创新循环的核心，同时保留了理论生成和方法优化的可能性。成果范式并非替代传统科学范式，而是一种补充与拓展，为现代科研提供了适应复杂环境的策略选择。在未来科学发展的进程中，尤其是在跨学科、高复杂性和技术快速演进的背景下，成果科学范式有望成为推动科研效率、加速创新及优化理论发展的重要方法论方向。

论文思路探索2

2026-02-16T00:00:00+00:00

组块如何产生？我不太清楚，但是有一个方法能够解决这种问题，可以通过设计练习习题，让训练者在达到目标强度的习得能力后，再进行下一步的学习，如果能力不达标，后继知识不熟悉，那么我们将认为没有形成记忆组块，不过这种认为可能非常不严谨，显而易见，训练者可能并非是没有形成记忆组块而对后继知识不熟悉，还可能是别的原因，如果量化到底是记忆组块还是别的其他原因，这就很难进行了，因为组块如何产生是未知的。

不过我们可以采用一种方法来评估记忆组块的完成率？给定一个文章，如果记忆组块多，调度快，说明对组块非常熟练，那么我们可以认为这个名词的前置组块很熟练，所以记录文章阅读时间，并清洗异常阅读时间很关键，我们可以使用平均值来记录阅读者的水准阅读速度。

当我们得到了阅读速度后，就可以评估前置组块的情况了，当阅读速度达到一定阈值时，（我们将默认认为阅读速度高于平均值的一个合理水准时【这个合理水准或许有一定的统计学标准？】，该知识的前置知识组块充分学习了。）我们可以认为读者对于该知识的掌握已经很熟练，前置组块也充分学习了。当不满足充分学习时，我们将重复调用过去的tutorial进行再学习。并对tutorial的卡片进行调度升级。

不过实现这一点，首先我们需要采集记忆组块完成率的数据，我们需要提取用户的阅读速度，来进行评估。我们将对阅读速度，答题正确率和组块完成率的评估后，再进行设定，最终很可能是一个动态调节版本，这个版本会有一个解析函数来描述。

prompt:

组块如何产生？我不太清楚，但是有一个方法能够解决这种问题，可以通过练习习题，让训练者在达到目标强度的习得能力后，再进行下一步的学习，如果能力不达标，后继知识不熟悉，那么我们将认为没有形成记忆组块，不过这种认为可能非常不严谨，显而易见，训练者可能并非是没有形成记忆组块而对后继知识不熟悉，还可能是别的原因，如果量化到底是记忆组块还是别的其他原因，这就很难进行了，因为组块如何产生是未知的。因此这种方法是不可行的。

不过实现这一点，首先我们需要采集记忆组块完成率的数据，我们需要提取用户的阅读速度，来进行评估。

你需要先实现这些逻辑，对于充分学习和记忆组块完成率的评估阈值，我们将对阅读速度，答题正确率和组块完成率的评估后，再进行设定，最终很可能是一个动态调节版本（当然，需要收集这些数据，如果没有这种数据收集逻辑，你需要实现他们），此时阈值默认为你自己认为的一个合理值（如果有统计学黄金标准值就好了）。

论文思路探索1

2026-02-15T00:00:00+00:00

有关线性回归模型（自变量向量 $\cdot$ 权重向量的标量模型）对于SRS的前置知识系统应用如下，MLP的输入（统计参考值）是前置知识的熟练度参考值，记忆半衰期的参考值，RSME等参数组合参考值，MLP的前向传播优化目标是最大化做题正确率，以及知识回答正确率和学习速度的综合参考值，我们将实验各个参考值的权重，通过超参搜索来发现最优权重。对于模型自身评估水平，我们将排列组合所有可能因素，包括（前置知识缺失率，半衰期），（前置知识缺失率，RSME），计算出调度排程能够最优的能够使预测的评估指标K-L最大值，既最终的反向传播结果是各项指标，而前向传播结果是排程顺序。

综合评估指标K-L：对于一个受验者从未接触过的迁移知识点所用的问题P，我们定义评估指标K为问题P的每L个问题区间的正确率为K-L评估指标。

对于指标的组合包括（前置知识缺失率，半衰期），（前置知识缺失率，RSME）等，我们使用0/1函数计算，在传播过程中，我们需找到合适的计算0/1时机，以最优化模型的组合计算过程。对于指标组合的防止过拟合方法，我们使用L2正则，对不重要的指标进行去除。（不过我们可能需要指定目标学习的长度，如果记忆半衰期针对的是长期学习，而我们的目标是短期学习，那么他可能被L2剔除，但是反之它会被保留）

使用Softmax指定组合产生后各项数据样本权重（排程卡片输入参数的权重值）的分属概率情况，整个排程排卡是一个概率模型，我们将按照各项输入参考值权重的映射到概率调度卡片。对于数据样本权重的分属概率，我们使用L1正则化进行处理。

对此有以下对话：

有关线性回归模型（自变量向量 $\cdot$ 权重向量的标量模型）对于SRS的前置知识系统应用如下，MLP的输入（参考值）是前置知识的缺失率参考值，记忆半衰期的参考值，RSME等参数组合参考值，以及知识回答正确率和学习速度的综合参考值，我们将实验各个参考值的权重，通过超参搜索来发现最优权重。对于模型自身评估水平，我们将排列组合所有可能因素，包括（前置知识缺失率，半衰期），（前置知识缺失率，RSME），计算出调度排程能够最优的能够使预测的评估指标K-L最大值，既最终的反向传播结果是各项指标，而前向传播结果是排程顺序。

综合评估指标K-L：对于一个受验者从未接触过的迁移知识点所用的问题P，我们定义评估指标K为问题P的每L个的区间范围正确率为K-L评估指标。

对于指标的组合包括（前置知识缺失率，半衰期），（前置知识缺失率，RSME）等，我们使用Sigmoid函数计算，在传播过程中，我们需找到合适的计算Sigmoid时机，以最优化模型的组合计算过程。对于指标组合的防止过拟合方法，我们使用L2正则，对不重要的指标进行去除。（不过我们可能需要指定目标学习的长度，如果记忆半衰期针对的是长期学习，而我们的目标是短期学习，那么他可能被L2剔除，但是反之它会被保留）

使用Softmax指定组合产生后各项数据样本权重（排程卡片输入参数的权重值）的分属概率情况，整个排程排卡是一个概率模型，我们将按照各项输入参考值权重的映射到概率调度卡片。对于数据样本权重的分属概率，我们使用L1正则化进行处理。这是调度算法的训练逻辑

3) 训练目标（你写的 K-L / KL）需要先澄清

你文中有两种“KL”概念混在一起：

你定义的 K-L 指标：是“每 L 个区间的正确率”，这更像 K@L / 分段准确率，不是 KL divergence。
你又写“使预测的评估指标 K-L 最大值、K-L 最大、反向传播”等，这更像是在说“优化目标”。

工程上要能训练，必须明确：

L 是按什么切分（按复习次数、按时间段、按卡片数）？
K-L 是对单个概念、单个受试者，还是总体平均？
这是离线评估指标（评估一个已发生的排程）还是在线目标函数（可导、可反传）？

如果你暂时不想把它做成 RL/序列决策，建议第一版先用更稳妥的监督学习目标：

预测 is_correct（交叉熵/logloss）+ 预测 time_spent_sec（回归）+ L2 正则然后调度时用预测的 recall 概率去排序（例如优先复习“预计快忘/重要/根节点”的卡）。

等你把 K-L 指标定义清楚，再升级成“直接优化排程”的策略学习。

4) 正则化：建议把 L1/L2 放到“权重”而不是“概率”

你写“对样本权重概率用 L1 正则”，从实现和可解释性看更常见的是：

L2：对模型权重 θθ 做 L2（防止过拟合）
L1：对模型权重做 L1（特征稀疏/自动特征选择）

对 softmax 概率直接做 L1 通常意义不大（softmax 本身就约束和为 1）。

如果你希望我把这套逻辑开始“写进代码骨架”（但不实现最终论文公式），我需要你补 2 个关键定义我才能不写偏：

你说的 K-L：L 的窗口怎么定义？（按“每 L 次复习”？还是“每 L 天”？）K 是窗口内准确率的均值/最小值/最后一个窗口？
你要优化的是：缩短总学习时长 还是 固定时长内最大化 K-L？（两者的目标函数不同）

你回复这两点后，我可以在 srs/ 里加一个 learned_policy 的最小可跑版本：特征提取 → 线性/MLP 打分 → softmax 调度 → 网格/随机超参搜索接口，并把训练/评估脚本接到现有 app.db 的 reviews 日志上。

我的表述没有问题，但是有一点没解释清楚，K-L指标指的是对于一个受验者从未接触过的迁移知识点所用的问题P，我们定义评估指标K为问题P的每L个组合的正确率为K-L评估指标，它本质是一个正确率，K-L正确率最大值是模型反向传播的优化目的

yt确实是离散的，不过我们现在就要研究yt的概率。

综合评估指标K-L：对于一个受验者从未接触过的迁移知识点所用的问题P，我们定义评估指标K为问题P的每L个问题区间的正确率为K-L评估指标。这里的问题区间事实上是迁移问题的个数

明白了：你这里的“区间”不是时间区间，而是迁移问题数量的区间（按题号/作答序号分段）。

更精确地写就是：

对某个迁移知识点对应的问题序列 (P={p_1,p_2,\dots,p_N})，受试者首次接触时产生作答结果 (y_1,\dots,y_N)，其中 (y_i\in{0,1})。
设定一个段长 (L)（表示“每段包含的迁移问题数”）。
第 (j) 段（问题区间）的 K-L 正确率： [ K!-!L(j)=\frac{1}{L}\sum_{i=(j-1)L+1}^{\min(jL,N)} y_i ]
如果 (N) 不是 (L) 的整数倍，最后一段可以：
- 要么用实际长度归一化（上式这样做），
- 要么直接丢弃不足 (L) 的尾段（你需要选一种作为实验协议）。

如果你要把 “K-L 最大值” 当目标，那就是： [ \max_\theta \max_j K!-!L(j) ] 但请你再确认一个实验细节：K-L 是按连续分段（1..L，L+1..2L…）还是按滑动窗口（1..L，2..L+1…）来算？这会直接影响指标的敏感性和训练/评估实现方式。

干涉

2026-02-14T00:00:00+00:00

记忆中的干涉

我曾记得有一回在阅读thoughts memo时发现了一些文章，观点认为工作集中的知识会相互干涉，比如你在学习点积时，如果突然出现一个概念叫叉积，假设你不知道这两个概念的图形符号，仅仅告诉你点积和叉积的概念，如果你是新手，大概率会弄混这两个概念。

人类的记忆工作集是有限的，我们在安排知识点时，应该尽量的避免两个相似概念的交叉。如果我们可以量化两个概念是否交叉就好了。本文提供了几种方式，基于头脑风暴，来得到量化概念的相似性。

首先要分析的是，在我们弄混两个相似概念的时候，到底发生了什么，我们看到点积和叉积的第一反应是，这两个概念十分抽象，为什么叫点积，为什么叫叉积？仅仅因为运算符号的形状吗？显然，如果我们叫点积为标量积，叉积为向量积，那么这两个积很好识别了。但是还是没有解决根本问题，如果还是叫他原名，那我们并不能从点积和标量积，叉积和向量积之间建立什么必然联系，我们还是很可能弄混点积对映向量积还是标量积这种问题，并且这样做会有调入工作集过多内容的负载问题。显然这不是一种好的学习方式。

那么最好的方式应该是死记硬背吗？我认为这一点有些道理，但是我们应该换种思路，我们不妨把标量积称为点积，把数值称为标量，把两个向量的运算结果得出的标量叫做点，两个向量的这种运算叫做积。那么我们自然而然地认为两个向量的标量运算叫做点积。这样做像是某种举例子，这种方法虽然解决了上述负载问题，然而这种做法也具有一定风险，就是两个向量的结果可能不能叫做点，这可以是一种记忆术，但并不是一种实际的知识。

事实上如果我们知道这些知识的背景知识，那么学起来会容易得多，比如：

“点积”之所以叫“点积”，核心原因是：它最早来自把两个向量的各个分量“对应相乘”，再把这些乘积“点”（一个个项）加起来的运算形式。

“叉积”之所以叫“叉积”，主要有两层原因：

记号像“叉”
- 叉积常用符号是 ×，看起来就是一个“叉”，所以中文直译成“叉积”（英文 cross product）。
几何意义是“叉”出一条垂直方向

两个向量 a 和 b 的叉积 a×b 的结果不是标量，而是一个新向量，方向垂直于 a、b 所在平面（用右手定则确定方向），像从这两个向量张成的平面里“叉”出一根垂线。

如果你仅仅学过向量，那么以上内容还是比较容易学习的（如果你学完了线性代数，可能没有这样的体会）

这样对于一个知识点有了合理的解释，它的干涉会小很多吗？我依旧不认为这是一个好的方式，原因在于我们在调度一个知识点比如点积的时候，仍然需要先调度它的核心原因，才能分辨到底这个点积指的是什么。

貌似这么讨论下来，最终的解决方案还是死记硬背？

有一种方法可以解决这种问题，不过我不喜欢叫它的原始名称为费曼技巧，因为在这种情境下，费曼技巧貌似是一种非死记硬背的方式，我比较喜欢叫他：用费曼技巧死记硬背来对知识一一映射。

至于费曼技巧的内涵，基本上是：把一个知识点熟练的给小孩子讲懂。也就是说，用自己的话来讲述知识点。

此时我们的注意力应该集中在知识点自身上，比如你很容易误判sin和cos图像（在最开始学习的时候）。那么你就需要告诉自己从原点出发的图像是sin图，另一个从y=1出发的是cos图。并尝试浅浅背一下这个玩意儿。

超前学习

2026-02-14T00:00:00+00:00

传统的SRS有以下问题，缺乏关注卡片的识别能力对于学习知识的影响，Musfeld等人的研究表明，记忆的长期表现和当前受验者重复学习的记忆组块识别能力相关，并且chunk的产生是突然发生，而不是逐渐强化的。而Schneider M的研究综述指出chunk受到先验知识的影响。同样在闪卡调度系统中，若某一知识的难度过高，且被多次重复调度后仍然不能成功回忆，这样的卡片称为“水蛭”，而闪卡的制作安排与知识的获得是相关的，因此间隔重复系统卡片制作的优良与否是整个记忆系统评估的重要指标。在文段开始，课题通过对Musfeld和Schneider等的分析，我们认为先验知识可以促进chunk的产生，也有利于水蛭问题的解决。我认为对于没有学过的知识点，应该优先学习，但这里并没有要求必须先学习，我希望通过一定的差异度，进行超前学习，如果超前学习的知识记忆半衰期有缩短，并且记忆的效果有提高，那么我们可以适当减小这个知识及前置知识的调度权重，不过我们需要设定一个阈值，当模型的前置知识关联数量达到这个阈值时，他被称为必要知识，此时这个必要知识是不可以超前学习的。

leetcode 6题解

2026-02-13T00:00:00+00:00

6. Z字形变换

将一个给定字符串 s 根据给定的行数 numRows ，以从上往下、从左到右进行 Z 字形排列。

比如输入字符串为 "PAYPALISHIRING" 行数为 3 时，排列如下：

P   A   H   N
A P L S I I G
Y   I   R

之后，你的输出需要从左往右逐行读取，产生出一个新的字符串，比如："PAHNAPLSIIGYIR"。

请你实现这个将字符串进行指定行数变换的函数：

string convert(string s, int numRows);

示例 1：

输入：s = "PAYPALISHIRING", numRows = 3
输出："PAHNAPLSIIGYIR"

示例 2：

输入：s = "PAYPALISHIRING", numRows = 4
输出："PINALSIGYAHRPI"
解释：
P     I    N
A   L S  I G
Y A   H R
P     I

示例 3：

输入：s = "A", numRows = 1
输出："A"

提示：

1 <= s.length <= 1000
s 由英文字母（小写和大写）、',' 和 '.' 组成
1 <= numRows <= 1000

一开始还以为要我模拟这个形状，后来读题发现不对。。一定要读题啊。

class Solution {
public:
    string convert(string s, int numRows) {
        int len      = s.size();
        if(len == 1){
            return s;
        }
        if(numRows==1){
            return s;
        }
        int vsize    = 2*numRows-2;
        int vnum     = len % vsize; 
        int vvnum    = (len - vnum * vsize)/vsize+vnum;
        string convstr = "";
        for(int i = 0;i<numRows;i++){
            if(i == 0 || i == numRows-1){
                for(int j = 0;j<=vvnum;j++){
                    if(j*vsize+i < len){
                        convstr += s[j*vsize+i];
                    }
                }
            }else{
                for(int j = 0;j<=vvnum;j++){
                    if(j*vsize+i < len){
                        convstr += s[j*vsize+i];
                    }
                    if((j+1)*vsize-i< len){
                        convstr += s[(j+1)*vsize-i];
                    }
                }
            }
        }

        return convstr;
    }
};

FSRS算法学习摘录

2026-02-12T00:00:00+00:00

本节摘选自FSRS 是全世界最精确的间隔重复算法之一（最新基准测试更新）

英文原文链接：FSRS is one of the most accurate spaced repetition algorithms in the world (updated benchmark) : r/Anki

首先，任何「诚实」的间隔重复算法都必须能够预测在特定时间点回忆一张卡片的概率，这取决于卡片的复习历史。在下文中，我会用 R 来指代这个概率。

如果一个「不诚实」的算法不计算概率，只输出一个时间间隔，我们仍然可以在某些假设下将这个间隔转换为概率。虽然不是最理想，但总好过没有，因为这至少允许我们进行某种比较。这就是我们对 SM-2 算法所做的，它是基准测试中唯一的「不诚实」算法。我们决定不加入 Memrise，因为我们不确定所需的假设是否适用于将其间隔转换为概率。不过，即使加入了，它的表现也不会太好，它的灵活性极差，几乎不配被称为算法。

简言之，诚实算法是基于概率来调整卡片的排程的，而非仅仅输出一个时间间隔

本节选自Paradoxes of Spaced Repetition Algorithms

（我对本节非常认可）

Paradoxes of Spaced Repetition Algorithms

The learner desires less repetition and more memorization. However, the algorithm requires more repetition to adapt to the learner.

The learner wants their true retention to accurately match their desired retention. However, the algorithm requires data from a diverse range of retention levels to improve sampling efficiency and avoid regression.

The learner may choose their rating based on the interval length. For instance, if they find a review easy but see that the “easy” interval is too long, they might select “good” instead. They may only choose “easy” for very simple cards. This behavior leads to higher retention on those cards, causing the algorithm to adjust and lengthen intervals. It creates a vicious cycle.

牛翻：

学习者希望减少重复、增加记忆。然而，算法需要通过更多重复来适应学习者的节奏。学习者期望实际记忆留存率能精准匹配其预期目标。但算法需要收集不同留存水平的数据，以提升抽样效率并避免模型退化。学习者可能根据复习间隔时长选择评分。例如，当感觉某次复习很简单，但发现”简单”选项对应的间隔过长时，他们可能会转而选择”良好”。或许只有面对极其简单的卡片时，他们才会选择”简单”。这种行为会导致这些卡片的留存率升高，进而促使算法调整并延长间隔，形成恶性循环。

leetcode 3713题解

2026-02-12T00:00:00+00:00

3713. 最长的平衡子串 I

中等

正则化策略学习笔记

2026-02-09T00:00:00+00:00

背景

深度学习中的正则化策略综述中提到：数据科学专家面临的最常见问题之一是如何避免过拟合。

文章中提到了欠拟合，拟合，和过拟合的三种情况阐述拟合是否将会在实际数据中表现合适，如下图：

左右两种情况是不适合实际数据的表现的，尽管他们在训练数据中表现得优秀。

解释

我们认为中间的情况是非常符合数据实际情况的。事实上，我们可以对这一个图示进行更为细致地分析：

如果我们取合适的$[a,b]$区间，我们不难发现，将这些区间上的点集合的中心依次相连接，貌似就是just right的趋势。

但是如果我们按照取每一个点作为一个区间的中心，我们可以得到一个完全overfitting的图像。

相映的，在两端取中心，那么可以得到一个完全underfitting的图像。

正则化解决

这篇正则化文章提到：

在本模型中，由于特征维度不高，我们可以使用岭回归对$[a,b]$区间的大小做惩罚，当$[a,b]$区间选取过大时，对其进行惩罚以减小区间长度防止过拟合。

Grouping in working 阅读笔记

2026-02-06T00:00:00+00:00

研究表明，识别重复内容是重复学习发生的关键条件（Musfeld等，2023a；Ngiam等，2019）。Musfeld等，2023a 中表明了一个观点，那就是重复学习是discrete的，chunk是突然出现的，而非缓慢增强的。

这一点我平时深有体会，很多时候的学习像是无用功，知道我进行了短暂的思考，理清当前知识和其他知识的区别，也就是说知道当前知识所具有的特征，此时我恍然大悟，形成了chunk。（这可能就是冒出点子的那个电灯泡吧）

既然如此，如果我们的系统可以检测到用户当前知识点是无用功，那么就可以提示他让他去短暂思考来进行知识点的重新梳理。

提示可以是：

请仔细思考本知识点，什么是思考？（思考就是将知识点的特征提取出来，它的前置知识是什么，以及它的特征是什么？它的定义本质是什么？比如：计算机网络和通信系统有什么区别？猛然一听可能想不出来本质区别，但是可以通过分析计算机网络的结构和通信系统的结构实现两者的比较，从而划分两者。）

虽然两者的本质都是进行数据通信，但是：

计算机网络由网络协议栈组成，协议主体设备是网卡，而通信系统由一些数据传输标准作为主要协议栈，协议主体更硬件。

这种思考的缘由在于前置知识对于本体知识的干涉造成的。