第243章:“过度拟合”的幽灵 美丽的陷阱 (第3/3页)
坐在电脑前,低着头。周寻站在窗边,看着外面的夜色。
“怎么了?”陈默问。
周寻把事情简单说了一遍。
陈默听完,走到陆方面前,蹲下来。
“陆方。”
陆方抬起头。
他的眼睛红红的,但没有哭。
“陈总,”他的声音沙哑,“我……我错了。”
陈默摇了摇头:
“你没错。你只是想做出最好的策略。”
他看着陆方:
“三个星期,每天只睡四五个小时,一遍一遍跑回测。这种投入,我见过的人里,没几个。”
陆方愣住了。
“可是……可是我的策略是假的……”
“假的是策略,不是你的努力。”陈默说,“你努力的方向错了,但努力本身没有错。”
他站起来,看着那台已经黑屏的电脑:
“周寻说,你学到了过度拟合。你知道有多少人,一辈子都没学会这个吗?”
他顿了顿:
“他们要么一直在跑漂亮的回测,然后实盘亏得倾家荡产。要么根本不相信任何回测,完全凭感觉做投资。你属于哪一种?”
陆方沉默了几秒。
然后他说:
“我想……我想学会怎么看穿过度拟合。”
陈默点头:
“那就对了。”
他转身看着周寻:
“周寻,你教他。怎么识别过度拟合,怎么防范,怎么建立检验流程。”
周寻点头。
陈默又看向陆方:
“这三个星期,没白干。你让我看到一件事——”
他顿了顿:
“我们这个团队,有愿意拼命的人。”
陆方看着他,眼睛里的空洞,慢慢被另一种东西填满。
不是兴奋。
是一种更沉的东西。
是被理解后的踏实。
---
深夜十一点,三个人站在那间三十平米的办公室里。
窗外的车公庙,已经彻底安静下来。只有远处偶尔传来的汽车声,证明这座城市还在运转。
周寻在白板上写了一行字:
“过度拟合防范指南(草稿)”
下面列了几条:
1. 限制参数数量——每个参数必须有明确的经济含义
2. 样本外测试——永远留一段没用过的数据做最终验证
3. 交叉验证——在不同时间段、不同股票池上重复测试
4. 简化原则——在效果相近时,选参数更少的模型
5. 怀疑完美——任何回撤极小、收益极高的策略,先假设它有问题
陆方看着这几条,默默地记在心里。
陈默站在他旁边,轻声说:
“陆方,你知道周寻为什么一眼就能看出你的线有问题吗?”
陆方摇头。
“因为他见过。”陈默说,“他自己也走过这条路。在华尔街的时候,他一定也跑出过这种‘完美’的线,然后实盘亏过钱。”
他看着周寻:
“对吧?”
周寻沉默了几秒,然后点了点头。
“2007年。”他说,“我做了一个策略,回测夏普比率2.8,最大回撤7%。老板说要投1个亿。我说再等等,再测测。结果还没测完,市场风格就变了。那个策略,再也没跑赢过。”
他看着陆方:
“所以我知道,这种线,是陷阱。”
陆方听着,忽然觉得自己没那么孤单了。
原来周寻也走过这条路。
原来每个人,都要交这笔学费。
“周老师,”他问,“那我们现在怎么办?”
周寻想了想:
“从明天开始,重新跑。但这次,跑的是‘简化版’。”
他走到白板前,在“简化原则”下面画了一条线:
“把所有你优化的参数,都改回最简单的整数。6个月,30%,90%。跑一遍。如果简化版的收益比优化版低不了太多,那说明你优化出来的那些参数,可能是过拟合的。”
他看着陆方:
“这叫‘奥卡姆剃刀’。在效果相近的情况下,简单的比复杂的好。”
陆方点头。
他站起来,走到电脑前。
屏幕还黑着。
他伸手,按下了开机键。
“现在开始。”他说。
『加入书签,方便阅读』