第244章:确立“样本外”测试与简化原则 (第2/3页)
优化到5个月零3周,把估值因子的阈值从30%分位数调整到27.5%,把状态识别的波动率阈值从90%分位数改成88%。”
他顿了顿:
“这些数字,有经济含义吗?5个月零3周,和6个月有什么区别?27.5%和30%有什么区别?没有。它们只是让曲线更漂亮。”
他看着所有人:
“真正的规律,应该是简单的。如果两个策略收益差不多,选参数更少的那个。如果两个参数差不多,选逻辑更简单的那个。”
他走到白板前,画了一个天平:
```
复杂模型 简单模型
参数多、拟合好 参数少、泛化强
\ /
\ /
选哪个?
```
他放下笔:
“答案:在效果相近时,选简单的。”
小林又举手:
“周老师,那如果简单模型的效果比复杂模型差很多呢?”
周寻看着他:
“那就用复杂模型。但前提是,它的复杂度必须有合理的解释。你不能说‘因为加了这五个参数,收益提高了3%’就完事了。你得说清楚,这五个参数背后的逻辑是什么,为什么它们能让模型更好。”
他顿了顿:
“如果说不清楚,那就还是简单的。”
---
上午十点,讨论进入细节。
陈默走到白板前,指着那两条铁律:
“这两条,从今天开始,是默石的铁律。任何人都不能违反。”
他看着周寻:
“样本外数据,谁来保管?”
周寻想了想:
“最好由一个人专门负责。这个人不参与策略开发,只负责保管数据和跑最终检验。”
陈默扫了一圈办公室。
六个人。有的在写代码,有的在研究因子,有的在整理数据。
他的目光停在赵姐身上。
“赵姐。”
赵姐抬起头。
“这个任务,交给你。”
赵姐愣了一下:“我?我不懂量化……”
“不用懂。”陈默说,“你只需要做一件事:把那部分样本外数据,单独存起来,谁也不给。任何人要跑样本外测试,必须通过你。你只负责执行,不负责判断。”
他看着赵姐:
“你是公司的财务,最清楚钱是怎么来的。现在,你要帮我们守住另一笔财富——数据的清白。”
赵姐沉默了几秒。
然后她点了点头。
“好。我干。”
陈默又看向陆方:
“陆方,你负责把回测框架改一下。以后跑回测,必须指定‘训练集’和‘样本外’。系统要自动禁止在样本外数据上做任何参数优化。”
陆方点头。
“小林,小吴,”陈默继续,“你们俩负责把2005年到2008年的数据,重新整理一遍。确保训练集干净、完整、可用。”
两人点头。
最后,陈默看向周寻:
“周寻,你负责写一份《样本外测试操作手册》。明确每一步怎么走,什么情况下算‘通过’,什么情况下算‘不通过’。要细,要严,不能有漏洞。”
周寻点头。
---
中午十二点,赵姐从财务室搬出来一个移动硬盘。
银白色的,很小,比手掌大一点。
她把硬盘放在桌上,看着所有人:
“这个硬盘,从现在开始,只用来存样本外数据。”
她顿了顿:
“2009年1月到现在的所有数据,都在里面。谁要用,来找我。我会当着你的面,把数据拷出来,然后看着你跑完测试。”
她看着陆方:
“跑完之后,数据必须当场删除。不能留在你们的电脑里。”
陆方愣了一下
(本章未完,请点击下一页继续阅读)
『加入书签,方便阅读』