第248章:处理“幸存者偏差” (第2/3页)
陈默盯着那个数字。
187家。
187个曾经存在过的名字,187个曾经让投资者亏过钱的故事,187个被遗忘的失败案例。
而现在,它们被排除在数据之外,好像从未存在过。
“陆方,”他问,“这个问题,能解决吗?”
陆方想了想:
“能。但要重新爬数据。”
他看着陈默:
“需要把所有退市公司的历史数据都找回来。包括它们还在市场上的时候的交易数据、财务数据。”
他顿了顿:
“有些公司退市很多年了,数据可能很难找。”
陈默沉默了几秒。
然后他说:
“找。不管多难,都要找。”
他看着所有人:
“我们不能只看活下来的。那些死掉的,才是真正的老师。”
---
下午四点,陆方开始研究怎么爬退市公司的数据。
他在几个数据源之间切换,眉头越皱越紧。
“周老师,”他喊,“您过来看看。”
周寻走过去。
陆方指着屏幕:
“有些公司的数据,能查到。像那些被借壳的,虽然壳换了,但历史数据还在。”
他往下翻:
“但有些,是真的查不到了。特别是2005年之前退市的,很多数据源根本没有保留。”
周寻沉默了几秒。
然后他说:
“能查到多少算多少。查不到的,想办法从其他渠道找。实在找不到的,也要知道‘有这家公司存在过’,不能假装它们不存在。”
陆方点头。
小林在旁边举手:
“周老师,那些找不到数据的公司,我们怎么处理?”
周寻想了想:
“两种办法。”
他走到白板前,写:
方法一:用同类公司替代
“找不到具体数据的,可以用那个时期、那个行业的同类公司数据做近似替代。虽然不精确,但至少能反映一个大致水平。”
方法二:做敏感性分析
“假设这些找不到数据的公司,表现比我们查到的差。差多少?10%?20%?跑几个不同的假设,看结果变化有多大。”
他放下笔:
“目的不是精确还原历史,是知道我们可能‘偏’了多少。”
小林点头,在本子上记着。
---
傍晚六点,陆方还在研究那些退市公司的名单。
他已经找到了87家公司的历史数据。还剩100家,怎么也找不到。
屏幕上,是那100家公司的名字——或者说,是曾经存在过的名字。
ST红光、PT水仙、ST九州、ST银广夏、ST生态、ST猴王……
有些名字,陆方听说过。那是当年轰动一时的造假案、退市案的主角。有些名字,他完全陌生,只是一个个冰冷的代码。
他盯着那些名字,忽然有一种奇怪的感觉。
这些公司,曾经也是无数人的希望。
有人在这里投过钱,有人在这里亏过钱,有人在这里赚过钱然后亏回去,有人在这里把一辈子的积蓄赔光。
现在,它们只是回测系统里需要补上的“数据缺口”。
“陆方,”周寻走过来,“还在看?”
陆
(本章未完,请点击下一页继续阅读)
『加入书签,方便阅读』