二、概念指数轮动策略构建2.1 样本数据由于在样本回测期间,相关的概念数据可能会比较多,在回测期间内统计所有的概念种类存在一定的难度,为了能够更好地研究概念数据与对应的舆情之前的关系以及策略的构建,本专题的概念板块数据来源于wind的概念板块的数据,一共包含安防监控指数等117个概念指数,概念指数的行情数据来源于wind的概念指数的收盘价数据,样本时间区间为2011年至2016年。相关的概念指数的历史舆情数据则通过搜索引擎、财经网站等互联网渠道获得。搜索引擎、财经网站等相关的概念数据能够很好地反映了概念热点的舆情信息。
2.2 相关性分析通过对概念热点的历史数据和概念热点历史舆情的数据进行相关性分析,得到相关的结论:概念热点历史数据和概念热点对应舆情数据在3阶滞后有很强的正相关关系,平均相关系数达到0.43,例如基因检测概念板块指数与对应的舆情指数在滞后3阶上的相关系数为 0.87,是很强的相关性。
此外,本篇专题报告策略所需数据还包括样本区间的沪深300指数收盘价。本篇报告中将策略的收益表现与同期沪深300指数表现进行比较。 2.3 策略原理基于概念指数和对应舆情数据的相关性分析,发现概念指数和对应舆情数据两者之间有较强的相关性而且舆情信息的变化要先于对应概念指数的变化。当某个概念指数的舆情指数涨幅较大时,说明该热点可能是近期的投资热点,受到了投资者的广泛关注。如果该概念指数还未出现明显上涨,那么它有较大可能在未来几天出现上涨。本专题策略以周为统计区间,每个时间区间内分别统计概念指数和对应舆情数据的涨跌,为了更好地度量概念指数是否出现上涨以及涨幅,本专题策略对涨幅设置阈值。当概念指数和它对应的概念板块指数涨幅同时满足高于或低于某个阈值时发出看多信号。为了能够更好地使资金分配于未来存在较大上涨可能的概念板块,如果有数目较多(多于n个)的概念指数同时发出看多信号,作进一步筛选。将初步选择出的概念指数按涨幅排序分成三挡,同时按舆情涨幅分成三挡,选择同时满足舆情涨幅处于最大的一档,对应概念指数行情涨幅处于最小的一档。如果筛选不出概念热点,放宽对指数涨幅的限制,直至筛选出概念热点停止筛选过程。选择出概念热点后固定持仓3个交易日后平仓。等待下一买入信号发出前,持有资产。
为更清楚地理解策略,以2015年1月19日—1月26日这一时间区间为例对策略原理做具体说明。观察到在2015年1月12日——2015年1月19日时间区间内,根据概念指数的舆情涨幅大于阈值A,概念指数涨幅小于阈值B,跌幅小于阈值C的选择标准,初步选择出了黄金珠宝指数等10个概念热点,10个概念热点的历史数据如下表所示:
|