APP下载

基于聚类分析的股票价格状态和变化探究

2018-07-12陈金林

时代金融 2018年35期
关键词:股票价格相似性聚类

陈金林 杨 林

(广东外语外贸大学南国商学院,广东 广州 510545)

一、股票价格序列和聚类分析

股票价格序列是股票价格时间序列的简称,指将股票在不同时间上的交易价格数值,按时间先后顺序排列而形成的序列。构成要素:时间,股票价格数值。

根据实际的股票交易价格成交技术和计时技术,在股票交易时间内可以找到一个股票交易价格形成所需要的最小的时间单位,这个最小的时间单位称为单元时间,任意有限时间是单元时间的整数倍。为了更好地分析股票价格序列,结合股票价格和时间的联合分布,即任意给出由较多的单元时间组成的时点的集合,考虑股票价格序列的联合分布。该分布为有限维数联合分布。

利用大数据挖掘技术的聚类分析对股票价格序列分析时,必须对聚类分析做适当的修正,以便采用聚类分析。通常来讲,聚类分析是按照某种相似程度度量方法将数据分成互不相同的分组(集合),每一个分组中的数据相近,不同分组之间的数据差异较大。即通过聚类后,每一聚类内部的相似性很高,而各聚类之间的相似性很低。

由于股票价格序列是时间序列,在进行聚类分析时只能按照时间先后顺序进行聚类。从聚类分析的角度看,把价格序列分成了四类各不相同的小组。每个小组由若干个单位时间内的价格数据组成,这些数据的相似性很高,相邻小组之间的价格数据相似性很低。

二、股票价格状态和变化理论探讨

本文在分析数据时,没有使用非结构化数据,运用的算法力求适应结构化数据,因此计算后得到的数据均为标称数据。

对股票价格流数据采用流计算的方法实时地进行处理。沪深交易所的计算机对买卖双方的报单进行撮合,每次成交的价格等数据以流的方式进入计算机中的集群,集群中的处理单元对实时股票成交价格等数据进行提取、过滤和分析等操作,最后得到每次成交的价格等数据,供使用者聚集、利用。

通常股票价格序列不具备明确的状态和变化的属性,可能是由于数据非常大,可能是股票价格的随机性,也可能是实时成交价格没有参照,需要使用动态模型对实时数据的数量归约,同时对历史数据也进行数量归约。再对数量归约后的数据进行数据转换,数据被变换成统一适合研究的形式。数量归约和数据转换没有前后顺序要求,视投资业务实际需要的具体情况而定。可用替代的、较小的数据表示形式替换原数据,但是要接近于保持原数据的完整性。

对股票价格序列按照单位时间分组,每一组为五个观测值,经数量归约和数据转换后,五个属性可以在数据矩阵和相似矩阵上进行研究。之所以选择相似性矩阵,与我们度量数据相似性和相异性的邻近度的方法有关,多个对象两两之间的相似度的算法结束后,所有的相似度通常用一个对称矩阵表示。一般而言,价格序列矩阵是一个非负的数值,对象之间彼此高度相近或者“接近”时,其值接近1。特别当等于1时,即一个对象与自己的相似度非常大,完全相同,差别为0。对象越不同,该值越小,其值接近0,说明对象彼此相异,差别非常大。

数据矩阵由两种实体组成,即:行代表单位时间的价格这一对象,列代表这一对象的属性。相似矩阵,只包含一类实体,表示多个单位时间里同一只股票的若干个价格两两的相似性度量。一般把数据矩阵转化为相似矩阵,分析将在相似矩阵上运行。

三、股票价格状态和变化实证分析

(一)股票价格状态实证分析

1.股票价格状态的内涵。股票价格状态,是指股票的价格通过聚类算法来度量,相似度在相对较长时间内持续保持较高的近似不变的状况,称之为价格状态相似,相似度在一定值以下,称之为价格状态相异。

像这样同一只股票连续较长时间内,价格相似性高的时间序列价格数据排列在一起时,表明价格状态相似,股票价格具有状态的性质。

2.股票价格状态的实证分析。以上交所某股票为例,选取2018年7月24日——10月26日62个交易日的一组股票价格量:开盘价、最高价、最低价、收盘价和扰动项做该股票的价格状态实证分析。

先对股票价格量进行数据规约和转换,然后进行相似度计算。实证发现:

7月24日-8月8日、8月28日-9月12日、9月27日-10月16日在这三个时间段,相似度较高;8月9日-8月27日、9月13日-9月26日、10月17日-10月26日,这三个时间段的股价的相似较高。

但是,7月24日-8月8日和8月9日-8月27日这两个连续时间段内的相似度虽然较高,但是有一个由大变小再变大的过程。相同现象的时间段还有8月28日-9月12日和9月13日-9月26日、9月27日-10月16日和10月17日-10月26日。

说明股价有保持状态不变的性质,也有变化的特点。

(二)股票价格变化实证分析

1.股票价格变化的内涵。股票价格变化,是指股票价格通过聚类算法来度量,相似度在相对较短时间内由较高值变成较低值,然后又变成较高值的情形。这种由较高相似度变成较低相似度或者由较低相似度变成较高相似度的过程,称之为股票价格变化相异。

2.股票价格变化的实证分析。利用相同的数据,先对价格量进行数据规约和转换,然后进行相似度计算。

在7月24日-8月8日和8月9日-8月27在这两个连续的时间段内,价格相似度由高变低,然后又变高,表明价格状态被破坏,说明价格发生了变化,和股票市场的实际情况相吻合。

股价开始处于状态相似中,但是在紧接下来的单位时间里,相似度由较高变小,表明此时的价格数据与先前状态中的数据相异,即认为股票价格变化相异,股票价格具有变化的性质。

紧接着,相似度又变大,表明股市行情将发生改变,价格将往新的状态发展。价格发生短暂变化后,股市行情将持续,价格将保持具有状态的性质。股价新状态的出现是以相似度相异的出现为前提,以价格的变化为结果。

四、结论

(一)价格状态和变化的异同

从上面的分析中,可以得知股票价格既有状态的性质,又有变化的性质。价格状态和价格变化既是统一的,又是对立的。价格序列之间的状态既可能相似,又可能相异;它们的变化既可能相似,也可能相异。实践证明,如果价格状态相似,价格变化将受到价格状态的约束,但是并不能保证价格变化相似。如果价格状态相异,价格变化既可能相异,也可能相似。

(二)待解决的问题

本文在分析时采用大数据聚类算法的技术,根据相似性,对价格序列聚类,确定价格的状态;根据邻近的相似度,确定价格的变化。实际操作中,如何确定股票价格状态和变化的情况远比理论分析要复杂得多。如数量归约采用回归技术的话,就会涉及传统计量经济学严格的条件限制,虽然推理和计算严谨,但是也会使原始数据丢失很多有用的信息。度量数据的相似性和相异性时,相似度计算方法非常多。由于数据的平均值是动态的,计算出来的相似度如果大于临界值,相似的效果很明显。当相异度用相似度的函数表示时,度量相异度的效果不理想。总的来讲,在技术和方法上需要解决的问题很多。

猜你喜欢

股票价格相似性聚类
一类上三角算子矩阵的相似性与酉相似性
基于GARCH族模型的重庆啤酒股票价格波动研究
浅析当代中西方绘画的相似性
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
低渗透黏土中氯离子弥散作用离心模拟相似性
论股票价格准确性的社会效益
我国股票价格指数与“克强指数”的关系研究
一种层次初始的聚类个数自适应的聚类方法研究
基于多元回归与技术分析的组合股票价格预测