证券市场内幕交易行为认识思索

时间:2022-04-27 02:52:00

证券市场内幕交易行为认识思索

一、引言

从2O世纪8O年代中后期开始,随着以现代金融理论和行为金融学为标志的金融经济学的迅速发展,有关内幕交易的文献大量涌现。由于内幕交易会对市场的有效性和个体利益产生影响,很多学者已将研究的重点放在了如何识别内幕交易方面。ScottL.Summers和JohnT.Sweeney(1998)率先对内幕交易行为进行判别,通过内部交易变量和公司具体财务特征,区分内幕交易与没有内幕交易公司,得到了60%的正确率。晏艳阳、赵大玮(2006)以股权分置改革中45家试点公司为样本,以累积超常收益率、相对换手率和公告效应以及内幕交易效应为指标,得出我国股改中存在严重的内幕交易的结论。张宗新(2008)应用数据挖掘技术,以2005年之前被我国证券监管部门处罚过的内幕交易案例为样本对内幕交易行为进行判别,应用支持向量机模型(SVM)对“股改”以来中国股市发生的“广发借壳”、“杭萧钢构”、“sT金泰”等重大内幕交易案例进行实证分析,对中国股市存在的内幕交易行为进行了预测和检验。唐其鸣、张云(2009)~足于公司治理视角,发现公司治理较好的公司,内幕交易发生的概率较低。

二、内幕交易识别的研究设计

本文以Logistic回归模型为基础,采用ScotL.Sum—mer8和JohnT.Sweeney的分层次分析法,在初步统计内幕交易案例的基础上,从股票市场表现、公司治理、财务状况三个方面建立系统的内幕交易识别模型,通过实证检验筛选出对内幕交易行为的有效识别因子,形成两个层次Logistic回归识别模型。并分析模型的识别效率。

(一)研究模型和方法选择

本文采用Logistic回归模型对内幕交易进行识别,Logistic回归模型在一定程度克服了线性假设的缺点,不要求变量服从正态分布而且具有判别精度高简单易与实现的优势。Logistic回归模型假设在给定识别体系各变量x(x=(x。,x2…之后,事件Y发生的条件概率为P。其中,Y取值为0和1,0表示事件未发生,1表示事件发生。在logistic回归模型下条件概率P服从如下形式:P=exp(+Bx)/[1+exp(0【+px)l(1)式(1)中,、13为待估计的参数向量。本文采用分层次分析法对内幕交易进行研究。根据指标的选择,对模型的建立分为两个层次涉及到四个独立的logistic回归模型。第一层次logistic模型分别是以市场表现、治理结构、财务状况指标为基础建立的三个模型。这三个代表第一层次的模型各产生一个综合性指数,取值在o_l之间,表示以该组变量为基础建立模型内幕交易发生的概率。第二层次的logistic模型是以第_层次得到的兰个指数综合而成,模型中三个指数的权重由logistic回归分析得出。这样做的优势是可以分别研究三类指标的贡献能力,最后又以综合的指数对内幕交易进行判别,这使得两层次的分析法优于单层次的logis~c回归方法。

(二)研究样本和数据

研究样本来自中国A股市场,分为内幕交易样本和正常样本。内幕交易样本是2005年至2010年股票市场上被证券监管部门调查、处罚的出现过内幕交易行为的上市公司;正常样本是没有被证券监管部门查处过的上市公司,并且与每个对应的内幕交易样本属于同一行业,资产规模上市年份相近,在同一年发生了同一类重大事件,没有被sT处理过。正常样本的构造是为了更进一步说个股指标的异常反应是由于内幕交易引起的,进而通过比较分析内幕交易行为的特征。两种样本各42个,共计84个。相关数据主要来自CCER数据库,数据的处理分析运用了SPSS软件。

(三)指标选择

根据对现有文献研究和理论分析,初步从股票市场表现、治理结构、财务状况三方面选取了59个指标,具体指标代码和名称见表1。其中,市场表现类指标是以信息公告前后3O个交易日的均值进行计算。波动性方面,采用适于股票波动性研究的GARCH(1,1)模型来拟合内幕交易股票的波动性,将。+B。作为股价波动持久性即系统稳定性的衡量指标。aI+B<1,则股价运行系统稳定;aI+8I≥1,则系统不稳定。在初步选取指标的基础上,为了从三类59个指标中剔除不存在显著性差异的指标,首先对这三类指标进行均值相等的独立样本t检验和非参数Mann-WhitneyU检验。在显著性水平5%的概率范围内,、、、、、X、Xh5、、XMn、xh“、X啪、XX)(c1、、、、、x、)(c通过了检验。由于在选样时,正常样本均为非sT公司,两类样本在)指标上的差异可能是由于选样造成的,为保证实证的准确性,在建模时不考虑x。本文将用这些指标分别作为建立内幕交易识别模型的初始变量。

三、全流通背景下内幕交易识别模型的建立与检验

基于前文对三类指标的分析,本部分选择通过检验的指标建立模型,并对模型识别效率进行检验。

(一)存一层次模型的建立

考虑到识别指标间可能存在相关性,本文采用可以消除多重共线性影响的向前逐步排除法选择模型变量,根据置信水平小于5%进入模型的原则构建Logistic回归模型。

1.市场表现Logistic识别模型.市场表现Logistic识别模型以通过检验的市场表现指标为基础建立,具体参数见表2。Logistic回归的结果显示,累积超额收益率CAR、日均换手率和BETA系数这三个指标为市场表现模型的有效识别因子。

2.治理结构Logistic识别模型治理结构Logistic识别模型以通过检验的治理指结构标为基础建立,具体参数见表3。

3.财务状况L0gistic识别模型财务状况Logistic识别模型以通过检验的财务状况指标为基础建立,具体参数见表4。

(二)第一层次模型识别效率的检验与分析

以建立的三个方面识别模型为基础,将两种样本相应指标数据代入模型,得到内幕交易行为的识别概率P,若p≥0.5该样本发生内幕交易行为,若P<0.5该样本没有发生内幕交易行为。模型识别效率的检验见表5。可见,市场表现指标的判别正确率为85.71%。公司治理指标的判别正确率为95.24%,财务状况指标的判别正确率为75.0o%。

(三)第二层次模型的建立

第二层次Logistic识别模型以第一层次识别模型得到的识别概率为基础建立,通过向前逐步排除法选择模型变量,具体参数见表6。

(四)第二层次模型的识别效率的检验与分析

以建立的第二层次识别模型为基础,将两种样本相应数据代入模型,得到内幕交易行为的识别概率P。模型识别效率的检验见表7。可以看出,第二层次回归模型判别的正确率为97.62%,高于单一层次每个模型的识别效率。

四、结论

以累计超常收益率、日均换手率、BETA系数、第一大股东持股比例、Herfindahl_5指数、股东大会出席率、净资产收益率等指标建立的两层次内幕交易识别模型对内幕交易的识别具有较高的识别效率,正确率达到97.62%。