机器学习ST股票预测模型(企业建模_论文建模定制服务_信用评分卡等多算法实现)

知己知彼,百战不殆;不知彼而知己,一胜一负;不知彼,不知己,每战必贻。--《孙子兵法》谋攻篇

ST股票

ST股票是指因连续两年净利润为负而被暂停上市的股票,其风险较高,投资者需要谨慎对待。这些公司可能面临着特殊的财务困难或其他问题,因此被市场视为风险较高的股票。投资者在购买ST股票时需要谨慎,充分了解公司的情况和风险,以便做出明智的投资决策。

图片

中国知名的ST股票案例

东方航空股票(600115.SH):2014年因连续两年净利润为负而被暂停上市,之后进行了重组并于2015年重新上市。

华闻传媒股票(000793.SZ):2014年因连续两年净利润为负而被暂停上市,之后进行了重组并于2015年重新上市。

金亚科技股票(600586.SH):2018年因连续两年净利润为负而被暂停上市,之后公司被曝出涉嫌财务造假,目前仍在重组过程中。

中国南方航空股票(600029.SH):2001年因连续两年净利润为负而被暂停上市,之后进行了重组并于2002年重新上市。

亚星客车股票(600213):2016年因连续两年净利润为负而被暂停上市,之后公司被曝出涉嫌财务造假,目前仍在重组过程中。

康美药业(600518.SH):康美药业本是中药地道药材提供商,品质较好,属于业界知名企业。但披露的2016至2018年财务报告存在重大虚假,涉嫌违反《证券法》第63条等相关规定。一是使用虚假银行单据虚增存款,二是通过伪造业务凭证进行收入造假,三是部分资金转入关联方账户买卖本公司股票。近日,证监会已对康美公司对应的审计机构正中珠江会计师事务所涉嫌未勤勉尽责立案调查。

图片

提前预测股票ST概率,减少投资风险

无论是散户还是机构,股票投资存在多种风险,包括:

市场风险:股票市场受多种因素影响,如宏观经济状况、政治事件、自然灾害等,这些因素可能导致股票市场整体波动,从而影响投资者的收益。

行业风险:不同行业的股票受到行业特定因素的影响,如技术变革、市场需求变化等,这些因素可能对公司业绩产生影响,从而影响股票价格。

公司风险:公司管理层问题、财务状况、竞争压力等因素都可能对公司业绩和股价产生影响。

财务风险:公司的财务状况可能受到负债率、现金流等因素的影响,财务风险可能导致公司经营不善,进而影响股票价格。

个股风险:每只股票都存在自身的风险,如公司业务模式、管理团队、产品竞争力等,这些因素都可能对股票价格产生影响。

市场流动性风险:市场流动性不足可能导致投资者买卖股票时出现困难,从而影响投资者的交易决策。

ST股票风险:ST股票是明确因连续两年净利润为负而被暂停上市的股票,属于最大风险之一。如果我们能通过建立机器学习模型,量化计算上述企业股票数据,提前预测股票st概率,就能很大程度降低股票投资风险。

人工智能机器学习建模-st股票预测模型案例

Toby老师提供st股票预测模型,用于人工智能机器学习相关证券公司模型预测,企业建模,研究生,博士生论文等等。

图片

数据一览

该项目涉及几千只上市企业股票,覆盖十年以上历史数据,有数万数据集,是非常优质数据。

图片

该项目数据集经过多年累积,包含几十个上市企业财务数据变量,流动比率, 速动比率, 现金比率, 资产负债率,权益乘数,长期资本负债率,应收账款与收入比,应收账款周转率,存货周转率,应付账款周转率,营运资金(资本)周转率等等。

模型性能

由于前期做了大量数据收集准备工作,模型拥有几十个上市企业财务数据变量,模型准确率accuracy大于0.96,AUC接近0.95。这只是初步实验结果,通过多算法比较,调参,变量筛选,模型性能还有提升空间。模型性能非常优越,非常适合各大证券机构预测使用。

如下图模型AUC接近0.95,模型区分好st股票能力优越。

图片

ks大于0.76,模型区分好st股票能力优越。

图片

信用分数

在美国,FICO 评分,通常称为信用评分,是一个三位数的数字,用于评估一个人在获得信用卡或贷方贷款时偿还信用的可能性。FICO 分数还用于帮助确定提供给个人的任何信贷的利率。FICO 分数范围从 300 到 850(从最差到最好)。每年 FICO 分数(Fair, Isaac and Company)都被各个金融机构和组织广泛使用,可以说是一个人信用好坏的很重要的评判标准。不论是贷款的成功与否还是贷款的利率与优惠,都与你的 FICO 信用分数息息相关。事实上,90% 的金融机构都会参考 FICO 分数来做决定,FICO 分数的重要性可见一斑。

图片

我们多股票st预测模型建立好后,也可以效仿建立类似FICO的信用分数,如下图。

图片

股票st预测模型信用分数分布图如下,主要集中在700分左右。股市信用评分整体较好,信用分数最高股票达到907分,最低的股票信用分只有461分。

图片

计算出股票信用分数后,散户和机构就可以购买信用分数高的股票,避开信用分数低的股票,进而减少投资风险。

上市股票财务变量可解释性

机器学习可解释性是指机器学习模型的输出结果能够以一种可理解的方式被人类理解和解释。这一点对于许多应用非常重要,尤其是在需要对模型的决策进行解释和理解的场景下,比如医疗诊断、金融风险评估、司法决策等领域。

机器学习模型的可解释性有助于增强信任:当人们能够理解模型是如何做出预测或决策的,他们更有可能对模型的结果产生信任。

机器学习模型的可解释性主要通过特征重要性分析和可视化技术实现。

特征重要性分析:通过分析模型中各个特征对最终预测结果的影响程度,来解释模型的决策。可视化技术:通过图表、图像等可视化手段来呈现模型的工作原理和决策过程。

下图是对上市股票财务变量重要性排序,找出对股票st风险最大变量因子。

图片

我们对变量可提供充分解释性,例如下面是第一大股东持股比例SHAP值计算。

第一大股东持股比例越高,股票st风险越大;第一大股东持股比例越低,用股票st风险越小。

图片

从机器学习模型分析出第一大股东持股比例是股票st重要风险因子。我们接着从业务上交叉验证。最典型例子莫非恒大许家印。

中国恒大

恒大(03333)股权的构造从公布的信息来看许家印拥有恒大集团61.88%股份,后来降到59.84%的股份,丁玉梅拥有5.05%的股份。该数据收集于2022年9月6日。许家印在中国恒大第一大股东持股比例如此之高,恒大早就报道暴雷,烂尾楼,给社会造成极大负面影响。

许家印是恒大汽车的控股股东,持有约67%的股份。许家印在恒大汽车第一大股东持股比例如此之高,恒大汽车也是负债累累,舆论负面新网占据主导。

许家印是广州恒大淘宝足球俱乐部的主要投资者,持有约56%的股份。自2018年5月3日起,俱乐部挂牌新三板的证券简称由“恒大淘宝”变更为“ST恒宝”。

截至2021年9月,恒大集团董事长许家印持有恒大金融集团有限公司(以下简称“恒大金融”)100%股权。至今恒大金融暴雷违约不断,高管被抓。

上述业务信息交叉验证了我方公司模型对变量解释可靠性。

备注一下第一大股东持股比例主要用于民营企业参考,并不适合国有企业。

模型部署

模型可以封装为一个包,上传到服务器应用。

我方模型可以部署到web服务器,手机移动端APP,平板电脑APP,实现商业化应用,无论机构还是散户都可以使用股票st预测模型。模型还具备快速批量预测多只股票功能,高效,快捷,准确。

模型商业化应用

用户通过web服务器,手机移动端APP或平板电脑APP使用股票st预测软件。用户输入股票名字,软件自动输出股票信用分数,散户和机构就可以购买信用分数高的股票,避开信用分数低的股票,进而减少投资风险。

例如用户输入股票A名称,软件输出信用分为841分,则该股票st概率很低,可作为购买的依据之一。

 

用户输入股票B名称,软件输出信用分为356分,则该股票st概率很高,建议不要购买此股票。

模型除了能输出股票信用分数,还能输出该股票st的概率,概率值从0-1分布,概率越接近1,st的概率越高。

机器学习ST股票预测模型就为大家介绍到这里。如果对此项目感兴趣,例如论文,专利,银行建模,企业建模,企业调研需要,可联系我方公司,商务咨询请留言。

欢迎学习更多风控评分卡建模相关知识《python信用评分卡建模(附代码)》,我们提供专业评分卡模型等知识,实现自动化信用评分功能,打造金融风控信贷审批模型,降低风险。

原创Toby老师,来源公众号:python风控模型,机器学习ST股票预测模型

猜你喜欢

转载自blog.csdn.net/toby001111/article/details/135081643
今日推荐