深圳证券交易所技术规划部杨振新:建立更加高效的行业科技创新路径和方法 赋能行业数字化创新

  金融界网站讯 由中国期货业协会、深圳市期货业协会主办的“2020年第16届中国(深圳)国际期货大会”于12月19日采用线上、线下相结合的方式举办。

  这是一年一度期货行业最重磅的会议,证监会副主席、期货业协会会长、四大期货交易所和沪深交易所总经理,以及头部期货公司董事长云集第16界中国(深圳)期货大会,金融界作为合作媒体全程报道,为关心中国期货业发展的投资者带来最前沿的监管思考以及行业动态变革。

  本次会议分论坛四以“金融科技与期货行业融合发展”为主题,着眼于当下金融科技和期货行业融合发展中的一些关键性问题,聚焦于金融科技对期货行业服务模式、竞争格局、监管等各层面的影响而展开。

  深圳证券交易所技术规划部杨振新博士在会上发表了题为《证券期货业金融科技研究发展中心创新研究成果及行业应用》的演讲。首先,杨振新对金融科技中心做了详细的介绍。

  金融科技中心全称是证券期货业金融科技研究发展中心(深圳),是经中国证监会批准,由深交所建设运营,以服务行业为导向,聚焦金融科技创新发展的行业公共研究平台。于2017年12月4日在深交所2017年技术大会上正式揭牌运作,受到了市场相关机构的高度重视和积极参与。金融科技中心的职责主要包括课题研究、关键技术及设施研发、行业交流与人才培养等。

  除了推动建立行业内机构的协同创新,还与腾讯、华为等行业外的科技企业展开战略合作,此外还和高校建立了广泛深入的合作。

  其次,演讲中杨振新也分享了证券期货业金融科技中心的创新研究课题。

  杨振新表示,目前金融科技中心已经组织了3期143项行业新技术课题研究,取得了较好的成绩,一些成果已落地应用。例如在企业画像、金融文档语义分析、智能投研创新、行业区块链、证券文本抽取等方面。未来将在此基础上进一步总结优化完善,建立起更加高效的探索预研工程落地和推广应用等行业科技创新路径和方法,从而赋能行业的数字化创新。

  杨振新对金融科技中心近三年的立项课题进行了分析,发现整个行业对金融科技应用的关注度逐年提升,开展金融科技创新的课题数量和参与机构数量逐年增长。从2018年的35项到2019年的47项,再到今年快速增长到64项,课题参与机构的数量也从2018年的18家增长到今年的25家。机构类型从原有的大型券商向中小型券商、基金公司乃至其他金融机构扩展。杨振新认为,行业机构对金融科技中心研究课题工作的参与度在一定程度上能有效反映证券期货行业在金融科技领域的创新应用情况。

  另外,对金融科技中心三年来立项课题的研究领域也进行了大致分类。可以观察到行业在前沿技术研究和创新应用场景的主要方向,其中安全运营领域的研究增长领先,区块链技术的研究应用在监管政策不明朗和守正创新的背景下仍未出现显著增长。利用人工智能技术提升服务质量和服务效率是近两年来行业机构的研究热点,因此智能服务和智能监管领域课题的数量仍然保持高位。

  在技术革新方面,IT治理领域是行业技术应用的关键场景,其中在IT运维、架构管理、体系安全和数据治理方向有较大的探索,从被支持各应用场景的技术手段选择来看,绝大多数课题采用人工智能数据治理技术,大数据、区块链等新兴技术,其中人工智能领域的相关课题数量超过了50%。同时随着人工智能、大数据落地应用的加速,行业对数据质量、数据标准、数据服务体系等领域的治理需求显得越来越迫切,因此在数据治理体系和技术应用方面的投入有明显的提升。

  同时,杨振新也列出了部分课题研究机构和课题名称,比如东方证券的智能运维课题,中信建投的信息安全课题,长江证券的宏观和行业风险预警等,体现出行业机构在开展课题方面的连续性及深入性。

  会上,杨振新也分享了三个案例,展示了金融科技与证券期货行业融合发展的成果。对于介绍的三个典型案例,他表示都具有同样的特点。

  第一个是深交所开展的研究。基于知识图谱的资本系挖掘,是深交所为了内部的监管业务开展的课题研究。

  数据规模对于资本系的挖掘非常重要,要不断地提升数据质量和规模。因为在知识图谱中,密集图的资本系识别效果会比稀疏图要好,资本系挖掘产生的数据类型就包括深交所的内部数据和外部数据,数据的消歧非常重要,对内部的上市公司数据和外部的其他工商数据进行了整合。此外,历史的信息对资本系的挖掘也非常重要,因此在架构和存储等方面需要进行特殊的处理。

  资本系挖掘的难点包括两部分,一是数据的缺失,二是效果评价。数据缺失主要会导致股权关系难以穿透,影响实际控制人的挖掘以及资本系的生成。效果评价方面,还缺乏标准的测试集,同时资本系要考虑时间维度,随着时间变化资本系的结构其实是在不断变化的。对于这两个难点,可以通过改善数据质量和专家支持来解决。

  那么,对于资本系到底是怎样基于工商数据挖掘出来的,杨振新也介绍了一下挖掘算法。采用的挖掘算法以股权关系为基础,勾勒资本系的轮廓,向上找出其核心主体,向下筛出资本系控股参股的上市公司,并延伸拓展资本系的其他关联企业。主要分为两步,第一步是根据较强的关联关系找到资本系的初始集和资本系的核心。第二步在初始集的基础上通过前十大股东的持股和持股关系向外扩展,找到资本系的全集。

  第二个是市场机构开展的研究。是海通证券依托金融科技中心开展的金融文档智能语义分析研究应用。

  资本市场因存在着大量的文本信息,比如公告、年报、新闻等,光靠人去看是看不过来的,因此自然语言处理技术具有很重要的应用价值。海通证券的课题实际上就是借助自然语言处理技术,对文档进行智能化的分析,辅助业务人员开展文档审核工作,减轻业务人员的负担。

  该课题成功应用在债券募集说明书审核,主要实现了对四类错误的自动发现,语义错误识别是指对文字错误方面的识别,具体包括常见的错别字,比如说类音错字、形错字、同音错字、可疑错字等。标点错误主要是中英文标点符号混淆,标点缺失等等。还有一些语法的错误,比如说语句不通、表达不完整等等。一致性的检验是查找校验同一篇文档上下文的数据指标的一致性,因在同一篇文档里面可能在不同的地方都提到了数据,通过一致性检验是不是对的。

  第三个是行业产业链图谱共建项目,是深交所组织协同多个市场机构共同开展的研究工作。

  杨振新首先介绍了产业链图谱的用途,包括企业研究、行业研究、风险传导、风险预警、智能资讯等。比如在行业研究方面,借助产业链图谱数据模型与方法,提供辅助的自动化行业研究分析功能。

  另外,制订了五个共建标准体系,分别是业务标准、数据标准、技术标准,应用维护机制以及工作机制。对于本课题数据模型就是引入了本体的概念,对领域知识进行旗帜化的描述,主要是由概念、关系和属性来组成。

  杨振新介绍,目前的进展是已构建了20条申万一级行业产业链数据,课题参与单位包括国信、中信、申万宏源、国泰、华创、招商、广发、博时、深证信息、恒生研究院、数库科技。

  最后,杨振新表示,金融科技中心经过三年的发展取得了一定的成绩,今年是资本市场建立30周年,“十四五”规划的启动之年,金融科技中心会再接再励,致力于打造行业一流的金融科技研发、创新、应用平台,具有完备的行业金融科技平台设施环境,形成强大的行业金融科技创新应用能力,提供优质的行业金融科技服务功能。

关键词阅读:深圳证券交易所 杨振新

责任编辑:Robot RF13015
精彩推荐
加载更多
全部评论
金融界App
金融界微博
金融界公众号