银行间市场全生命周期的智能化交易
中国外汇交易中心
银行间市场即时通讯平台 (iDeal)
一、场景简介
中国外汇交易中心在人民币国际化国家战略加速推进的背景下突破性地进行金融模式创新,面向全球金融机构推出金融市场开放交易生态新工具 —— 银行间市场即时通讯平台 (iDeal)。该平台旨在打造银行间市场互联网流量入口和开放服务平台,依托于银行间市场实名可信认证,帮助市场交易者防范监管风险,将交易中心服务向外延伸,集协商、交易、社交于一体,提供桌面移动跨平台全覆盖的一站式交易生态,实现 7×24 无间断市场接入,突破银行间市场交易的时空限制,有效促进市场深度链接关系,填补银行间市场可信社交和生态社群的空白,助力人民币国际化进程稳健推进。
银行间市场即时通讯平台 (iDeal)
二、建设内容
1、生物信息识别
在金融市场开放交易中,安全始终是第一位的。iDeal 身份认证技术的安全性是维护信息系统安全和网络安全的首要通道,是交易协商中信息安全的保证。iDeal 可通过建立生物特征识别模块,支持指纹和人脸识别,让登陆更加快速,系统更加安全。
2、智能推荐与潜在交易机会挖掘
基于 iDeal 独有的非结构化用户生成内容,例如聊天文本和语音等,构建银行间市场语料库。基于该语料库挖掘用户交易模式,为用户提供情景化、个性化债券、对手方、行情、指数等推荐服务。通过扫描数百万个数据点,根据定价、易用性和风险,几秒钟内就能过滤掉大量未偿还债券,建议买入和卖出最好的债券,识别投资组合经理所需的潜在交易,并能够发现人为失误,寻找流动性,加快交易速度,并应对风险。
3、债券基础要素识别
依靠 NLP 自动识别债券要素,结合 iDeal 聊天窗口右面版,展示识别出的债券深度信息,在聊天过程中,默默为用户提供辅助信息,使得用户操作更便利,沟通效率更高效。更进一步,可自动识别聊天意向中的意向成交信息,分解成各个关键要素,实现从在线交易沟通、到交易信息的汇总和处理、再到机构内部协同工作流程的智能化,来帮助交易员更 “ 聪明 ” 地交易。
4、智能聊天机器人
智能交易是聊天机器人技术一项应用,已成功在 iDeal 上落地服务银行间交易。2019 年 9 月网商银行发布了与中国外汇交易所做的交易机器人,完全替代金融市场交易员的交易工作,同时可以更好地防控信用风险、价格风险和操作风险。日常工作中, 交易员的大量时间用在打电话、询价、交流、匹配、提单、中台审批、后台记账,配置了智能交易聊天机器人后,这类交易操作基本被交易机器人替代。
智能聊天机器人功能图谱
5、市场监测与信息披露
iDeal 通过人工智能等技术手段,建立了及时、高效的后续管理监督系统。主承销商通过信息披露系统和后续管理系统,可以时刻监督发行企业业务开展情况,并通过信息披露功能向市场进行信息的公开展示。
三、建设成效
技术能力逐步沉淀。iDeal 通过引入 AI 专业人才,建设全面的技术体系,在场景化的实际问题中不断沉淀团队技术能力,保持产品的行业优势。
开放能力不断积累。iDeal 以“ 开放的思维、业务和技术” 为核心,颠覆传统模式, 构建开放生态,基于标准化及平台化发展目标,探索市场成员与 ISV 服务商之间的创新合作模式。
数据积淀服务智能。应用逐步积累的海量非结构化用户生成内容,例如聊天文本和语音等,可用于构建银行间市场语料库,为不断提高系统识别、推荐准确性提供源源动力。
基于 DLRM 模型的银行间市场智能交易推荐
一、建设内容
为了实现交易标的及对手方推荐的业务场景,需要利用交易系统中的用户行为特征进行分析,根据不同的场景选择适当的人工智能推荐模型,在业务特定设置的过滤条件下,为交易主体提供推荐列表。同时,通过用户数据的埋点机制和反馈机制,对推荐模型的效果进行评估,采用迭代方式不断优化推荐系统,提高推荐的准确性和多样性。考虑到做市机构为全市场提供流动性的特殊地位,因此在考虑用户之外,还需要对做市机构行为进行单独推荐模块的评估分析。
二、建设成效
提高银行间市场的交易效率。交易标的与交易对手方推荐可以起到为交易员筛选市场信息的作用,作为辅助决策工具,改善交易员决策效率。
改善银行间市场的流动性。智能交易推荐可以打破发行时间远近的束缚,通过债券内在属性与市场成员交易行为,挖掘“ 热度” 低、难以被发现的债券标的,盘活长尾市场, 提高新颖性。
挖掘数据价值。智能推荐除用于推荐交易标的及对手方外,还可以对市场成员的交易行为、市场情况进行整体分析与刻画,为用户画像等其他人工智能项目提供数据支撑。
基于舆情分析的市场风险管理
一、建设内容
|
|
|
基于舆情分析的市场风险管理原型设计
基于舆情分析技术的市场风险管理的应用需求,整合了各类相关的舆情信息,并改进了通用领域的舆情分析技术、结合交易中心特有领域的知识积累,实时地进行银行间市场舆情分析,帮助发现舆情信息中暴露出的负面风险点;同时通过知识图谱构建交易网络,在交易网络中基于图游走、推理等算法,及时判断风险点在网络中的风险传染路径与传导指数,辅助监测人员进行市场风险走向预判,同时可基于走向发布市场情绪指数。建设主要内容包含舆情分析、交易网络构建、风险预判。
二、关键技术
1、基于预训练语言模型及注意力机制的小样本舆情分析技术
该场景中将借助基于BERT 语言模型的迁移学习以获得通用领域的语言解析能力。通过BERT 语言模型的迁移学习外加注意力机制,可为上层模型提供特征自动提取工作, 泛化能力强,已训练的数据集与现任务特征相似性较高,尤其适用于小样本数据场景, 这对于全新无样本积累的领域是极其友好的。
2、基于知识图谱技术构建银行间市场交易网络辅助风险传染路径预判技术
在实际场景运用中,舆情分析的目标将包含但不仅限于金融文本,新闻舆情、社交类数据等,也可以协助补全交易决策视野。其中,金融类文本主要包含如发行公告、财报、信用评级等,新闻舆情多为宏观信息发布、金融事件披露、国家调控政策等,而社交类数据则包括聚焦金融论坛、新闻门户等自媒体频道。
3、基于交易中心积累的领域特征辅助舆情分析,发布市场情绪指数
在 BERT 预训练语言模型上层,将选取 TextCNN 算法基于交易中心积累的领域知识进行舆情分类模型的训练,TextCNN 在 BERT 语言模型提供的特征基础上,可更好地捕捉特征间的局部相关性,在小样本数据分析上具有一定优势。此外,银行间市场各舆情信息来源渠道中的文本信息多具备一定的领域特征,该场景中专家对此构建领域知识后,沉淀出供实际应用的领域特征库,便于在舆情分析预测的基础上查缺补漏,为监测人员提供更精准的分析结果。同时基于交易中心具备的领域内专家知识,发布具有指导意义的市场情绪指数,便于市场用户更全面地分析、决策。
三、建设成效
在交易全生命周期中引入舆情分析,一方面可预判风险点及风险传播途径,可视化地辅助监管人员快速定位风险点并分析风险发生的可能性,大幅提升市场风险预警的智能化程度与准确性程度,促进市场监管流程的智能化变革。另一方面,舆情分析可以提高银行间市场的风险管理效率和质量,确保银行间市场的稳健运行,保障各会员机构的切身利益,通过智能化监测,可培养大量掌握监管科技的专业人才,提高行业总体技术水平,为防范金融风险提供重要保障。
基于 OCR 技术的交易要素识别
一、建设内容
场景建设内容主要包括三个方面:预处理、要素识别和信息校对。预处理阶段,将各类交易要素文件整合,针对不同特征的交易要素文件进行图像分类,各要素文件类别对应特定的、更加聚焦的处理方式,可有效地针对性提升精度。
在要素识别阶段,改进了通用的 OCR 技术,融合特征提取算法、端到端文字识别模型、及迁移学习等,构建了基于 CRNN+CTC 的增强文字特征识别算法,通过级联学习最终集成为面向银行间市场交易要素识别的多策略融合模型,识别出交易要素单据中核心内容。
信息校对的最终目的是提升模型准确率,辅以交易中心独有的银行间市场领域知识库作为要素识别的额外知识,做进一步预测和校对,解决了通用 OCR 技术在特定市场泛化性不足、识别准确率不高等问题,形成了高精度银行间市场交易要素识别方案。
二、关键技术
1、基于 CNN 卷积神经网络,在识别之前对交易要素图像的分类
为了进一步提升模型对不同格式文件的识别性能,该场景中将交易要素图像基于展现形式分为几大类,并通过 CNN 卷积神经网络训练不同类型图像的专用分类器。分类后的图像,将被有针对性地进行识别,平衡泛化性与特殊性的同时提升识别精度。
2、基于端到端不定长文字识别的 CRNN+CTC 增强文字特征提取
针对交易指令单中出现的不定长文字识别、图像质量过差、扭曲畸变等问题,通过 CRNN+CTC 提升文字提取的效果。CRNN 配合一定的数据样本,可有效提取图像卷积特征并进一步提取序列特征,并增强文本特征提取的鲁棒性,使模型在面临交易要素图像模糊、扭曲、畸变、复杂背景和光线不清等问题时均可以表现良好的鲁棒性。CTC 主要用于解决输入特征与输出标签的对齐问题,如指令单文字的不同间隔或变形等问题, 导致同个文字有不同的表现形式。
3、基于银行间市场领域知识积累进行识别校验
基于以上各策略的识别方案已经具备较高的准确率,然而缺乏专家经验层面的知识指导,无法在整体层面上提升要素提取过程的语义一致性。交易中心作为银行间市场的提供方,天然地积累了大量的领域内知识经验,该场景中通过将此类知识经验构建知识库,在单词检测结束后可基于识别上下文做对应的文本匹配,并基于其语义关系进行概率化推理,从而进一步提升了要素识别精度,减少了人工校对的工作量。
三、建设成效
在该场景中引入的 OCR 智能化识别技术,作为交易中心智能化交易过程的重要一环,实现交易要素及时准确的被智能化提取,可以大大提高银行间市场交易效率,增强市场整体流动性,促进货币政策有效传导。
基于 OCR 智能化识别技术构建的银行间市场交易要素识别技术,可沉淀出针对银行间市场图表信息识别抽取的较为通用的解决方案,并可以服务封装的形式推广至各银行间市场参与者的具体应用场景中,帮助其实现要素、图标的快速识别,有助于银行间市场效能价值的提升,推动整个市场的智能化发展水平。
基于 NLP 技术的市场信息披露
一、建设内容
NLP 智能知识抽取技术主要应用于数据采集模块,对非结构化文本数据进行智能识别和知识抽取,将不同形式的非结构化文本数据转换成结构化数据,挖掘出更有价值的信息。该场景中基于中汇大数据平台的存储和计算能力,实现文本抽取、阅读理解模型、实体识别、实体消歧等 NLP 处理流程,将海量的非结构化数据转换为结构化数据,并通过容器化部署方式支撑知识图谱,智能问答、舆情分析等多个智能金融场景。建设总体解决方案如下。
业务应用层 |
Web UI |
可视化引擎 |
REST API |
|
智能客服
用户画像 |
智能监管 舆情分析
智能推荐 知识标注 |
|
金融图谱 |
二、关键技术
1、大数据基础能力解决海量文档的知识抽取问题
该场景中利用大数据基础能力构建了基于 NLP 技术的智能知识抽取方案,解决了对海量金融文档的知识抽取问题,其利用分布式爬虫获取金融文档,同时使用大数据组件 Elasticsearch 对非结构化数据构建可扩展的分布式实时搜索和分析引擎 , 扩展数据获取方式。
2、金融先验知识的学习提升知识抽取学习能力
通过构建强大的金融知识图谱和多个 NLP 预训练和抽取模型,提升了债券市场金融稿件抽取多个场景中正确率,同时构建了知识抽取平台,优化了迁移抽取能力,实现强大的泛化学习能力。
3、领先的 BERT 模型提升知识抽取准确率
结合 XPATH 并且融合自然语言处理以及深度学习等技术进行知识的抽取,可从语义级别对金融稿件文本进行匹配,从而完成需要抽取数据的逻辑推理过程,保证了规则抽取知识的正确率。另外,还在一定程度上解决了现有技术面临的实体局限、关系局限和语义局限性问题,在显著节约了编辑成本的同时提高了抽取的准确度。
三、建设成效
1、提升银行间市场信息披露效率,从而活跃市场交易并扩大交易总量
通过引入 NLP 结构化抽取技术,加快了债券信息披露流程,将披露周期从数周缩短到 3 天以内,提升了信息披露过程的及时性、有效性和充分性,有利于进一步提高整个银行间债券市场的透明性和资源配置能力,更好的为机构决策奠定有效基础。
2、实现信息披露与国际市场接轨,进一步提升债券市场的国际化水平
随着我国银行间债券市场的进一步活跃及与国际市场的对接不断加强,对信息披露质量的要求也逐步提高。提高信息披露过程的自动化水平有利于加强交易中心信息审核和发布能力,缩短信息披露周期,提高市场透明化程度。
3、提升交易中心工作运营效率,优化服务质量并推动服务创新
通过使用自动抽取技术处理高重复性、劳力密集与低效率的录入及审核工作,降低了 80% 的人工出错率,并降低了 90% 人力成本与时间成本,使业务人员可以专注于数据分析等更高价值的工作,并开展服务创新,提升中心运营收入及品牌价值。
联系人:徐琦
联系方式:021-62037717