今天首席CTO笔记来给各位分享关于哪个银行率先将大数据运用在银行业的相关内容,其中也会对大数据能否运用于银行业进行详细介绍,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
1、大数据技术在金融行业的典型应用2、[恒丰银行]基于大数据的精准营销模型应用3、商业银行大数据最早提出大数据技术在金融行业的典型应用
大数据技术在金融行业的典型应用
近年来,大数据技术结合云计算、区块链、人工智能等新技术向金融领域渗透融合,释放出裂变式的创新活力和应用潜能,为金融行业包括财务公司带来巨大的机遇。
近年来,我国金融科技快速发展,在多个领域已经走在世界前列。大数据、人工智能、云计算、移动互联网等技术与金融业务深度融合,大大推动了我国金融业转型升级,助力金融更好地服务实体经济,有效促进了金融业整体发展。在这一发展过程中,又以大数据技术发展最为成熟、应用最为广泛。从发展特点和趋势来看,“金融云”快速建设落地奠定了金融大数据的应用基础,金融数据与其他跨领域数据的融合应用不断强化,人工智能正在成为金融大数据应用的新方向,金融行业数据的整合、共享和开放正在成为趋势,给金融行业带来了新的发展机遇和巨大的发展动力。
大数据在金融行业的典型应用场景
大数据涉及的行业过于广泛,除金融外,还包括政治、教育、传媒、医学、商业、工农业、互联网等多个方面,各行业对大数据的定义目前尚未统一。大数据的特点可归纳为“4V”。
第一,数据体量大(Volume), 海量性也许是与大数据最相关的特征。
第二,数据类型繁多(Variety),大数据既包括以事务为代表的传统结构化数据,还包括以网页为代表的半结构化数据和以视频、语音信息为代表的非结构化数据。
第三,价值密度低(Value),大数据的体量巨大,但数据中的价值密度却很低。比如几个小时甚至几天的监控视频中,有价值的线索或许只有几秒钟。
第四,处理速度快(Velocity),大数据要求快速处理,时效性强,要进行实时或准实时的处理。
金融行业一直较为重视大数据技术的发展。相比常规商业分析手段,大数据可以使业务决策具有前瞻性, 让企业战略的制定过程更加理性化,实现生产资源优化分配,依据市场变化迅速调整业务策略,提高用户体验以及资金周转率,降低库存积压的风险,从而获取更高的利润。
当前,大数据在金融行业典型的应用场景有以下几个方面:
在银行业的应用主要表现在两个方面:一是信贷风险评估。以往银行对企业客户的违约风险评估多基于过往的信贷数据和交易数据等静态数据,内外部数据资源整合后的大数据可提供前瞻性预测。二是供应链金融。利用大数据技术,银行可以根据企业之间的投资、控股、借贷、担保及股东和法人之间的关系,形成企业之间的关系图谱,利于企业分析及风险控制。
在证券行业的应用主要表现为:
一是股市行情预测。大数据可以有效拓宽证券企业量化投资数据维度, 帮助企业更精准地了解市场行情,通过构建更多元的量化因子,投研模型会更加完善。
二是股价预测。大数据技术通过收集并分析社交网络如微博、朋友圈、专业论坛等渠道上的结构化和非结构化数据,形成市场主观判断因素和投资者情绪打分,从而量化股价中人为因素的变化预期。
三是智能投资顾问。智能投资顾问业务提供线上投资顾问服务,其基于客户的风险偏好、交易行为等个性化数据,依靠大数据量化模型,为客户提供低门槛、低费率的个性化财富管理方案。
在互联网金融行业的应用,一是精准营销。大数据通过用户多维度画像,对客户偏好进行分类筛选,从而达到精准营销的目的。二是消费信贷。基于大数据的自动评分模型、自动审批系统和催收系统可降低消费信贷业务违约风险。
金融大数据的典型案例分析
为实时接收电子渠道交易数据,整合银行内系统业务数据。中国交通银行通过规则欲实现快速建模、实时告警与在线智能监控报表等功能,以达到实时接收官网业务数据,整合客户信息、设备画像、位置信息、官网交易日志、浏览记录等数据的目的。
该系统通过为交通银行卡中心构建反作弊模型、实时计算、实时决策系统,帮助拥有海量历史数据,日均增长超过两千万条日志流水的银行卡中心,形成电子渠道实时反欺诈交易监控能力。利用分布式实时数据采集技术和实时决策引擎,帮助信用卡中心高效整合多系统业务数据,处理海量高并发线上行为数据,识别恶意用户和欺诈行为,并实时预警和处置;通过引入机器学习框架,对少量数据进行分析、挖掘构建并周期性更新反欺诈规则和反欺诈模型。
系统上线后,该银行迅速监控电子渠道产生的虚假账号、伪装账号、异常登录、频繁登录等新型风险和欺诈行为;系统稳定运行,日均处理逾两千万条日志流水、实时识别出近万笔风险行为并进行预警。数据接入、计算报警、案件调查的整体处理时间从数小时降低至秒级,监测时效提升近3000倍,上线3个月已帮助卡中心挽回数百万元的风险损失。
百度的搜索技术正在全面注入百度金融。百度金融使用的梯度增强决策树算法可以分析大数据高维特点, 在知识分析、汇总、聚合、提炼等多个方面有其独到之处,其深度学习能力利用数据挖掘算法能够较好地解决大数据价值密度低等问题。百度“磐石”系统基于每日100亿次搜索行为,通过200多个维度为8.6亿账号精确画像,高效划分人群,能够为银行、互联网金融机构提供身份识别、反欺诈、信息检验、信用分级等服务。该系统累计为百度内部信贷业务拦截数十万欺诈用户,拦截数十亿不良资产、减少数百万人力成本,累计合作近500 家社会金融机构,帮助其提升了整体风险防控水平。
金融大数据应用面临的挑战及对策
大数据技术为金融行业带来了裂变式的创新活力,其应用潜力有目共睹,但在数据应用管理、业务场景融合、标准统一、顶层设计等方面存在的瓶颈也有待突破。
一是数据资产管理水平仍待提高。主要体现在数据质量不高、获取方式单一、数据系统分散等方面。
二是应用技术和业务探索仍需突破。主要体现在金融机构原有的数据系统架构相对复杂,涉及的系统平台和供应商较多,实现大数据应用的技术改造难度很大。同时,金融行业的大数据分析应用模型仍处于起步阶段,成熟案例和解决方案仍相对较少,需要投入大量的时间和成本进行调研和试错。系统误判率相对较高。
三是行业标准和安全规范仍待完善。金融大数据缺乏统一的存储管理标准和互通共享平台,对个人隐私的保护上还未形成可信的安全机制。
四是顶层设计和扶持政策还需强化。体现在金融机构间的数据壁垒较为明显,各自为战问题突出,缺乏有效的整合协同。同时,行业应用缺乏整体性规划,分散、临时、应激等特点突出,信息价值开发仍有较大潜力。
以上问题,一方面需要国家出台促进金融大数据发展的产业规划和扶持政策,同时,也需要行业分阶段推动金融数据开放、共享和统一平台建设,强化行业标准和安全规范。只有这样,大数据技术才能在金融行业中稳步应用发展,不断推动金融行业的发展提升。
[恒丰银行]基于大数据的精准营销模型应用
【案例】恒丰银行——基于大数据的精准营销模型应用 ;timestamp=1500159788ver=1signature=pCHfpePVrKXUGp39JEg577lopIPT9KCdx9FqIL2LbRmunZMQ-86itFcexY XKcX3Vb1ypwGo8v0IU6fkNgcs QIafGAccsZFmMb6yBYcuPdqH63EKBvL88BGFaUrBBPQl0v*mpgzYxrTCkcaJGaX2iIFRHZEDNCmuM0qhqqN294=
本篇案例为数据猿推出的大型 “金融大数据主题策划” 活动 (查看详情) 第一部分的系列案例/征文;感谢** 恒丰银行** 的投递
作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融信息行业协会、互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的 《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》 还将在上海隆重举办 【论坛详情】 【上届回顾(点击阅读原文查看)】
在论坛现场,也将颁发 “技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖” 四大类案例奖
本文长度为 6000 字,建议阅读 12 分钟
如今,商业银行信息化的迅速发展,产生了大量的业务数据、中间数据和非结构化数据,大数据随之兴起。要从这些海量数据中提取出有价值的信息,为商业银行的各类决策提供参考和服务,需要结合大数据和人工智能技术。国外的汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。在国内的商业银行中,大数据的思想和技术逐步开始在业务中获得实践和尝试。
面对日趋激烈的行业内部竞争及互联网金融带来的冲击,传统的上门营销、电话营销,甚至是扫街营销等方式跟不上时代的节奏。利用精准营销可节约大量的人力物力、提高营销精准程度,并减少业务环节,无形中为商业银行节约了大量的营销成本。
虽然恒丰银行内部拥有客户的基本信息和交易等大量数据,但是传统的营销系统并没有挖掘出行内大量数据的价值,仍然停留在传统的规则模型。当下,恒丰银行接入了大量的外部数据,有着更多的维度,如果将内部数据与外部数据进行交叉,则能产生更大的价值。客户信息收集越全面、完整,数据分析得到的结论就越趋向于合理和客观。利用人工智能技术,建立精准营销系统变得可能且必要。
恒丰银行基于大数据的精准营销方案是利用大数据平台上的机器学习模型深入洞察客户行为、客户需求,客户偏好,挖掘潜出在客户,实现可持续的营销计划。
周期/节奏
2016.4-2016.5 完成需求梳理和业务调研,并在此基础上进行总体方案设计。
2016.5-2016.8 整理银行内、外部数据,根据营销需求制定客户标签和设计文档,实施用户画像。
2016.8-2016.10 在用户画像的基础上,构建理财产品个性化推荐系统。其中包括个性化推荐算法调研,模型对比等一系列工作。
2016.10-2017.1 客户需求预测并对客户价值进行建模,并完善整合精准营销应用模型。
2017.1-2017.3 用户画像、个性化推荐、客户价值预测等精准营销模型上线。
客户名称/所属分类
恒丰银行/客户管理
任务/目标
根据零售业务营销要求,运用多种数据源分析客户行为洞察客户需求,实现精准营销与服务,提高银行客户满意度和忠诚度。
针对不同的客户特征、产品特征和渠道特征,制定不同市场推广策略。为了完成以上任务,主要从以下几个方面构建精准营销系统:
1.用户画像: 结合用户的历史行为和基本属性给用户打标签。
2.精准推荐系统: 给用户推荐个性化理财产品, 例如在微信银行中给每个客户推荐他喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
3.需求预测和客户价值: 新产品发售的时候,找到最有可能购买该产品的客户,进行短信营销,进而提高产品响应率。客户价值精准定位,根据客户价值水平制定不同的推荐策略。银行通过计算客户使用其产品与服务后所形成的实际业务收益,充分了解每一个客户的贡献度,为管理层提供决策支撑。
挑战
项目实施过程由用户画像,精准推荐系统,需求预测和客户价值建模三部分组成,采用TDH机器学习平台Discover所提供的算法和模型库进行开发和验证。
(一)用户画像的建立
客户标签主要包含客户基本属性,客户等级标签,客户偏好标签,客户交易特征,客户流失特征,客户信用特征,客户终身价值标签,客户潜在需求标签。
(二)精准推荐系统的建立
由于系统复杂,且篇幅有限,仅对其中最重要的理财推荐系统做详细阐述。精准推荐系统架构图如下。
2.1业务问题转化为机器学习问题
业务问题
银行理财产品个性化推荐给客户。 例如在微信银行中给每个客户推荐此客户喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
将业务问题转化为机器学习问题
理财产品种类繁多,产品迭代速度很快,客户在繁多的产品中不能快速找到适合自己的产品,因此有必要建立一个自动化推荐模型,建立客户理财偏好,给客户推荐最适合的产品。
将银行理财产品推荐业务问题转化为机器学习问题,进而利用人工智能技术提高推荐产品的点击率和购买率。例如在恰当的时间,通过用户偏好的渠道给用户推荐产品,推荐的结果为用户购买或者未购买。这个问题可以看作一个典型机器学习二分类问题:基于历史营销数据来训练模型,让模型自动学到客户购买的产品偏好,并预测客户下次购买理财产品的概率。对模型预测出所有客户对所有产品的响应概率进行排序,可选择客户购买概率最高的topN个产品推荐给客户。
下面将叙述如何构建该推荐预测模型。
2.2数据源准备
在建立的一个理财推荐模型之前,可以预见到相似的客户可能会喜好相似的产品(需要表征客户和产品的数据),同一个人的喜好可能具有连续性(购买历史交易数据,包括基金国债等),他的存款、贷款资金可能决定了他能购买什么档次的理财等等。因此,我们需要准备以下数据。
客户基本属性:客户性别,年龄,开户时间,评估的风险等级等等。
产品基本属性:产品的逾期收益率,产品周期,保本非保本,风险等级等。
客户购买理财产品的历史:在什么时候购买什么产品以及购买的金额。
客户的存款历史: 客户历史存款日均余额等。
客户的贷款历史: 客户历史贷款信息等。
客户工资:客户工资的多少也决定了客户购买理财的额度和偏好。
用户画像提取的特征:用户的AUM等级,贡献度,之前购买基金,国债的金额等。
2.3特征转换和抽取
有了这么多数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。
特征转换
把不能处理的特征做一些转换,处理成算法容易处理的干净特征。举例如下:
开户日期。就时间属性本身来说,对模型来说不具有任何意义,需要把开户日期转变成到购买理财时的时间间隔。
产品特征。从理财产品信息表里面可以得到风险等级,起点金额等。但是并没有标志这款产品是否是新手专属,是否是忠诚客户专属。这就需要我们从产品名字抽取这款产品的上述特征。
客户交易的时间信息。同客户的开户日期,孤立时间点的交易信息不具有任何意义,我们可以把交易时间转变为距离上次购买的时间间隔。
特征抽取
还有一部分数据算法不能直接利用,例如客户存款信息,客户交易信息。我们需用从理财交易和存款表中抽取可能有用的信息。
用户存款信息:根据我们的经验,客户购买理财之前的存款变动信息更能表明客户购买理财的真实想法,因此我们需要从客户历史存款数据抽取客户近三个月,近一个月,近一周的日均余额,以体现客户存款变化。
客户交易信息:客户最近一次购买的产品、购买的金额、及其相关属性,最近一个月购买的产品、购买的金额及其相关属性等等。
以上例举的只是部分特征。
2.4构造、划分训练和测试集
构造
以上说明了如何抽取客户购买理财的相关特征,只是针对正样本的,即客户购买某种理财时候的特征。隐藏着的信息是,此客户当时没有购买其他在发售的产品。假设把客户购买了产品的标签设为1,没有购买的产品样本设为0,我们大致有如下训练样本(只列举部分特征)。
其中客户是否购买产品是我们在有监督训练的标签,也就是我们建立的是一个预测客户是否会购买产的模型。
划分训练集和测试集
考虑到最终模型会预测将来的某时间客户购买某种产品的概率,为了更真实的测试模型效果,以时间来切分训练集和测试集。具体做法如下。假设我们有2016-09-01 ~ 2017-03-20 的理财购买相关数据。以2016-09-01 ~ 2017-03-19的理财交易数据作为训练,2017-03-20这一天的客户对每个产品是否购买的数据作为测试。以2016-09-01 ~ 2017-03-18的理财交易数据作为训练,2017-03-19这一天的客户对每个产品是否购买的数据作为测试,以此类推。
2.5模型训练
根据提取的特征,组成样本宽表,输入到分类模型,这里选择了TDH平台机器学习组件Discover所提供的近百个分布式算法进行建模和训练,同时我们还使用了特征的高阶交叉特性进行推荐的预测和分析。
2.6模型评估
评价推荐好坏的指标很多,比较常用的有
1.ROC曲线下面积(AUC)
2.logloss
3.推荐产品第一次命中rank的倒数(MRR)
4.TopN
针对银行的理财推荐实际业务,客户当天绝大多数是只购买了某一款理财,MRR(Mean Average Precision 的特殊情况)能反应这种情况下推荐的好坏。另一种直观的评价指标是TopN,假定我们只推荐N个模型认为客户最有可能购买的产品,并和真实情况比较,就能得到当天推荐的结果的混淆矩阵,TN,TP,FN,FP,recall,precision等。
我们在生产上验证了最近十天的推荐效果,即测试了2017-03-20, 2017-03-19,…… , 2017-03-11等十天的推荐效果,以下是这些结果的评价。
AUC
Logloss
MRR
0.89
0.45
0.78
也可以把新客户(之前没有购买理财)和老客户(至少购买过一次)分开评估效果。 新客户的购买占了整个理财购买的1/3 以上。
测试新客户的预测效果,可以看出模型对冷启动问题解决的好坏。
对新客户的预测效果
AUC
Logloss
MRR
0.80
0.73
0.32
对老客户的预测效果
AUC
Logloss
MRR
0.92
0.38
0.88
2.7模型优化
1.上线之前的优化:特征提取,样本抽样,参数调参
2.上线之后的迭代,根据实际的A/B testing和业务人员的建议改进模型
(三)需求预测和客户价值
“顾客终生价值”(Customer Lifetime Value)指的是每个购买者在未来可能为企业带来的收益总和。研究表明,如同某种产品一样,顾客对于企业利润的贡献也可以分为导入期、快速增长期、成熟期和衰退期。
经典的客户终身价值建模的模型基于客户RFM模型。模型简单的把客户划分为几个状态,有一定意义但不一定准确,毕竟RFM模型用到的特征不全面,不能很好的表征客户的价值以及客户银行关系管理。
为了方便的对客户终身价值建模,有几个假定条件。其一把客户的购买价值近似为客户为企业带来的总收益,其二把未来时间定义在未来一个季度、半年或者一年。也就是我们通过预测客户在下一个时间段内的购买价值来定义客户的终身价值。因此,我们将预测的问题分为两个步骤:第一步预测这个客户在下一个阶段是否会发生购买(需求预测)。第二步对预测有购买行为的客户继续建模预测会购买多大产品价值。
3.1需求预测
提取客户定活期存款、pos机刷卡、渠道端查询历史等特征,以这些特征作为输入预测用户在当前时间节点是否有购买需求,训练和测试样本构造如下:
1.历史用户购买记录作为正样本。
2.抽样一部分从未购买的理财产品的用户作为负样本集合Un,对于每一个正样本Un中随机选取一个用户构造负样本。
3.选取2016.04-201610 的购买数据作为训练样本,2016.11的数据作为测试样本。
使用机器学习算法进行分类训练和预测,重复上述实验,得到下列结果:
AUC: 0.930451274
precision: 0.8993963783
recall: 0.8357507082
fmeasure: 0.8664062729
进一步对客户分群之后,可以更好的对新客户进行建模,对于老客户我们可以进一步提取他们的历史购买特征,预测他们在下一段时间内购买的产品价值(数量,金额等),对于新客户,可以进根据他的存款量预测其第一次购买的产品价值,把存款客户变成理财客户。通过分析客户存款变动于客户购买理财的关系,我们发现客户购买理财的前一段时间内定活期的增加的有不同的模式,如下图。
根据需求预测模型,我们给出新客户最有可能购买的top N 列表,然后由业务人员进行市场推广。
3.2客户价值预测
进一步预测有购买需求的客户的购买价值高低。这是个回归问题,但是预测变量从二分类变量变为预测连续的金额值。训练的时候预测值取训练周期内(一个月或者季度)客户所购买的总金额。
算出客户的当前价值(即当前阶段购买的产品价值)和未来价值(预测的下一个阶段的客户价值)可以帮助我们鉴定客户处于流失阶段,或者上升阶段,或者是稳定阶段。当前价值取的是当前时间前三个月的交易量。对流失阶段高价值客户可以适当给予营销优惠,对于有购买意向的客户适当引导。如下图所示。
结果/效果
一是提高银行营销准确性。随着客户不断增加,理财产品也在不断推陈出新,在实时精准营销平台的帮助下,银行从以前盲目撒网式的营销方式转变到对不同客户精准触达,提高了理财产品的营销成功率,降低销售和运作成本。理财产品推荐的上线以来,产品推荐成功率比专家经验排序模型最高提升10倍。
二是增加银行获客数量。精准营销系统洞察客户潜在需求和偏好,提高了银行获取目标客户群的准确率。从数百万客户中,通过机器学习模型,找到最有可能购买产品的客户群,通过渠道营销,实现响应率提升。相比传统盲发模式,发送原38%的短信即可覆盖80%的客户。
通过构建基于大数据的精准营销方案,恒丰银行深入洞察客户行为、需求、偏好,帮助银行深入了解客户,并打造个性化推荐系统和建立客户价值预测模型,实现可持续的营销计划。
商业银行大数据最早提出
商业银行大数据是最早提出的,作为信息革命的第二个高潮,“大数据”的高速发展,使银行业的客户数据、交易数据、管理数据等均呈现爆炸式增长,为商业银行创造变革性价值提供了条件。更广阔的业务发展空间。我国商业银行提供的服务和产品存在较大的同质性,但比较竞争优势要求银行突破同质性,实施差异化战略。社交媒体的兴起为银行创造了全新的客户接触渠道,来自银行网点、PC终端、移动终端、传感器网络传来的结构化、非结构化的海量数据,为银行创造了深化客户挖掘、强化交叉销售、加快产品创新的广阔空间。数据的成功应用,将为银行创造先发竞争优势,打造不可复制的核心竞争力。更精准的决策判断能力。在信息时代,人类社会面临的中心问题将从如何提高生产率转变为如何更好地利用信息来辅助决策。对于银行而言,“大数据”将使银行决策从“经验依赖”向“数据依据”转化,将在深入了解和把握银行自身乃至市场状况的基础上,更加科学地评价经营业绩、评估业务风险、配置全行资源,引导银行业务科学健康发展。
结语:以上就是首席CTO笔记为大家整理的关于哪个银行率先将大数据运用在银行业的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于大数据能否运用于银行业、哪个银行率先将大数据运用在银行业的相关内容别忘了在本站进行查找喔。