文思海辉的“数据湖”不是湖 TechECR记者 张戈 直入主题,“数据湖”不是湖。多源渠道、复杂格式的海量数据涌入,汇集而成“数据湖”,但其定位和价值终究不只是“湖”。“数据湖”已经成为企业数字资产的操作系统,也正在驱动应用场景创新。当然,数据湖还颠覆升级了“数据服务商”的业务模式。 “数据湖”也是湖 传统IT生态中,并没有数据服务商的定位,但现在已是不可缺失的角色,文思海辉即是以数据服务见长的IT服务厂商。2018年,在IDC《中国银行业IT解决方案市场份额》报告中,文思海辉雄踞中国市场份额第一,并以其对金融应用场景的理解,尤其是在数据规划、数据应用、数据治理、数据分析、决策支持等方面的优势,多年保持着“商业智能与决策支持管理类解决方案市场”份额第一名。
(在刚刚结束的2019年中国国际服务贸易交易会上,文思海辉·金融基于大数据的企业级数据湖平台荣获“科技创新”服务示范案例奖) “数据湖是套先进的企业数据架构。”陈圣,文思海辉金融事业群商业智能事业部总监,他更希望以数据战略的视角,解释“数据湖”的价值定位。其实,“数据湖”概念兴起于2010年,最早被制造行业用户所接受,因为此时制造型企业不仅在汇集ERP、CRM等系统中的结构化数据,也在接入MES系统数据,采集物联网传感器、视频监控系统中产生的非结构化数据。 2014年之后,数据湖的价值也逐渐被金融行业客户认知。原因几乎相同,银行已经不满足于只对“总账”中的数据进行分析。将人脸识别技术应用于存取款,或自助办理信用卡业务,需要存储图像数据;办理个人信贷,需要接入微信、支付宝等第三方互联网渠道数据;办理企业授信要分析工商、税务等社会数据。 此外,将各类票据通过OCR技术进行图文转换;通过物联网终端模块,建立“电子围栏”,进行抵押品监控,以及5G智慧银行、VR证券及金融交易等应用,都伴随着海量数据的涌入。也就是说,每一次金融科技创新,每一项金融服务的推出,都在对传统数据存储、数据分析架构的挑战。 “数据湖”不是湖 此即为“数据湖”产生的背景。当企业意识到数据是生产资料时,其就有动力将数据进行存储。当企业进一步意识到数据是核心资产、甚至是产业资本时,其就更有动力对数据进行分析。 当然,早期数据湖就是“湖”,更强调数据“存储”,将热数据、温数据、冷数据等不同类型的数据,将结构化、非结构化、半结构化等不同格式的数据,分别存储于SSD、SAS、SATA等不同存储介质中,即实现数据统一存储。 “但数据湖更应该成为业务创新的支撑架构。”陈圣跳出“存储”界面的限制,从两个维度解释了数据湖的价值:以技术维度,数据湖是企业高效的数据底座,涉及数据接入、数据存储、数据治理、数据分析等,不同“模块”的软硬件系统。但以业务维度,基于数据湖的数据服务,又在驱动企业预测决策模式创新、应用场景创新、商业模式创新。 数据驱动金融场景创新 进一步聚焦金融行业应用场景。数据湖正处于从解决“数据存储”,向提供“数据服务”的演进阶段。与诸多行业的应用系统建设思路相同,早期金融行业也采用“业务应用先行、科技部门代管”模式,即市场营销、风险防控等部门,以业务驱动,率先建立部门级大数据平台,由此系统中逐渐沉淀下“部门级”数据。 “但建立‘全行级’数据湖,才可能实现以数据服务驱动的业务创新。”陈圣说。此前,文思海辉已经服务于国内十余家银行的数据湖建设,形成从顶构咨询、项目实施,到数据分析、数据服务等端到端业务能力,而建立“全行级”数据湖就是文思海辉的业务实践。 “金融机构建立数据战略,即需要形成数据湖顶层设计,但顶层设计又不只是建立数据接入、数据存储、数据治理、数据分析等端到端的技术架构。”文思海辉金融事业群商业智能事业部总经理杜啸争说:“数据服务才是企业应用的制高点。基于数据湖的建设,可解决传统数据仓库,开发周期长、业务迭代缓慢等问题,能够让业务部门和科技部门,更集中精力于自身核心能力。而数据服务商则需要以逆向思维,了解各业务部门的数据需求,形成逐步演进的数据湖建设规划,并有能力阐述数据服务的创新价值。” |