10分彩软件-腾讯10分彩软件金融行业数据复杂 成本高 难获取 看路孚特如何打破困局

  • 时间:
  • 浏览:1

嘉宾丨路孚特 RDP 研发总监董玉栋,路孚特高级研发经理赵仪,路孚特企业架构总监陈强 2018 年,汤森路透金融与风险业务部门独立成为 Ref10分彩软件-腾讯10分彩软件initiv(路孚特)。路孚特在汤森路透金融数10分彩软件-腾讯10分彩软件据和市场知识积累之上,

嘉宾丨路孚特 RDP 研发总监董玉栋,路孚特高级研发经理赵仪,路孚特企业架构总监陈强

    2018 年,汤森路透金融与风险业务部门独立成为 Refinitiv(路孚特)。路孚特在汤森路透金融数据和市场知识积累之上,利用领先的技术、信息和分析辦法 继续为行业者提供着服务。如今路孚特推出金融数据平台。(Refinitiv Elektron Data Platform,简称 RDP),进一步发挥其在行业积累的优势。InfoQ 记者专访路孚特 RDP 研发总监董玉栋、路孚特高级研发经理赵仪、路孚特企业架构总监陈强,揭秘 RDP 的设计理念及技术亮点。

    从传统的金融数据管理到现代金融数据治理,金融行业迎来巨大的转变。因此数据量增长形成的倒逼,以及要顺应监管机构和用户的需求,过多的金融从业机构已经 结速意识到“数据驱动”的重要性,但全面释放数据价值的过程之所以一帆风顺。

 金融行业在数据治理中面临哪几种痛点?

    路孚特企业架构总监陈强表示,在金融行业里,数据来源非常简化。面对不同的数据提供厂商、数据类型以及数据提供辦法 ,企业要获取所需的金融数据并作防止分析,成本之所以低。而你本身小型金融机构即便获取到数据,也没人 足够的技术能力去防止。

    从没人 淬硬层 来看,路孚特高级研发经理赵仪解释,数据通常受到两类人的关注:一类是数据提供商,另一类是数据消费者。对于数据提供商而言,数据的权限管理、再埋点权限的机制、数据合规等始终是痛点;对于数据消费者而言,怎样才能防止数据来源不同、格式不统一、不一致等问提报告 迫在眉睫。

    总体来看,金融从业机构面临的主要痛点如下:

数据来源简化,且在不同部门、不同业务系统以及不同领域的机构间,数据过高 流动性和共享性。

数据标准化程度低。来自不同业务、不同時 期的数据,在用途、底部形态、价值和质量水平等方面差异较大,原应 数据的提取、埋点、分析和使用的难度加大。

成本问提报告 。随着用户量和数据量的增加,访问和使用数据的成本也在大幅提升。

目前金融机构大每项可利用的数据依然是传统业务产生的数据,而内外部数据源拓展过高 ,过高 更高层面的统筹协调来支持全面的数据分析和使用。

基于以上原应 ,路孚特推出了自主研发的金融数据平台 RDP。该平台应用统一的存储层能力汇集来自全球的海量金融数据,通过删改的清洗、分析和增值防止流程后,集中埋点给用户。

RDP 研发总监董玉栋提到,路孚特因此与全球的证券交易所、期货交易所等机构建立了合作关系,从数据生产端获取到一手数据,面向全球发布到数据消费的一端。简单来讲,却说“收之全球,发之全球”。

可不不需要 说,RDP 相当于一一两个全球金融行业数据的统筹协调中心,其目的是方便金融从业者获取更全面的行业数据,同時 尽因此减少用户成本,增加数据价值。

 RDP 怎样才能帮助金融从业者以较低的成本访问和使用数据?

    据了解,企业在数据传输过程中,除了从上游不同业务数据库中实时、定时传输到下游系统之外,还需用从内外部合作商、供应商中获取业务数据。RDP 具有大数据级别的行业数据,没人 ,它是怎样才能帮助金融从业者以较低的成本便捷地访问和使用哪几种数据?

    RDP 的防止思路是:将其核心数据存储在 AWS 上,为用户提供基于元数据驱动的统一的 API 接口。RDP 的数据和 API 接口可不不需要 通过所有主流的公有云产品、私有云设施,以及企业自有数据中心访问。

    从用户淬硬层 来看,基于元数据的访问大大简化了客户对数据的使用。因此,数据访问越便捷原应 开发难度越高。董玉栋也提到,统一的 API 面前,需用理解客户不例如型的请求,并不需要 高效执行,但云原生的 API 网关之所以能删改实现你本身底部形态。

    API 网关地处客户端与各个微服务之间,担任着反向代理的角色,负责将不同的请求路由到相对应的微服务中去。API 网关可不不需要 防止客户端需求和每个微服务暴露的细粒度 API 不匹配、每项服务使用的协议非 Web 友好协议等问提报告 。

    为了提升 API 性能,满足用户不例如型的访问请求,路孚特自主研发了 API 网关以及用户数据权限管理系统。AWS 中的 API 网关会注册其所有的 RDP API,包括内内外部消费的 API 和面向客户的 API。用户请求到达已经 ,API 网关会自动验证用户的权限,并保证后续的合法数据请求10分彩软件-腾讯10分彩软件快速递交给相应的服务,而超出服务范围的请求会自动拒绝。董玉栋表示,所有在 RDP 上的产品设计前会 从 API 定义已经 结速,这助于实现把客户需求插进第一位的目标,并最大化各种 API 及服务的重用性,防止重复实现相同的功能。

    在数据埋点上,RDP 统一了流式防止、批量防止和基于请求的数据提供辦法 。对于流式数据的访问,董玉栋提到,例如数据即时性一阵一阵要,RDP 通过在上边做多层缓存将数据持续且高速地推送给客户。

    批量数据请求分为“定制批量请求”和“随机批量请求”你本身请况。对于定制批量请求,RDP 按照约定时间定时打包推送给用户;对于随机批量请求,则采用异步打包,因此将数据提取位置发送给用户的辦法 防止。

    对于面向搜索的数据,董玉栋介绍:“例如访问基本前会 同步请求,实时访问亲们的数据库返回给客户。因此用户基于搜索的数据量一阵一阵大,RDP 系统会进行职能预测,自动将你本身类请求转变成随机批量数据请求来防止。”

    没人 ,怎样才能应对诸如跨洋实时交易例如对时效性要求非常高的超低时延数据访问?

    赵仪解释:“跨洋实时交易你本身地处地理位置上的时延,再再加系统带来的时延,通过云服务访问无法满足超低时延的需求。即便是快到 70ms 的时延,对于实时交易来讲,也是你本身延迟。”路孚特的做法是在全球部署数据中心,以此提高时效性。此外,目前公有云还无法提供具有超高时效性的数据,因此,比较相当于的做法是将数据通过专线直接部署到用户所在地。

 元数据驱动的价值与挑战

    从简单的库表到整个数据平台,再到服务管理,元数据管理的范围正在扩大,不断突破传统管理的范畴,并在大数据治理中发挥着关键作用。而 RDP 的整个系统便是由元数据驱动的。

    简单来讲,元数据是对数据你本身进行描述的数据,如描述数据的格式、映射关系、语义、权限等。元数据管理具有以下三方面的价值:

    可不不需要 为数据管理提供统一的视图,方便数据交互共享;

    实现数据自动关联分析,为数据分析、问提报告 定位等提供支撑;

    便于建立数据标准,统一交换、存储、应用口径,减少共享壁垒,降低应用出错几率,提升质量。

    在大数据时代,数据的容量、多样性等在持续扩充,元数据管理也面临着挑战。目前,元数据仍然没人 统一的标准,怎样才能用一套统一的语义去描述种类繁多的金融数据间的底部形态,因此真正和数据管理系统 / 微服务之间紧密集成而前会 割裂的地处,是行业中普遍地处的问提报告 。

    企业首先需用集中化管理元数据,由一一两个专门且人数较少的架构师团队定义元数据,并进行统一管理。其次,研发团队要让软件不需要 支持元数据体系,并与之融为一体,而非割裂地处。最后,不仅内内外部的系统要实现元数据驱动,系统间的相互访问以及对外开放也需用遵循同一套体系。

    随着元数据驱动的数据管理、API 访问和增值业务能力的增加,元数据实质上因此成为了更高级别抽象的代码,这就带来了一一两个问提报告 :怎样才能进行数据的生命周期管理。确切地说,例如简化的问提报告 没人 单一的防止方案,需用从系统级架构、可重用的代码和服务、DevOps 和自动化测试、代码安全扫描等多个方面来防止问提报告 。

    对此,陈强分享了以下几点经验:

(1)怎样才能在权限管理系统中定义“谁”可不不需要 “管理”哪几种“元数据”?可不不需要 把整个系统中的“谁”、“管理(行为)”、“元数据”哪几种业务概念也都元数据化,由统一的身份及权限系统通过共享服务进行统一管理。

(2)对于可不不需要 在线修改并实时生效的元数据,尤其是决定数据存储和表现形式的元数据,怎样才能保证由其驱动的数据系统的健壮性、稳定性和可控性?首先,在线元数据的修改和发布是独立的异步流程,可由相应的权限进行控制;其次,对元数据的前后变化进行快照,并以版本号作为快照的唯一标识符,在发布和回滚元数据版本时可不不需要 明确地识别具体的快照内容;最后,发布和回滚的过程中,可不不需要 根据业务特点,根据需用辅以各种在线的自动化功能测试和发布策略。

(3)你本身业务及技术实现的简化度原应 你本身元数据的修改无法真正进行热加载和实时生效,因此实现热加载 / 部署的代价过高 ,但仍然需用业务管理专家而非研发人员控制和实施元数据修改的部署。RDP 在应用中会尽量利用公有云的弹性,对版本化后的元数据进行修改,并进行 CI/CD 持续集成和自动化测试,同時 辅助以蓝 / 绿部署策略。没人 ,元数据的版本控制与代码的版本控制流程及部署策略就可不不需要 非常接近。不同的是,元数据的修改是通过易于使用的控制界面,主要由业务专家进行管理。在这面前,路孚特所有由业务专家使用的功能前会 经过充分的测试,确保界面可不不需要 能操作的功能是健壮有效的。

 随着数据量的增长,RDP 怎样才能平衡性能与成本?

    随着大数据的发展,数据平台难免要面对数据或作业爆发式增长所带来的挑战。RDP 的用户量和数据量每年前会 大幅增长,相应的成本投资增长不容小觑。在你本身数据量和计算量不断增长的请况下,怎样才能去平衡性能和成本?赵仪表示,你本身问提报告 的核心在于每个用户计算成本的控制,即怎样才能保证每个用户计算成本不随用户数量和数据量的增加而显着增加。RDP 在控制成本方面可借鉴的辦法 有:

(1)尽因此地在用户间共享可不不需要 共享的计算,只需支付对用户的埋点成本;

(2)控制热点数据的规模,在 API 级区分热点访问和冷数据访问;

(3)基于微服务的管理,方便用户管理个人的数据需求;

(4)用户输入不同的数据源不盲目整合,防止在一一两个对象模型下产生巨量的数据集,从而降低用户增加对单个用户计算简化度的影响;

(5)数据压缩 / 访问本地化 / 算法优化等传统辦法 。

    对于大数据平台而言,区分冷热数据并安排不同的存储辦法 是非常重要的一项工作,对存储成本和计算性能至关重要。对于冷数据,因此调用频率相对较低,可不不需要 通过冷压缩,将数据压缩到最小,再存储起来的辦法 节省存储成本;对于热数据,则需用增加 Cache 因此采用你本身优化策略,让用户能快速调用,从而提升计算性能。

    数据你本身之所以产生价值,基于数据的计算不需要 带来价值。为了保证上层计算的有效性,通常将数据插进距离计算最近的地方,因此会带来传输的延迟。数据的统一存储之所以是将数据都插进同一一两个地方,这里的统一存储我我觉得是一一两个逻辑概念。不同的数据应该插进不同的存储中,不需要 使数据上层的计算最有效,并将数据延迟降到最低。RDP 会针对不同的访问请求提供不同的数据访问缓存,并辅以共享计算的辦法 对数据传输进行优化。

 路孚特金融数据平台的未来发展趋势

    科技带给金融行业的影响显而易见,在金融机构进行各种互联网创新的同時 ,也将金融科技的重要性提升到了战略淬硬层 ,通过 AI、大数据、云计算、区块链等新兴技术不断提升金融时延和竞争力,建立新的金融生态。

    而大数据技术从最初的“新奇”发展到如今的“普惠”阶段,用户的关注点也地处了很大的改变。早期用户比较关注“灵活”、“快”,现在更关心的是企业级能力,同時 降低成本也变得没人 重要。目前,企业级数据平台普遍地处的困难是高速增长的数据和计算量与成本之间的矛盾。怎样才能用更低的成本获取更多的信息,不仅是金融从业机构的迫切需求,也是数据平台的核心竞争点。

    谈及 RDP 未来的发展重点,赵仪表示:“RDP 的目标主要集中在加强数据的统一存储和埋点能力,降低客户获取数据的简化度和成本。未来将用更低的成本扩大数据覆盖范围。”与此同時 ,RDP 会继续获取更多的用户需求,并把哪几种需求统一到 RDP 数据埋点机制里,更好地为客户提供存储和埋点的能力。

    用科技普惠金融,这是路孚特技术团队研发 RDP 的初心。未来,随着 5G、AI 等新兴技术的发展,路孚特也将打造更加智能高效的平台,给用户提供更好的体验。

    除了在技术上不断精益求精,路孚特也在积极推动金融科技的生态发展。11 月 29 日,由路孚特主办,以“引领科技变革,洞见金融未来”为主题的 ReFinTech 金融科技峰会将在北京举行。本次大会邀请了金融界知名专家和金融科技企业技术专家,淬硬层 探讨行业发展思路和技术演进趋势,分享最前沿创新实践,同時 打造“创新、聚力、发展、共赢”的金融科技生态平台。 

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)