您的位置:  首页 > 技术杂谈 > 正文

流批一体!实时数据处理场景化典型应用实例(干货)~

2022-06-14 11:00 https://my.oschina.net/u/5616568/blog/5539178 osc_12177730 次阅读 条评论

什么是数据实时处理?有哪些典型应用场景?实时数据处理的意义是?

下文围绕实时数据应用的产品特性和场景,一一解答。

01 实时数据处理

以实时数据平台 flashflow 举例,它的具体处理过程:

数据从生成->实时采集->实时缓存存储->实时计算->实时落地->实时展示->实时分析。

简言之,数据实时处理是指系统对现场数据在其发生的实际时间内进行收集和加工处理的过程。

flashflow 的实时计算是针对海量数据进行的,经过实时加工处理,再向移动终端提供实时数据查询服务,

在这个过程中,首先要提供高速的数据采集和数据处理,通过 flashflow 系统界面配置源数据库、目标库、源表、目标表、保存并发布后、即可创建实时数据处理作业。

02 应用场景举例

实时数据处理的需求在飞速增长,在各行各业均已得到证实。而我们同时也看到,各行业、企事业单位对于实时数据处理的需求,与其目前的项目开发方式和配套工具不适配的问题也在逐渐凸显。

因此,引入数据仓库、数据挖掘、OLAP等先进理念,通过实时数据应用平台来装载庞大的信息量,进行实时分析处理,

克服数据处理过程中的困难是当下各企事业单位、互联网、金融,政务部门等当下的必修课。

目前,这方面已经有一些典型应用场景,如某宝双十一大屏,各火车站车辆实时信息显示,股票交易大厅信息展示等等。

下面再列举几个应用场景:

场景一:公安厅警务业务

实时数据应用平台可搭建实时布控系统,服务于公安案件侦破。

方案内容:

数据实时采集:通过警务数据共享交换平台与边界平台,实时获取出行、住宿、通讯、视频等数据信息

数据实时分析:基于规则模型对布控人员信息进行实时监控与分析

情报实时预警:布控规则触发后实时预警,通知办案人员进行实时抓捕

典型特点:

数据格式多:数据库/数据文件/视频图片

数据量大:每天量级以几十TB计算/每秒35MB

数据震荡流入:数据流在短时内突发增长

作业调度复杂:实时采集/小批量采集

时效要求高:5秒内完成计算

资源占用多:易产生资源抢占问题

实时布控场景:实时预警

场景二:金融行业线上申贷业务

实时数据应用平台进行数据挖掘分析,一方面将用户行为进行实时反馈;另一方面帮助企业在最短时间内做出科学分析决策,以典型的断点营销场景举例。

方案内容:

「流式计算」组件搭建

结合大数据云平台相关数据集进行逻辑计算,建立起线上贷款系统、外呼客服系统、外呼客服队列

典型特点:

异步非阻塞处理流程

事件源数据量大

处理逻辑复杂,涉及到和其他多个数据集计算,且需要调用算法服务

动作触发条件为“超过多长时间未达成某步”

断点营销场景:实时数据应用平台以「流式计算」组件能力支持

场景三:银行信用卡业务

系统应用进行实时数据采集、清洗、风险预警,帮助银行建立起信用卡反欺诈系统,以“渠道-反欺诈引擎-主机”的实现框架进行欺诈交易判断并实施拦截。

方案内容:

1. 交易渠道:

客户刷信用卡后,从银联、VISA、万事达等卡组织向银行发送实时交易

2. 欺诈识别:

对卡组织交易数据进行清洗补齐,提取风险特征

将风险特征载入神经网络和业务规则,对交易进行欺诈判断

对可疑交易实施拦截,并发送验证码核实

3. 主机:

对正常交易执行账务处理

对异常交易登记拦截原因

对欺诈卡片实施冻结处理

典型特点:

存储:需处理的数据量较大,并发度较高

时效:毫秒级欺诈识别

稳定性:7*24小时服务。

适配:服务于不同的业务条线

信用卡反欺诈场景:实现框架


 

想要了解更多行业的应用场景和解决方案,

以及系统申请试用,欢迎V信搜索edpstack联系小编~

事实上,实时数据应用场景多种多样,本文仅节选几个较有代表性的典型场景案例进行解析讨论,

每个场景所体现的侧重点各有不同,能更快地帮助你了解到实时数据解决方案的内核。

03 为什么需要flashflow

目前,在企业数据建设中,无论是场景需求还是技术架构,都难以做到进一步提升数据价值空间,在此情况下,使能型、智能型实时数据平台 flashflow 势必会引领下一代数据应用体系的搭建,成为企业数据赋能业务的主流形式,原因如下:

1. 处理速度快

端到端处理时效达到秒级。例如,风控项目要求单条数据处理时间达到秒级。

2.高吞吐量

在短时内接收并处理大量数据记录,吞吐量要求达到数十兆/秒/节点。

3.高可用

网络、软件等故障发生时,保证每条数据不丢失,数据处理不遗漏、不重复。

4.扩展性强

当系统处理能力出现瓶颈后,可通过节点的水平扩展提升处理性能。

5.适配性

支持网络流、文件、数据库表、IOT等格式的数据源。对于文件数据源,可以处理增量数据的加载。

6.多租户

平台应用支持数据权限和资源隔离,消息处理、流处理需要有数据权限控制,不同的作业、用户可以访问、处理不同的消息和数据。多种流处理应用之间要进行资源控制和隔离,可防止发生资源争抢。

7.高效对接

支持与第三方规则引擎、决策系统、实时推荐系统等对接。

8. flashflow 支持第三代实时数据处理架构

flashflow 适配不同的集成系统,实时数据库提供了高精度的存储格式,仅需简单的配置,系统即可根据元数据信息自动化生成 catalog。此外,流批一体的数据开发体验,无需写两套逻辑、两套代码,只需选择“流”或“批”处理方式,即可分别运营调试。

 flashflow 第三代产品架构图

flashflow灵活、兼容性强的基础技术底座,封装了大部分市场主流大数据技术和平台,不断加快自身的更迭响应。

例如第一代实时数据架构EL(实时同步),端到端依然是批量时效性;随即第二代实时ELT(实时同步+短批),端到端时效为小时级/分钟级;目前第三代ETL(流式计算),端到端时效到达了惊人的秒级/甚至是毫秒级。

此外,flashflow 三个架构都可支持,用户可根据具体场景选择最合适的实时数据架构。flashflow的每一次迭代升级,无不透露着工匠精神,从实际出发,解决企业数据建设的痛点问题,助力企业快速搭建起专属大数据体系。

04 实时数据平台的价值
数据价值是恒定不变的吗?显然不是,一些数据在业务发生后不久具有很高的价值,但这种价值会随着时间的推移而迅速减少,所以数据的处理速度变得尤为重要,实时处理的关键价值之一在于能够更快地提供数据洞察。

(一)实时数据平台解决方案与其它解决方案的关系

通过上图可以看出,采用实时数据流式处理方式,为企业提供通用解决方案,在新旧方式并行运行期间,通过flashflow实现数据流的实时分流和处理,除了大幅降低定制化方案所需的时间和开发成本之外,还提高了方案的稳定性。

(二)企业数据化建设的基础设施核心组件

全链路实时数据处理开发和运维能力可以为企业不同的人群角色提供直接或间接的支持;实时数据平台简易敏捷的应用场景,投入小,易操作,成本低,技术人员需求少,轻松助力企业做到降本增效;实时数据平台可以大大提升企业的核心竞争力,让企业在市场竞争中,保持充足的活力和创造力。

(三)实时数据能力全面赋能企业业务运营

实时数据平台可快速实现企业全链路实时化,体现在企业业务运营的典型场景中,如实时报表、实时大屏、运营监控、监管保送、实时营销、实时风控等,另外,其他行业相关的场景,如物流、门店、广告、派单、推荐等,都以最大程度满足企业业务对于数据时效性、智能型、可视化的需求。
 

展开阅读全文
  • 0
    感动
  • 0
    路过
  • 0
    高兴
  • 0
    难过
  • 0
    搞笑
  • 0
    无聊
  • 0
    愤怒
  • 0
    同情
热度排行
友情链接