icon业务痛点icon

企业发展过程中面临多种数据、技术、数字化转型难题,亟需一套机制将新老数据模式进行融合升级,打通孤岛数据、降低技术门槛、并推动企业数字化转型支撑业务数据的经营决策。

数据孤岛

数据分散:业务涉及数据源类型繁杂、数据存储系统分散,业务数据之间彼此孤立难以协作共享。标准不一:业务烟囱型系统林立,系统功能和业务数据重复建设,并且数据间基本结构和标准不统一难以融合流通。

项目复杂

技术种类和门槛高:项目涉及数据技术种类多、研发人员无法快速全面掌握各类型系统及技术间差异,短期内难以搭建异构数据间的通用管道。历史包袱重:数据和系统历史包袱多、人员更替快,业务人员难掌握核心数据的底层逻辑急需嫁接新系统,保留原始数据并完成二次开发改造。

企业数字化

架构转型:配合企业发展中的数字化转型进程,业务急需建立统一、高效、安全可靠的数据架构以快速响应业务数据需要,实现数据价值最大化。业务上云:缩减人力和存储成本,业务系统和存储转向云上服务。

icon产品简介icon

DataInLong 孵化于由腾讯主导的Apache 开源社区项目 InLong(应龙),依托Inlong万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程。2021年12月,正式对外提供云上的一站式海量数据集成服务。

icon产品定位icon

DataInLong 是一个高效稳定的多源数据集成工具,在跨云跨网环境下提供可靠、安全、敏捷的异构数据源集成与移动能力。三大核心定位:

多源集成工具
“快准稳”:首要解决最基础的数据汇聚集成问题,为多个分散、异构的数据提供“快准稳”整合同步工具以消除数据孤岛,便于后续业务分析、数据应用和共享。
统一数据枢纽
“跨网”:核心支持一站式跨云跨网数据传输,为不同环境内异构数据的出入、转换提供敏捷高效的传输枢纽中心,轻松对接湖仓及各类业务系统。
融合管理服务
“管理:系统提供安全、稳定、高效的数据传输和管理服务,支持以业务目标为导向构建清晰透明、易于管理的融合数据链路,包容业务特性和数据指征、降低技术门槛。
icon主要功能icon

主要提供数据链路配置(读取、写入、转换)、解决方案、运维管控等功能:

解决方案
 整库迁移
整库实时增量同步
全增量自动融合
数据链路
离线/实时数据链路管理
数据节点配置
任务发布
版本比对
协同分享
运维管控
任务及实例状态运维
同步指标监控
任务消息告警
集成资源使用监控
基础服务
 数据源接入管理
安全权限管控
元数据管理配置
集成资源配置
icon核心价值icon

一 个中心:聚焦数据集成场景,覆盖数据采集、汇聚、存储、分拣处理全流程。二 种粒度:针对单表、多表(单库多表、分库分表)两类对象,锁定用户路径、简化技术配置、降低使用门槛。三 类特性:通过操作轻量化、过程可视化、能力开放化能力辅助企业快速提炼业务数据价值。四 大保障:提供全方位数据保障、运维保障、安全保障、效率保障。

离线/实时场景覆盖

离线同步:实现数据主动抽取,实时同步:被动监控数据变更,进行实时刷新动态同步。

多源异构数据融合

关系型数据库、大数据存储、非结构化数据、消息队列等读写任意搭配

ETL全链路支持

支持数据接入(E)、清洗与打宽(T)、数据加载(L)全流程,提供可视化数据链路配置与拖拽式多元节点管理,支持多种同步策略配置

数据映射管理

支持以业务特性为导向灵活定义数据来源、去向,关联配置数据字段及类型映射关系,稳定保障不同数据类型结构转换一致性和可用性

轻量化解决方案

总结不同业务领域、技术选型、和网络环境中最佳实践,产品化整库迁移类、数据同步类、网络工具类解决方案,支持用户通过简单轻量化配置即可解决复杂项目瓶颈

安全监控运维保障

可视化运维及指标监控,支持任务/链路/节点级数据变化及异常监控,提供同步性能、脏数据、流量、资源使用监控以及数据权限安全控制,覆盖电话、邮件、短信、企业微信、微信和http等多种告警能力

icon应用场景icon

DataInLong通过快速连接和融合云上或云下自建的各种数据,解决业务数据上云、数据平台构建、数据库迁移备份,以及业务升级、整合,数据访问加速、全文检索等多个场景中数据整合和同步流转问题。

场景一:大数据迁移上云
快速迁移云下数据至云上存储,上云过程支持全量、增量方式
场景二:数据入仓入湖/交互分析
对数据进行实时采集、治理及建模,使用大数据云服务的弹性和按需能力进行进一步业务和数据分
场景三:数据工程与科学平台构建
与调度、元数据等基础技术能力深度融合,作为技术底座和数据入口帮助企业快速搭建业务数据系统,轻松应对快速变化、日益增长的数据需求
icon能力特性icon
操作轻量化
基于画布模式以数据节点为单位简化并统一技术配置,通过简单的拖拉拽操作即可完成开发
过程可视化
通过图表可视化的方式,从任务、链路、节点多粒度展示数据集成过程的数据流量、同步速率、资源使用率等核心指标和里程碑事件
管控精细化
支持复杂调度策略,细粒度权限控制,开发生产环境隔离,精细化的流量、速率、脏数据管控等
能力开放化
开放集成能力,支持灵活与各类基础技术能力、产品、平台系统进行数据对接
icon引擎架构icon

DataInLong集成引擎采用融合架构模式,统一集成配置方式支持轻量和海量场景灵活切换,覆盖主动采集、主动上报、缓冲和数据转换等全场景功能。引擎支持全托管运维,同时基于容器动态启动资源支持弹性资源使用。

海量+轻量融合架构
保持对单任务链路的支持,CDC等高时延要求场景时可灵活选择单任务执行。
覆盖多种agent
海量场景采集端可支持数据库、SDK、http等多种agent,并依赖云环境进行托管化部署,可灵活快速扩展各种数据源。
读写端解耦
海量场景读写分离,支持在读写端设置不同的并行度,保证读写速率均衡,进而提升任务稳定性。
icon数据模型icon

DataInLong 集成引擎采用星型数据模型,支持多种读写数据源进行 任意组合搭配,具有强大的可扩充性和灵活性。

icon优势特性icon

DataInLong引擎架构采用 批流一体,使用消息中间件缓存数据,同时采用重放消息+实时计算+窗口结合的方式完成批数据处理。

关键技术
• MQ:支持超高性能缓冲队列,基于存储与计算分离架构设计,支持快速水平扩展以应对流量高峰
• 计算引擎:写任务统一基于Flink,有状态计算可以实现高吞吐以及高并发等多种方式的灵活写入,支持多种数据转换以及数据连接能力。
技术优势:
• 读写分离:支持在读写端设置不同的并行度,可以保证读写速率均衡,进一步实现读写的解耦
• 传输可靠:利用消息缓存,具备应付高峰流量、数据冲放等能力进一步保障数据传输可靠性
产品推荐 查看更多>>
    腾讯云 京腾云仓解决方案

    京腾云仓京腾云仓解决方案是腾讯智慧零售和京东物流联手打造的一站式私域营销&物流履约SaaS解决方案,旨在以腾讯智慧零售的电商私域场、以京东云仓的商品和物流生态场,为用户拓展私域生态新生意、新增长。

    流量+营销+推广+运营+物流托管

    腾讯生态一体化私域营销解决方案

    品牌授权,提升用户服务影响力

    一体化线上商城解决方案

    腾讯云TI-OCR训练平台

    腾讯云TI-OCR训练平台,单模型支持多种类型任务,任务间能力互补。结构化指标更优,支持自然场景。优化文字纹理细节处理,支持布局、文字等多类模态信息输出。结构化&阅读理解,基于检索的知识库问答,支持信息抽取、文本摘要,具备较强的理解能力,应用于腾讯云官网封闭式问答场景中,阅读理解准确率大幅提升。

    支持OCR大模型精调

    基于DocLm的强大文字视觉编码

    具备较强的理解能力

    基于检索的知识库问答

    腾讯云文字识别产品OCR

    文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。

    将图片上的文字内容,智能识别成为可编辑的文本

    OCR 支持身份证、名片等卡证类和票据类的印刷体识别

    支持运单等手写体识别,支持提供定制化服务

    适应任意版式,提高数据可用性