分布式分析型数据库的分布式架构

星环分布式数据库
星环分布式数据库(Transwarp ArgoDB)是星环科技自主研发分布式数据库,可以替代Hadoop+MPP混合架构。支持标准SQL语法,提供实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等领先技术能力。通过一个ArgoDB数据库,就可以满足数据仓库、实时数据仓库、数据集市、OLAP、AETP、联邦计算等各种需求。降低平台复杂性和IT总拥有成本同时,提升业务响应速度。

分布式分析型数据库的分布式架构 更多内容

数据分析业务场景国产化分布式多模数据库,能够一站替代Hadoop+MPP混合架构,提供多模分析、实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等先进技术能力,一站满足数据分布式关系数据库有哪些?星环科技在基础软件产品领域积累多年,在大数据平台TDH研发过程中积累了大量SOL、PL/SOL、数据库优化器、分布式事务等基础技术和专利,相关技术优势可以在关系数据库中再次落地,从而加速分布式数据库研发效率。采用新一代基于分布式计算数据库技术,自主研发了分布式交易数据库KunDB和分布式数据库ArgoDB。基于KunDB与ArgoDB数据库解决方案,为企业核心业务数据库升级改造、核心分析系统建设、创新应用开发国产化替代等业务场景提供完备能力支撑。TranswarpArgoDB-星环分布式数据库TranswarpArgoDB是星环科技自主研发面向基准测试并经过TPC官方审计数据库产品。TranswarpKunDB-星环分布式交易数据库TranswarpKunDB是星环科技基于分布式技术自主研发分布式交易数据库,提供完整关系数据库
-TranswarpArgoDBTranswarpArgoDB是星环科技自主研发分布式分析闪存数据库,可以替代Hadoop+MPP混合架构。支持标准SQL语法,提供多模分析、实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等数据高实时性检索等场景。星环分布式数据库-TranswarpStellarDBTranswarpStellarDB是星环科技自主研发企业级分布式数据库,提供高性能图存储、计算、分析、查询和星环科技推出一款分布式时空数据库,支持空间地理、时空轨迹、遥感影像等海量数据存储、查询、分析和挖掘服务。Spacture具备高性能数据读写和分析能力。支持OGC标准图形类型和空间关系,兼容常见控等场景。星环分布式时序数据库-TranswarpTimeLyreTranswarpTimeLyre是星环科技推出一款时序数据库,提供海量时间序列数据高效压缩存储和高性能分析服务。TimeLyre数据库产品,目前已在各行各业成功替代Oracle、DB2、Teradata等国外产品。星环分布式交易数据库-TranswarpKunDBKunDB是星环科技自主研发分布式交易数据库,具备高度兼容
什么是分布式向量数据库?分布式向量数据库是一种基于分布式系统架构向量数据库,它将向量数据库功能和分布式系统特性相结合,可以实现在大规模集群上存储和处理海量向量数据。相比于传统向量数据库,在分布式向量数据库中,数据可以被分散存储在分布式系统中多个节点上,并且可以通过负载均衡等技术实现数据高效查询和分片处理,从而提高存储和计算效率和性能。星环科技向量数据库-TranswarpHippoTranswarpHippo是一款企业级云原生分布式向量数据库,支持存储,索引以及管理海量向量数据集,能够高效解决向量相似度检索以及高密度向量聚类等问题。Hippo具备高可用、高性能、易拓展等原生系统:Hippo采用全面容器化部署,支持服务弹性扩缩容;同时具备多租户和强大资源管控能力。分布式部署:具备分布式部署能力,满足大规模集群部署需求;通过Raft算法确保数据强一致性;同时提供故障;同时支持多类索引,满足不同业务场景;支持检索速度和内存使用特定优化,支持寄存器级算法优化。多模型联合分析:基于多模型统一技术架构,向量数据与关系数据、图数据、时序数据等多种模型数据进行统一存储管理
分布式系统和分布式数据库都是现代信息技术中重要概念,它们在架构、目标和实现方式上有一些相似之处,但也存在显著区别。以下是对它们详细对比:分布式系统定义:分布式系统是由多个独立计算机节点组成存储和管理。它们都采用了分布式架构,通过多个节点协同工作来提高系统性能和可用性。区别:分布式系统是一个更广泛概念,可以包括分布式计算、分布式存储、分布式网络等多个领域,而分布式数据库仅专注于数据库管理和数据存储。分布式数据库需要解决数据一致性、分布式事务等特有的问题,而分布式系统则更关注整体架构设计、节点通信和任务调度等。分布式系统应用场景更加广泛,而分布式数据库主要应用于需要高效数据管理和访问场景。等。分布式数据库定义:分布式数据库是一种将数据数据库操作分散到多个节点上数据库管理系统。这些节点可以位于不同地理位置或不同硬件设备上,通过网络连接在一起,共同提供数据存储、查询和更新服务能够保持一致性和完整性。应用场景:适用于需要处理大规模数据、高并发访问和跨地域分布式部署场景,如大型互联网应用、金融服务、物联网应用等。联系与区别联系:分布式数据库分布式系统一种特例,专注于数据
分布式数据库和关系数据库架构数据模型、事务管理、一致性和可扩展性等方面有显著区别。以下是它们主要对比:关系数据库数据模型:关系模型:使用表格(表)来组织数据,表由行和列组成。数据之间,适合处理大规模数据和高并发请求。动态扩展:许多分布式数据库支持在线扩展,即在系统运行时增加或减少节点,而不需要停机。适用场景:适合大规模数据存储和高并发访问场景,如大型互联网应用、大数据分析分布式事务处理等。总结选择依据:数据一致性和事务管理要求:如果业务对数据一致性和事务管理要求非常高,关系数据库可能更合适。数据规模和并发需求:如果需要处理大规模数据和高并发请求,分布式数据库是更好选择。灵活性和可扩展性需求:如果需要灵活可扩展性和支持多种数据模型,分布式数据库更具优势。系统复杂性和管理成本:关系数据库管理和维护相对简单,而分布式数据库管理和维护更为复杂,需要考虑系统复杂性和管理成本。分布式数据库灵活和高效。适用场景:适合需要严格事务管理和数据一致性应用,如金融系统、企业资源规划(ERP)系统等。分布式数据库数据模型:多种数据模型:可以支持关系模型,也可以支持NoSQL数据模型,具体
分布式存储和分布式数据库都是现代数据管理重要技术,它们在架构、功能和应用场景上有所不同,但也有一定联系和交集。分布式存储定义:分布式存储是一种将数据分散存储在多个物理或逻辑节点上存储系统。这些存储和高可用性场景,如大数据分析、视频监控、云存储服务等。分布式数据库定义:分布式数据库是一种将数据数据库操作分散到多个节点上数据库管理系统。这些节点可以位于不同地理位置或不同硬件设备上,通过服务、物联网应用等。联系与区别联系:分布式数据库通常会利用分布式存储来存储数据分布式存储为分布式数据库提供了底层数据存储和管理能力。它们都可以通过分布式架构提高系统可扩展性和高可用性,满足大规模数据管理和访问需求。区别:分布式存储主要关注数据存储和访问,而分布式数据库则更关注数据组织、管理和查询。分布式数据库提供了更丰富数据操作功能,如事务管理、索引、查询优化等,而分布式存储主要提供数据存储和读写操作。分布式数据库通常需要解决数据一致性、分布式事务等复杂问题,而分布式存储则更注重数据持久化和可用性。
分布式关系数据库是一种将数据分散存储在多个物理或逻辑节点上数据库系统,它具有以下特点和应用场景:特点:数据分布存储:数据被分散存储在多个节点上,通过网络连接来实现数据共享和访问。高可扩展性数据一致性问题,确保在不同节点间数据保持一致。支持SQL查询:许多分布式关系数据库支持SQL查询,便于数据操作和事务管理。水平扩展:通过数据分片实现水平扩展,提高系统整体性能和可用性。应用,提供高可用性和可扩展性。大数据分析:通过对海量数据分布式存储和查询,快速获取有价值信息,支持数据挖掘和机器学习等技术。:能够通过增加节点来扩展存储容量和处理能力,以应对数据增长。高并发性:支持大量并发访问,适用于需要高并发处理场景。高可用性:通过数据复制和故障转移机制,提高系统可用性和容错性。数据一致性:需要解决场景:互联网和电子商务平台:处理大量用户生成数据和实时互动,需要高并发处理能力和数据快速读写。金融行业:在支付、转账等金融交易中,需要保证数据一致性和事务性。物联网:满足设备之间连接和数据交换需求
)及境外专利8项。公司基于分布式架构数据基础平台、分析数据库产品已达到业界先进水平,相关产品已通过国际知名组织TPCTPC-DS基准测试并通过了官方审计,公司也是该基准测试自2006年标准发布分布式数据库相对于集中式数据库仍处于发展阶段,具有以下优点:可存储数据模型类别多,易于拓展、叠加存储介质;可处理高并发任务,计算速度快;本质上是提高了数据备份安全。从发展来看,数据库技术演变历史为从集中式到分布式,从关系到非关系。星环科技作为大数据企业,分布式数据库产品技术领先。在分布式领域,公司专利众多且技术领先。截至2022年6月30日,公司已获授权境内专利77项(其中发明专利74项平台厂商,是Gartner发布该魔力象限以来首个进入该魔力象限中国公司。2022年6月,公司多个产品或子产品入选Gartner发布《中国数据库管理系统供应商识别指南》,在识别的8类数据库管理系统产品中,公司入选产品覆盖其中7类,是覆盖超过7类或以上产品四家厂商之一,以及覆盖多模数据库厂商之一。
数据完整性保证:它采用一系列机制来保证数据完整性,如多副本数据复制、数据冗余和容错机制,确保数据可靠性和一致性。分布式交易数据库通常会采用分布式架构和高可用技术,使用分布式事务协议来处理跨节点分布式交易数据库指实时、面向应用分布式数据库,响应及时性要求很高,具备快速读写单行数据能力,同时保证数据完整性。分布式交易数据库是一种专注于处理高并发实时交易分布式数据库系统。它主要用于需要高响应性能和数据完整性应用场景,例如金融交易、电子商务等。分布式交易数据库具备以下特点:实时性要求高:它需要满足实时性要求,能够快速响应用户提交交易请求,即时处理数据更新。面向应用:它提供了数据更新操作,利用缓存技术和预读预写等优化策略提高读写性能。同时,它还需要具备水平扩展和负载均衡等能力,以适应大规模数据和用户访问需求。星环分布式交易数据库-TranswarpKunDBKunDB是星环科技自主研发分布式交易数据库,具备高度兼容Oracle和MySQL、高可用、高性能、集中式与分布式一体化等特性,为企业核心业务系统提供完备国产化数据库能力支撑。基于自研内存数据库引擎
2.1关于社区版您可能想要知道的2.2怎么联系到我们?遇到问题怎么办2.3产品资源汇总
产品文档
1 产品介绍
QuarkGateway是连接客户端与QuarkServer服务器的一个中间件,是客户请求QuarkServer服务的总入口,它严格按照用户预定义的配置文件,根据用户的不同需求来提供负载均衡、SQL规则路由、高可用(包括超时转发和宕机转发)、Web运维、Inceptor安全(LDAP,KERBEROS)等各项功能。QuarkGateway可以在多个QuarkServer间平衡业务流量,能够有效地为客户端屏蔽掉集群细节,能将不同的SQL类型路由到不同的QuarkServer,并且解决了QuarkServer超时或宕机后无法执行任务的问题,提高了产品的可用性。QuarkGateway的主要功能包括:负载均衡在这种情景下QuarkGateway可以将特定的业务分担给多个QuarkServer,从而实现多个InceptorServer平衡业务流量的功能,完成此项功能的前提是QuarkServer的TAG属性一致。SQL规则路由QuarkGateway基于特定规则,可将不同类型的SQL路由到不同的QuarkServer。高可用性包括超时转发和宕机转发等,QuarkGateway可将超时或者宕机的...
产品文档
客户服务
技术支持感谢你使用星环信息科技(上海)股份有限公司的产品和服务。如您在产品使用或服务中有任何技术问题,可以通过以下途径找到我们的技术人员给予解答。email:support@transwarp.io技术支持热线电话:4007-676-098官方网址:http://www.transwarp.cn/论坛支持:http://support.transwarp.cn/意见反馈如果你在系统安装,配置和使用中发现任何产品问题,可以通过以下方式反馈:email:support@transwarp.io感谢你的支持和反馈,我们一直在努力!
hbaseSQL的IndexDDL支持创建和删除表的全局索引,包括:创建全局索引:CREATEGLOBALINDEX删除全局索引:DROPGLOBALINDEX但是,目前Hyperbase不支持使用SQL生成索引,您可以从HyperbaseShell中执行rebuild指令来生成索引,具体请参考《Hyperbase使用手册》。(创建索引前插入的数据没有索引,但是创建索引之后的数据有索引。)下面将具体介绍创建和删除索引的语法。创建全局索引:CREATEGLOBALINDEX语法:为Hyperbase表建全局索引CREATEGLOBALINDEX<index_name>ON<tableName>(<column1><SEGMENTLENGTHlength1>|<<(length1)>①[,<column2><SEGMENTLENGTHlength2>|<(length2)>,...]②);①column1:指根据哪个列建全局索引,可以有多个列,但不可包含首列(因该列映射为RowKey)。②...
表10.Hyperbase在Zookeeper上的znode节点及作用说明节点分类作用/hyperbase1(zookeeper.znode.parent)Operation节点根节点,包含所有被Hyperbase创建或使用的节点/hyperbase1/hbaseid(zookeeper.znode.clusterId)Operation节点HBaseMaster用UUID标示一个集群。这个clusterId也保存在HDFS上:hdfs:/<namenode>:<port>/hyperbase1/hbase./hyperbase1/rs(zookeeper.znode.rs)Operation节点RegionServer在启动的时候,会创建一个子节点(例如:/hbase/rs/m1.host),以标示RegionServer的在线状态。HbaseMaster监控这个节点,以获取所有OnlineRegionServer,用于Assignment/Balancing。/hyperbase1/master(zookeeper.znode.master)Operatio...
表9.Hyperbase在HDFS中的目录结构简介目录作用有无清理机制or如何清理/hyperbase1根目录/hyperbase1/.tmp临时目录,用于存储临时文件和写入过程中的临时数据。这些临时文件可能包括数据块的临时副本、临时索引文件或其他中间结果文件。写入过程中的临时数据:在hyperbase1中,数据的写入是通过WAL(Write-AheadLog)进行的,WAL用于记录数据变更操作。在写入过程中,hyperbase1会将数据写入到WAL中,同时也会将数据写入到对应的数据文件中。/hyperbase1/.tmp目录用于存储在写入过程中尚未完全写入数据文件的临时数据。这样做是为了确保数据写入的原子性和可靠性。hyperbase1会定期清理/hyperbase1/.tmp目录中的过期临时文件和数据,以避免该目录占用过多的磁盘空间。清理策略可以通过hyperbase1的配置进行调整和设置。/hyperbase1/archive归档目录,用于存储已归档的hyperbase1数据。表数据经过一段时间的存储后,可能会变得不再频繁访问或需要长期保存。为了节省存储空间和提高性能,hyper...
通过Manager管理平台,可一键部署Hyperbase。可以在第一次安装TranswarpDataHub集群时安装,也可以向安装好的集群另外安装Hyperbase服务。详细安装步骤及配置项,请参考《TDH安装手册》。安装Hyperbase可以分为以下步骤:软硬件环境检查:检查服务器配置、操作系统、浏览器是否满足要求。安装前配置:配置系统运行过程中所需的文件目录,确保系统运行正常。确认网络配置、Java环境、NTP服务器配置、安全配置、节点访问配置。安装Manager:安装Manager并实现集群管理。安装Hyperbase:您可以通过Manager管理平台安装Hyperbase,并在安装过程中选择所需的HDFS、YARN和Zookeeper等依赖服务以完成部署。产品包上传:在【应用市场】>【产品包】页面上传Hyperbase及相关服务的产品包。服务添加:通过【集群管理】>【添加服务】添加TranswarpHyperbase服务及TranswarpBasic组件(包括HDFS、YARN、Zookeeper、KunDB等)。配置安全:选择安全认证方式,可选简单认证或Kerbe...
为了方便您接下来的安装使用,社区版团队为您准备了视频教程,可以搭配手册内容一起查看:https://transwarp-ce-1253207870.cos.ap-shanghai.myqcloud.com/TDH-CE-2024-5/%E8%A7%86%E9%A2%91/%E5%BC%80%E5%8F%91%E7%89%88StellarDB%E5%AE%89%E8%A3%85%E8%A7%86%E9%A2%912024.5.mp4安装教程在安装启动StellarDB社区开发版容器之前,请务必执行dockerps确保环境当前无其他正在运行的开发版容器,如果有,请及时停止以防止后续端口冲突。请务必确保您的安装环境已经配置好了hostname以及/etc/hosts文件,否则hostname和IP地址将无法映射,最终导致安装失败。具体配置方式详见安装前系统配置改动安装流程步骤一将从官网下载下来的产品包上传至安装环境产品包名称:TDH-Stellardb-Standalone-Community-Transwarp-2024.5-X86_64-final.tar.gz步骤二执行下述命令进行解...
JSON配置操作简介表数据VS表的扩展数据索引是Hyperbase的核心功能之一,我们在使用Hyperbase时,常常会为表建各类索引,包括全局索引、局部索引和LOB索引,利用索引中的数据提高查询效率。索引中的数据不属于表数据,但是从表数据而来,和表密不可分,所以我们将表数据和它所有索引中的数据合称为表的扩展数据,也就是说,我们做如下定义:表的扩展数据=表数据+全局索引数据+局部索引数据+LOB索引数据表的元数据VS表的扩展元数据Hyperbase表的元数据包括表名、列族名、DATA_BLOCK_ENCODING、TTL、BLOCKSIZE等等。一张Hyperbase表的各个索引也有自己的元数据,和索引数据一样,索引的元数据和表的关系也十分紧密,所以我们将表的元数据和它所有索引的元数据合称为表的扩展元数据:表的扩展元数据=表的元数据+全局索引元数据+局部索引元数据+LOB索引元数据我们有时也会将表的元数据称为基础元数据或者Base元数据。JSON配置的命令行指令为操作表的扩展数据和扩展元数据服务,Hyperbase提供了扩展的命令行指令:describeInJson、alterUseJ...
HyperbaseWeb管理页面主要用于Hyperbase服务的各种数据和信息的查看,下面我们将介绍管理页面的一些简单操作。HMaster管理页面打开HyperbaseActiveMaster管理页面的方法有两种:根据集群的ActiveMaster的IP地址打开:http://master_node_ip:60010。如下图:图25.ActiveMasterWeb页面通过TDH管理页面中Hyperbase服务的HMaster的ServiceLink打开,详细流程如下:TranswarpDataHubWEB管理页面也要根据集群的ActiveMaster的IP地址打开,地址一般是http://master_node_ip:8180。打开对应的Hyperbase服务的Roles页面。如下图:图26.Hyperbase角色页面左上角服务名后的圆点颜色表示集群中的Hyperbase服务的状态,比如当前是绿色的Green(HEALTHY),健康状态。另两种状态是Yellow(WARNING)和Red(DOWN)。通过每个HMaster对应的ServiceLink可以打开HMaster管理页面。如下...