比较好的 分析型数据库

星环分布式数据库
星环分布式数据库(Transwarp ArgoDB)是星环科技自主研发分布式数据库,可以替代Hadoop+MPP混合架构。支持标准SQL语法,提供实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等领先技术能力。通过一个ArgoDB数据库,就可以满足数据仓库、实时数据仓库、数据集市、OLAP、AETP、联邦计算等各种需求。降低平台复杂性和IT总拥有成本同时,提升业务响应速度。

比较好的 分析型数据库 更多内容

PivotalGreenplum开源MPP数据库数据库实例采用PostgreSQL,可运行在标准硬件上华为GaussDB基于Postgres-XC深度自研分析数据库,可运行在标准硬件上,可扩展性较好—总体架构—MPP随着企业数据增多,为了配合企业业务分析、商业智能等应用场景,从而驱动数据商业决策,分析数据库诞生了。由于数据分析一般涉及数据量大,计算复杂,分析数据库一般都是采用大规模并行计算或者分布式计算来提升它数据处理能力。本篇文章将详细介绍MPP数据库概念,解决问题、典型厂商以及它技术架构和未来发展方向。—MPP数据库简介—分析数据库数据库一个分支,主要设计目标是存储、管理和分析数据,一般存储数据类型多,时间维度长,主要配合企业业务分析、商业智能等应用场景,驱动数据商业决策。由于数据分析一般涉及数据量大,计算复杂,分析数据库一般都是采用大规模并行计算或者场景。全复制模式一般适合记录数比较表,一般情况下在各个数据库节点都完整存储一份数据。这类表一般情况下用于大量分析类场景,事务类操作比较少,因此虽然存储上有明显浪费,但是在分析性场景下不再需要
行业资讯
分析数据库
分析数据库是面向分析应用数据库,与传统数据库不同,分析数据库可以对数据进行在线统计、数据在线分析、随即查询等发掘信息数据价值工作,是数据库产品一个重要分支。分析数据库主要目标是提供快速、高效数据分析和查询处理,以便做出准确业务决策。与事务数据库相比,分析数据库更注重对数据仓库支持,以及对复杂查询和数据挖掘需求。分析数据库专注于支持复杂查询和分析工作负载,以及提供高效数据存储和查询性能,是支持数据分析和决策制定重要工具。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发高性能分布式数据库,在PB级数据量上提供极致数据分析能力。多模型数据库ArgoDB支持标准SQL语法、分布式事务和存算解耦,提供高并发高速数据写入、复杂查询、多模分析数据联邦等能力。通过一个ArgoDB数据库,就可以打造离线数据仓库、实时数据仓库、数据集市兼容Oracle、IBMDB2、Teradata数据库对SQL语言扩展,目前已在各行各业成功完成Oracle、DB2、Teradata等国外产品国产化替代。2019年8月,ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计数据库产品。
分析数据库和关系数据库是两种不同用途数据库系统,它们在设计、功能和优化方面有所不同。以下是它们主要区别:用途:分析数据库:主要用于数据仓库和大数据分析,支持复杂分析查询,如数据挖掘、预测分析和趋势分析。关系数据库:主要用于事务处理系统,如客户关系管理(CRM)、企业资源规划(ERP)等,支持日常事务处理和操作。查询类型:分析数据库:优化了对大数据读操作,特别是聚合查询和扫描大量记录。关系数据库:优化了对小到中等数据读写操作,特别是点查询和事务处理。数据模型:分析数据库:通常使用多维数据模型(如星模型或雪花模型),这些模型适合于分析查询。关系数据库:使用关系模型,数据以表格形式存储,通过行和列组织数据。性能优化:分析数据库:针对分析查询进行了优化,如使用列式存储、数据立方体和预计算。关系数据库:针对事务处理进行了优化,如使用行式存储、索引和事务日志。数据更新频率:分析数据库数据通常以批量方式加载,更新频率较低。关系数据库数据更新频繁,支持高并发读写操作。数据规模:分析数据库:设计用于处理大规模数据集,通常存储在数据仓库中。关系
程度数据不一致,以换取更高可用性和性能。性能:关系数据库:在处理复杂查询和事务时性能较好。非关系数据库:在处理大量非结构化数据和高并发读写操作时性能较好。适用场景:关系数据库:适合需要高度数据关系数据库和非关系数据库主要区别可以概括如下:数据模型:关系数据库:基于关系模型,数据存储在表格中,通过行和列形式组织,数据之间通过关系(外键)相互关联。非关系数据库:不基于关系模型,数据存储方式多样,包括键值对、文档、宽列存储、图形数据库等。查询语言:关系数据库:使用SQL作为查询语言,支持复杂查询和事务处理。非关系数据库:查询语言或接口各不相同,通常不如SQL强大,但更简单,更适合特定数据模型。事务处理:关系数据库:支持ACID事务,保证事务可靠性。非关系数据库:通常支持BASE原则,强调可用性和最终一致性。扩展性:关系数据库:水平扩展(增加更多服务器)较为困难,通常采用垂直扩展(增加单个服务器资源)。非关系数据库:设计上更易于水平扩展,适合大规模分布式系统。一致性:关系数据库:强调强一致性,数据更新后立即对所有事务可见。非关系数据库:可能允许一定
OLAP(On-lineAnalyticalProcessing)数据库是一种用于支持维分析数据挖掘数据库技术。与传统关系数据库(RDBMS)相比,具有更强大分析和查询能力。OLAP数据库比较等。多维数据分析:OLAP数据库核心是多维数据分析,它允许用户从多个角度和聚合层次对数据进行查询和分析。例如,用户可以按时间、地域、产品等多个维度来分析销售数据,从而得到不同时间段、不同地区、不同,从而做出更准确、更有效决策。OLAP数据库具有以下特点:面向决策支持:OLAP数据库设计目的是为了支持决策制定和商务智能,因此它通常包含了许多高级分析和报表功能,例如数据挖掘、趋势分析、预算计算。快速数据响应:随着数据规模不断扩大,OLAP数据库需要能够快速地处理和分析大量数据。因此,OLAP数据库通常采用了一些优化技术,如预计算、缓存、分区等,以提高查询性能。支持多种数据源:OLAP数据库可以支持多种数据源,包括关系数据库、Excel表格、文本文件等。此外,OLAP数据库还可以通过数据仓库(DataWarehouse)进行数据整合和抽取,以提供全面的数据分析和决策支持
什么是分析数据库?分析数据库是一种专门用于存储和处理大量结构化数据数据库系统,它设计目标是支持复杂数据分析和挖掘操作,提供高性能、可扩展查询和分析方案。与传统关系数据库相比,分析数据库具有更高处理速度,更灵活架构,更适合大规模数据查询和分析,以及更优化资源利用方式,是商业智能(BI)及数据挖掘分析领域重要工具。分析数据库应用包括金融分析、CRM、市场分析、科学实验室、医疗、物流等多个领域。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发高性能分布式数据库,在PB级数据量上提供极致数据分析能力。多模型数据库ArgoDB支持标准SQL语法、分布式事务和存算解耦,提供高并发高速数据写入、复杂查询、多模分析数据联邦等能力。通过一个ArgoDB数据库,就可以打造离线数据仓库、实时数据仓库、数据集市和联邦计算平台等数据分析系统,提供、Teradata数据库对SQL语言扩展,目前已在各行各业成功完成Oracle、DB2、Teradata等国外产品国产化替代。2019年8月,ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计数据库产品。
分析数据库(AnalyticalDatabase)主要对来自交易数据库或其他数据历史数据进行高效地批量查询或分析,主要用于企业内部数据决策分析、数字化运营等领域。相较于传统关系数据库分析数据库主要优势在于其对“读”操作高效性能。传统关系数据库对“写”操作进行了优化,以支持高并发、高事务场景,但对于复杂聚合分析等查询操作,效率会大打折扣。而分析数据库则专门针对“读”操作进行优化,支持复杂多维分析、跨表连接等高效查询,速度比传统关系数据库快数倍甚至是数十倍。此外,分析数据库支持列式存储,与传统行式存储不同,列式存储将同列数据存储在一起,由于同一列中数据分析数据库还常提供一系列高级数据分析功能,如多维分析OLAP(OnlineAnalyticalProcessing),数据挖掘和机器学习等,这些功能可以帮助用户更更准确地发现数据之间关联性和隐藏规律,进而利用这些信息做出更加准确预测。分析数据库是一种专门用于企业内部数据分析解决方案,帮助企业更好地应对竞争、优化业务、更快地做出合理决策。对于那些需要分析海量历史数据企业来说,分析
快速找到相似的数据项,而向量数据库正是为此而设计。而关系数据库则适用于广泛应用场景,包括企业应用、事务处理、数据仓库和复杂数据分析等。它们能够满足各种复杂数据处理需求,是大多数企业和组织在数据向量数据库和关系数据库数据模型、数据存储、查询操作等方面存在显著差异。1、从数据模型角度来看,向量数据库专门设计用于存储和查询向量数据。这些向量数据通常表示为数值向量或嵌入向量,是机器学习、自然语言处理等领域中常见数据形式。向量数据库数据模型主要围绕向量存储和相似性搜索展开,能够高效地处理这类数据。而关系数据库则采用表格形式数据模型,数据以行和列方式组织,支持复杂结构化数据性能,确保在处理大规模向量数据时能够保持高效。而关系数据库则以表格形式存储数据,通过固定模式和模式验证来确保数据一致性和完整性。这种存储方式使得关系数据库在处理结构化数据时具有高度可靠性和稳定性。3、在查询操作方面,向量数据库主要用于相似性搜索和向量之间比较。查询操作通常涉及计算向量之间距离或相似性,以找到相似的向量。这种查询方式非常适合于推荐系统、自然语言处理等需要快速检索相似数据
分析数据库优势主要有:处理海量数据能力:分析数据库具备高效处理PB级别以上数据能力,能够轻松处理大型数据集。处理速度快:分析数据库提供灵活查询方式,以及针对大规模数据处理进行了优化,能够在短时间内快速完成数据分析任务。数据可视化和报表:分析数据库能够与多种可视化和报表工具集成,帮助用户更好地展示分析结果及预测性分析。处理多样化数据源:分析数据库可以处理多样化数据类型,包括结构化数据安全性。高并发处理能力:分析数据库能够同时执行多个并发查询和分析工作,提高了系统性能和效率。可扩展性强:分析数据库具备可扩展性,可以在多个节点和服务器上存储和处理数据,以适应不断增长数据量。易于管理:分析数据库通常提供直观易用管理工具、自动化维护和监控等功能,使得系统管理变得相对简单。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发高性能和半结构化、异构数据,以及不同内部和外部数据源,如云存储,Hadoop等。高容错性、高可用性和高安全性:分析数据库可以通过复制和备份技术提供高容错性和高可用性,同时采用标准加密协议保护敏感数据,保证
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...