比较好的分析型数据库

星环分布式数据库

星环分布式数据库（Transwarp ArgoDB）是星环科技自主研发的分布式数据库，可以替代Hadoop+MPP混合架构。支持标准SQL语法，提供实时数据处理、存算解耦、混合负载、数据联邦、异构服务器混合部署等领先技术能力。通过一个ArgoDB数据库，就可以满足数据仓库、实时数据仓库、数据集市、OLAP、AETP、联邦计算等各种需求。降低平台复杂性和IT总拥有成本的同时，提升业务响应速度。

比较好的分析型数据库更多内容

技术博客

分析型数据库：MPP 数据库的概念、技术架构与未来发展方向

PivotalGreenplum开源的MPP数据库，数据库实例采用PostgreSQL，可运行在标准硬件上华为GaussDB基于Postgres-XC深度自研的分析型数据库，可运行在标准硬件上，可扩展性较好—总体架构—MPP随着企业数据量的增多，为了配合企业的业务分析、商业智能等应用场景，从而驱动数据化的商业决策，分析型数据库诞生了。由于数据分析一般涉及的数据量大，计算复杂，分析型数据库一般都是采用大规模并行计算或者分布式计算来提升它的数据处理能力。本篇文章将详细介绍MPP数据库的概念，解决的问题、典型的厂商以及它的技术架构和未来的发展方向。—MPP数据库简介—分析型数据库是数据库的一个分支，主要设计目标是存储、管理和分析数据，一般存储的数据类型多，时间维度长，主要配合企业的业务分析、商业智能等应用场景，驱动数据化的商业决策。由于数据分析一般涉及的数据量大，计算复杂，分析型数据库一般都是采用大规模并行计算或者场景。全复制模式一般适合记录数比较少的表，一般情况下在各个数据库节点都完整的存储一份数据。这类表一般情况下用于大量的分析类场景，事务类操作比较少，因此虽然存储上有明显的浪费，但是在分析性场景下不再需要

来自：官网 / 技术博客

行业资讯

分析型数据库

分析型数据库是面向分析应用的数据库，与传统的数据库不同，分析型数据库可以对数据进行在线统计、数据在线分析、随即查询等发掘信息数据价值的工作，是数据库产品一个重要的分支。分析型数据库的主要目标是提供快速、高效的数据分析和查询处理，以便做出准确的业务决策。与事务型数据库相比，分析型数据库更注重对数据仓库的支持，以及对复杂查询和数据挖掘的需求。分析型数据库专注于支持复杂的查询和分析工作负载，以及提供高效的数据存储和查询性能，是支持数据分析和决策制定的重要工具。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发的高性能分布式数据库，在PB级数据量上提供极致的数据分析能力。多模型数据库ArgoDB支持标准SQL语法、分布式事务和存算解耦，提供高并发高速数据写入、复杂查询、多模分析和数据联邦等能力。通过一个ArgoDB数据库，就可以打造离线数据仓库、实时数据仓库、数据集市兼容Oracle、IBMDB2、Teradata数据库对SQL语言的扩展，目前已在各行各业成功完成Oracle、DB2、Teradata等国外产品的国产化替代。2019年8月，ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计的数据库产品。

来自：官网 / 行业资讯

行业资讯

分析型数据库和关系型数据库

分析型数据库和关系型数据库是两种不同用途的数据库系统，它们在设计、功能和优化方面有所不同。以下是它们的主要区别：用途：分析型数据库：主要用于数据仓库和大数据分析，支持复杂的分析查询，如数据挖掘、预测分析和趋势分析。关系型数据库：主要用于事务处理系统，如客户关系管理（CRM）、企业资源规划（ERP）等，支持日常的事务处理和操作。查询类型：分析型数据库：优化了对大数据集的读操作，特别是聚合查询和扫描大量记录。关系型数据库：优化了对小到中等数据集的读写操作，特别是点查询和事务处理。数据模型：分析型数据库：通常使用多维数据模型（如星型模型或雪花模型），这些模型适合于分析型查询。关系型数据库：使用关系模型，数据以表格的形式存储，通过行和列组织数据。性能优化：分析型数据库：针对分析查询进行了优化，如使用列式存储、数据立方体和预计算。关系型数据库：针对事务处理进行了优化，如使用行式存储、索引和事务日志。数据更新频率：分析型数据库：数据通常以批量方式加载，更新频率较低。关系型数据库：数据更新频繁，支持高并发的读写操作。数据规模：分析型数据库：设计用于处理大规模数据集，通常存储在数据仓库中。关系型

来自：官网 / 行业资讯

行业资讯

关系型数据库和非关系型数据库区别

程度的数据不一致，以换取更高的可用性和性能。性能：关系型数据库：在处理复杂查询和事务时性能较好。非关系型数据库：在处理大量非结构化数据和高并发读写操作时性能较好。适用场景：关系型数据库：适合需要高度数据关系型数据库和非关系型数据库的主要区别可以概括如下：数据模型：关系型数据库：基于关系模型，数据存储在表格中，通过行和列的形式组织，数据之间通过关系（外键）相互关联。非关系型数据库：不基于关系模型，数据存储方式多样，包括键值对、文档、宽列存储、图形数据库等。查询语言：关系型数据库：使用SQL作为查询语言，支持复杂的查询和事务处理。非关系型数据库：查询语言或接口各不相同，通常不如SQL强大，但更简单，更适合特定的数据模型。事务处理：关系型数据库：支持ACID事务，保证事务的可靠性。非关系型数据库：通常支持BASE原则，强调可用性和最终一致性。扩展性：关系型数据库：水平扩展（增加更多服务器）较为困难，通常采用垂直扩展（增加单个服务器的资源）。非关系型数据库：设计上更易于水平扩展，适合大规模分布式系统。一致性：关系型数据库：强调强一致性，数据更新后立即对所有事务可见。非关系型数据库：可能允许一定

来自：官网 / 行业资讯

行业资讯

olap数据库（分析型数据库）

OLAP（On-lineAnalyticalProcessing）数据库是一种用于支持维分析和数据挖掘的数据库技术。与传统的关系型数据库（RDBMS）相比，具有更强大的分析和查询能力。OLAP数据库比较等。多维数据分析：OLAP数据库的核心是多维数据分析，它允许用户从多个角度和聚合层次对数据进行查询和分析。例如，用户可以按时间、地域、产品等多个维度来分析销售数据，从而得到不同时间段、不同地区、不同，从而做出更准确、更有效的决策。OLAP数据库具有以下特点：面向决策支持：OLAP数据库的设计目的是为了支持决策制定和商务智能，因此它通常包含了许多高级的分析和报表功能，例如数据挖掘、趋势分析、预算计算。快速的数据响应：随着数据规模的不断扩大，OLAP数据库需要能够快速地处理和分析大量数据。因此，OLAP数据库通常采用了一些优化技术，如预计算、缓存、分区等，以提高查询性能。支持多种数据源：OLAP数据库可以支持多种数据源，包括关系型数据库、Excel表格、文本文件等。此外，OLAP数据库还可以通过数据仓库（DataWarehouse）进行数据整合和抽取，以提供全面的数据分析和决策支持

来自：官网 / 行业资讯

行业资讯

什么是分析型数据库?

什么是分析型数据库?分析型数据库是一种专门用于存储和处理大量结构化数据的数据库系统，它的设计目标是支持复杂的数据分析和挖掘操作，提供高性能、可扩展的查询和分析方案。与传统的关系型数据库相比，分析型数据库具有更高的处理速度，更灵活的架构，更适合大规模数据的查询和分析，以及更优化的资源利用方式，是商业智能(BI)及数据挖掘分析领域的重要工具。分析型数据库的应用包括金融分析、CRM、市场分析、科学实验室、医疗、物流等多个领域。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发的高性能分布式数据库，在PB级数据量上提供极致的数据分析能力。多模型数据库ArgoDB支持标准SQL语法、分布式事务和存算解耦，提供高并发高速数据写入、复杂查询、多模分析和数据联邦等能力。通过一个ArgoDB数据库，就可以打造离线数据仓库、实时数据仓库、数据集市和联邦计算平台等数据分析系统，提供、Teradata数据库对SQL语言的扩展，目前已在各行各业成功完成Oracle、DB2、Teradata等国外产品的国产化替代。2019年8月，ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计的数据库产品。

来自：官网 / 行业资讯

行业资讯

分析型数据库（Analytical Database）

分析型数据库（AnalyticalDatabase）主要对来自交易数据库或其他数据源的历史数据进行高效地批量查询或分析，主要用于企业内部数据决策分析、数字化运营等领域。相较于传统的关系型数据库分析型数据库的主要优势在于其对“读”操作的高效性能。传统的关系型数据库对“写”操作进行了优化，以支持高并发、高事务的场景，但对于复杂的聚合分析等查询操作，效率会大打折扣。而分析数据库则专门针对“读”操作进行优化，支持复杂的多维分析、跨表连接等高效查询，速度比传统的关系型数据库快数倍甚至是数十倍。此外，分析型数据库支持列式存储，与传统的行式存储不同，列式存储将同列的数据存储在一起，由于同一列中的数据。分析型数据库还常提供一系列高级数据分析的功能，如多维分析OLAP（OnlineAnalyticalProcessing），数据挖掘和机器学习等，这些功能可以帮助用户更更准确地发现数据之间的关联性和隐藏的规律，进而利用这些信息做出更加准确的预测。分析型数据库是一种专门用于企业内部数据分析的解决方案，帮助企业更好地应对竞争、优化业务、更快地做出合理决策。对于那些需要分析海量历史数据的企业来说，分析型

来自：官网 / 行业资讯

行业资讯

向量数据库和关系型数据库的主要区别

快速找到相似的数据项，而向量数据库正是为此而设计的。而关系型数据库则适用于广泛的应用场景，包括企业应用、事务处理、数据仓库和复杂的数据分析等。它们能够满足各种复杂的数据处理需求，是大多数企业和组织在数据向量数据库和关系型数据库在数据模型、数据存储、查询操作等方面存在显著的差异。1、从数据模型的角度来看，向量数据库专门设计用于存储和查询向量数据。这些向量数据通常表示为数值向量或嵌入向量，是机器学习、自然语言处理等领域中常见的数据形式。向量数据库的数据模型主要围绕向量的存储和相似性搜索展开，能够高效地处理这类数据。而关系型数据库则采用表格形式的数据模型，数据以行和列的方式组织，支持复杂的结构化数据性能，确保在处理大规模向量数据时能够保持高效。而关系型数据库则以表格的形式存储数据，通过固定模式和模式验证来确保数据的一致性和完整性。这种存储方式使得关系型数据库在处理结构化数据时具有高度的可靠性和稳定性。3、在查询操作方面，向量数据库主要用于相似性搜索和向量之间的比较。查询操作通常涉及计算向量之间的距离或相似性，以找到相似的向量。这种查询方式非常适合于推荐系统、自然语言处理等需要快速检索相似数据的

来自：官网 / 行业资讯

行业资讯

分析型数据库的优势有哪些？

分析型数据库的优势主要有：处理海量数据能力：分析型数据库具备高效处理PB级别以上数据的能力，能够轻松处理大型数据集。处理速度快：分析型数据库提供灵活的查询方式，以及针对大规模数据处理进行了优化，能够在短时间内快速完成数据分析任务。数据可视化和报表：分析型数据库能够与多种可视化和报表工具集成，帮助用户更好地展示分析结果及预测性分析。处理多样化数据源：分析型数据库可以处理多样化的数据类型，包括结构化数据的安全性。高并发处理能力：分析型数据库能够同时执行多个并发查询和分析工作，提高了系统的性能和效率。可扩展性强：分析型数据库具备可扩展性，可以在多个节点和服务器上存储和处理数据，以适应不断增长的数据量。易于管理：分析型数据库通常提供直观易用的管理工具、自动化维护和监控等功能，使得系统管理变得相对简单。星环分布式数据库-TranswarpArgoDBArgoDB是星环科技自主研发的高性能和半结构化、异构数据，以及不同内部和外部数据源，如云存储，Hadoop等。高容错性、高可用性和高安全性：分析型数据库可以通过复制和备份技术提供高容错性和高可用性，同时采用标准加密协议保护敏感数据，保证

来自：官网 / 行业资讯

猜你喜欢

产品文档

5.6 数据操作语句

本章节的示例语句均可在示例图my_graph中执行，执行前请先创建示例图my_graph，建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.20 StellarDB 5.0.1 动态图(Dynamic Graph)模型（新）

为什么引入动态图模型？在实际应用过程中很容易可以发现，图数据在很多图数据的应用场景中并不是静态不变的，而是动态演进的，这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等；又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来，不仅可以用于历史数据规律的总结，还可以利用动态图数据进行动态图神经网络相关技术的研究，从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景，譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类，一类是节点或边的属性的值的变化；另一类变化是子图（结构）的变化，如新增/删除点边。这两种图数据的动态变化可以单独发生，也可以同时发生。从图数据的属性变化角度来看，StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本（而非新数据覆盖旧数据）。在实际数据开发使用中，还可以结合诸如柱状图、趋势图等对历史数据进行可视化，更加直观、更加适合业务使用。从图数据的子图（结构）的角度来看，StellarDB5.0.1动态图模型还可以返回不同时间子图...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

3 安装 StellarDB

3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.12 变量声明

声明简介声明是指为特定数据类型的变量分配一定的存储空间，并命名该变量以便引用它；必须先声明变量，然后才能引用它；对声明的变量可以进行赋值操作来改变它的值；声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型，且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示：语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

4 快速入门

快速上手本章节将引导您快速熟悉StellarDB，并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中，"StellarDB初探"一节通过构建一张人物关系图，从零介绍如何在StellarDB进行基本操作；"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图，帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录，会自动跳转Federation登录页面，按如图方式登录：KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中，我们为"hello_world"图创建Boy和Girl两种类型的点，两种类型的点均包含name、salary、age、single四...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

6.1 图计算

StellarDB5.0.1版本对图算法场景进行了大规模改进和提升，内置算法性能得到较大提升。在语法方面，StellarDB5.0.1的内置图算法对于返回的节点，会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid，而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外，对于图算法返回的节点，我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时，使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图，用于加速图算法执行过程。创建视图创建视图的语法如下所示：createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.17 索引（新）

索引是数据库中某些数据的冗余副本，目的是使查询性能更优。作为代价，数据库需要额外存储空间和较慢写入速度，因此决定哪些字段需要索引是一项重要且不易的任务。（新）StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持，在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同，注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.2 TEoC 前置参数

通过beeline或JDBC时，设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式（默认为immediate模式）immediate模式通常用于并发及短查询场景，查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景，创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

7.1 自定义函数

StellarDB支持用户添加自定义函数，添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发，可继承实现两种基类，编译成jar包，通过指定命令加载到StellarDB。需要实现的基类为如下两种，可自行选择继承合适的基类：继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单，功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void，支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数，若字符串执行拼接，in...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.10 表达式

类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1，2，3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

热门活动

大数据基础平台

大数据云平台

数据库

数据开发工具

智能分析工具

AI基础设施平台

软硬一体产品

金融解决方案

交通解决方案

医疗解决方案

教育解决方案

能源解决方案

制造业解决方案

政府解决方案

运营商解决方案

比较好的分析型数据库