比较好的宽表数据库

实时NoSQL宽表数据库

Transwarp Hyperbase是星环科技自主研发的实时NoSQL宽表数据库。Hyperbase支持百万级高并发、毫秒级低延时业务需求，可以在普通廉价服务器集群上高效支持企业的高并发精确查询与范围查询、流处理应用、全文搜索以及高并发非结构化数据检索，同时支持以标准SQL为接口的高效数据访问，帮助用户快速开发历史数据查询、业务在线检索等应用。

比较好的宽表数据库更多内容

技术博客

TDH社区版上新宽表数据库Hyperbase，轻松实现海量数据的毫秒级精确检索

简单、更便捷的进行大数据分析。为了满足更多用户在存储以及高并发点查方面的需求,此次TDH社区版推出了星环科技自主研发的NoSQL宽表数据库TranswarpHyperbase。TranswarpHyperbase介绍Hyperbase是什么TranswarpHyperbase是星环科技自主研发的NoSQL宽表数据库，支撑百万级高并发、毫秒级低延时业务需求。支持结构化数据，及文本、图像、视频、对象等实时处理应用的需求。传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题（分库分表也不能很好解决），很难实现横向扩展，纵向扩展的空间也比较有限。Hyperbase能够轻易地通过在集群中增加或者Hyperbase关系数据库已经流行很多年，尽管Hadoop可以很好地解决大规模数据的离线批量处理问题，但是，受限于MapReduce编程框架的高延迟数据处理机制，使得Hadoop无法满足大规模数据减少硬件数量来实现性能的伸缩，提升集群的运行速度以及处理能力，轻松应对百万级高并发的查询业务。不同于传统的关系型数据库，Hyperbase采用列式存储模式，每个列族都由几个文件保存，不同列族的文件是

来自：官网 / 技术博客

资源

Transwarp Hyperbase宽表数据库白皮书

复杂多变的数据成为各单位机构面临的一大难题。基于上述的挑战，星环推出了TranswarpHyperbaseNoSQL宽表数据库，用来满足企业级用户经济灵活高效地管理数据的需求。Hyperbase能够随着信息时代的到来，数据已逐渐成为金融、企业、政府、运营商等单位机构的重要决策依据。以传统关系型数据库为代表的技术由于性能，成本，可扩展性等缺陷，很难满足爆炸式数据增长的需要，如何经济高效地管理海量轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩，从而进一步提升集群的运行速度以及处理能力，轻松应对百万级高并发的查询业务。Hyperbase支持以标准SQL为接口的高效数据访问，并提供高效的数据迁移工具，不仅能大幅度降低企业级用户数据应用变更和数据平台迁移的实施成本，还满足了用户在统一的数据平台上同时支撑新老业务的需求，大幅度降低了企业的运维成本。

来自：官网 / 资源中心

技术博客

分布式存储技术（下）：宽表存储与全文搜索引擎的架构原理、特性、优缺点解析

被一起查询的相关数据。当前DB-Engine中宽表NoSQL数据库的排名如下表，可以看到受欢迎的主要是Cassandra、HBase和Azure上的CosmosDB。接下来我们将介绍一下HBase的情况。HBase是一个面向列的分布式NoSQL数据库，是GoogleBigtable框架的开源实现，能够响应随机、实时的数据检索需求。HBase主要的存储和处理对象是大宽表，存储模式可以兼容本地存储机制确保数据库容错能力。通常的适用场景为：面向多版本、稀疏的、半结构化和结构化的数据高并发写入/查询的OLTP业务。HBase的数据模型由不同的逻辑概念构成，包括：表、行、行键、列、列族、单元、时间戳。表上会是层次化结构或者树形结构。这个做法的好处是非常容易增加半结构化或者结构化数据的处理能力。目前搜索引擎比较有代表性的数据库有开源Elasticsearch，国内星环科技有自研的搜索产品Scope。在。Document类似于关系型数据中行的概念，一个Document包含每一个Field中与之相应的数据值。Type类似数据库中的表级别概念，而Index是Elasticsearch中大的数据单位，与SQL的

来自：官网 / 技术博客

技术博客

分析型数据库：MPP 数据库的概念、技术架构与未来发展方向

场景。全复制模式一般适合记录数比较少的表，一般情况下在各个数据库节点都完整的存储一份数据。这类表一般情况下用于大量的分析类场景，事务类操作比较少，因此虽然存储上有明显的浪费，但是在分析性场景下不再需要PivotalGreenplum开源的MPP数据库，数据库实例采用PostgreSQL，可运行在标准硬件上华为GaussDB基于Postgres-XC深度自研的分析型数据库，可运行在标准硬件上，可扩展性较好—总体架构—MPPShared-nothing架构，每个数据库节点之间没有数据共享。MPP数据库一般可以通过增加数据库计算能力，此外因为多个实例，数据库总体的数据加载性能相比较单实例数据库也有很高的提升。数据分片是能够实现并行化计算的核心，MPP数据库有多种数据分片方式，主要包括3大类：Hash模式一般适用于事实表或大表，根据一条记录的某个字段或组合字段的hash值将数据分散到某个节点上，hash函数可以有多种方式。通过根据对给定字段的hash值来做数据分布，一个大表可以均匀的分散到MPP数据库的多个节点上，当对这个表查询时，MPP数据库编译器可以根据SQL中相应的检索字段将查询快速定位到某个或几个相关的数据库节点并将

来自：官网 / 技术博客

行业资讯

国内哪些公司图数据库、图挖掘方面做的比较好？

星环分布式图数据库-TranswarpStellarDBTranswarpStellarDB是星环科技自主研发的企业级分布式图数据库，提供高性能的图存储、计算、分析、查询和展示服务设计和迭代升级，推出了更高性能、更智能、更易用的企业级分布式图数据库StellarDB5.0。性能数倍提升，加速数据分析创新StellarDB5.0实现了存储引擎和计算引擎双引擎升级。在存储部分，全新中落地，StellarDB5.0接入了星环科技自研的ZenGraph深度图框架，将图数据库技术和深度图技术深度融合，利用图数据库的优势实现图数据快速地读取和写回，提供快速子图过滤能力，从而提升整个深度图链路的处理效率，StellarDB将进一步融合图数据库技术和深度图技术，提供更加易用、一体化的工业级图深度学习解决方案。简洁的动态图模型，图数据变化直观、高效分析许多图数据应用场景中的图数据并不是静态不变的，而是动态变化的。突破数据模型屏障，挖掘数据融合分析价值大数据时代数据量井喷、业务融合多样化，企业需要部署多个不同类型的数据库用来存储不同的数据类型，而在做一些复杂业务分析时需要多种类型数据进行联合分析。但数据库与

来自：官网 / 行业资讯

行业资讯

关系型数据库和非关系型数据库区别

，数据存储方式多样，包括键值对、文档、宽列存储、图形数据库等。查询语言：关系型数据库：使用SQL作为查询语言，支持复杂的查询和事务处理。非关系型数据库：查询语言或接口各不相同，通常不如SQL强大，但更简单程度的数据不一致，以换取更高的可用性和性能。性能：关系型数据库：在处理复杂查询和事务时性能较好。非关系型数据库：在处理大量非结构化数据和高并发读写操作时性能较好。适用场景：关系型数据库：适合需要高度数据关系型数据库和非关系型数据库的主要区别可以概括如下：数据模型：关系型数据库：基于关系模型，数据存储在表格中，通过行和列的形式组织，数据之间通过关系（外键）相互关联。非关系型数据库：不基于关系模型，更适合特定的数据模型。事务处理：关系型数据库：支持ACID事务，保证事务的可靠性。非关系型数据库：通常支持BASE原则，强调可用性和最终一致性。扩展性：关系型数据库：水平扩展（增加更多服务器）较为困难，通常采用垂直扩展（增加单个服务器的资源）。非关系型数据库：设计上更易于水平扩展，适合大规模分布式系统。一致性：关系型数据库：强调强一致性，数据更新后立即对所有事务可见。非关系型数据库：可能允许一定

来自：官网 / 行业资讯

行业资讯

向量数据库的常见应用

相似度搜索或“向量搜索”是向量数据库常见的用例。向量搜索将索引中多个向量的接近程度与搜索查询或主题项进行比较。为了找到相似的匹配项，可以使用用于创建向量嵌入的相同机器学习嵌入模型，将主题项或查询转换为向量。向量数据库比较这些向量的接近度以找到接近的匹配项，并提供相关的搜索结果。向量数据库应用的一些示例包括：语义搜索：在搜索文本和文档时，传统的词法搜索只能进行精确匹配，而语义搜索则更注重与搜索查询等非结构化数据很难用传统数据库来描述。用户可以使用相似的对象和机器学习模型来查询向量数据库，以便更轻松地比较和找到相似的匹配项。重复数据删除和记录匹配：对于需要删除重复项或进行记录匹配的应用程序，向量数据库可以使用机器学习模型来确定相似性，避免不准确或人工的分类工作。推荐和排名引擎：相似的项目通常提供好的建议。例如，在电子商务领域，推荐相似或相关产品、内容或服务可以帮助消费者发现他们可能原来没有考虑过的项目。异常检测：向量数据库可以找到与其他对象非常不同的异常值。对于IT运营、安全威胁评估和欺诈检测等领域，异常检测非常有价值。除了上述应用之外，向量数据库还具有以下关键功能：高性能和高扩展性

来自：官网 / 行业资讯

行业资讯

多模态数据库

各种类型的数据进行集中存储、查询和处理，满足对结构化、半结构化和非结构化数据的统一管理需求。TranswarpArgoDB是星环科技自主研发的分布式数据库，基于多模型统一架构支持关系型存储，宽表存储。中国信通院在数据库发展研究报告（2021年）》中指出，在后关系型数据库阶段，数据结构越来越灵活多样、业务类型越来越复杂多变，为应对此类现状，越来越多的用户选择通过多模型数据库实现“一库多用“，将先进技术能力，一站式满足OLAP、AETP、多模型融合分析、联邦计算、数据仓库、实时数仓、湖仓集一体等场景。2019年8月，ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计的数据库产品。在架构上，ArgoDB基于存算解耦，实现了多模数据库的“四个统一”：统一的SQL编译引擎，支持SQL99/2003标准语法，兼容TD，Oracle，DB2等多种方言，对不同模式的数据提供统一接口，将多个操作访问入口变为一个入口，将多种数据库语言变为一种语言，降低开发和迁移成本，简化用户操作。统一的计算引擎，将多套计算引擎变为一套引擎，将多份计算资源变为一份资源，提供高性能的分析计算和执行效率

来自：官网 / 行业资讯

行业资讯

什么是向量搜索数据库？

向量搜索数据库是一种以向量为基础存储单元，具备高效检索向量能力的数据库。向量搜索数据库大多数适用于海量高维向量数据的存储和检索，对于传统关系型数据库无法胜任或效率较低的高维向量场景有较好的解决效果。通过应用向量检索算法，量搜索数据库可以快速检索和匹配目标向量，不仅可以于向量相似度检索，还可以支持分类、聚类和推荐等应用场景。现在大型机构和企业广泛应用向量搜索数据库来挖掘和应用对企业有价值的数据信息，比如金融行业的推荐和欺诈检测，社交网络领域的知识图谱与舆情应用等等。星环科技分布式向量数据库TranswarpHippo星环科技分布式向量数据库TranswarpHippo作为一款企业级云原生分布式向量数据库，支持存储、索引以及管理海量的向量式数据集，提供向量相似度检索、高密度向量聚类等能力，有效地解决了大模型在知识时效性低、输入能力有限、准确度低等问题，让大模型更高效率地存储和读取知识库，降低训练和推理成本，激发更多的AI应用场景。在赋予大模型拥有“长期记忆”的同时，还可以协助企业解决目前担忧的大模型数据隐私泄露问题。与开源的向量数据库不同，星环分布式向量数据库Hippo具备高可用、高性能

来自：官网 / 行业资讯

猜你喜欢

产品文档

5.6 数据操作语句

本章节的示例语句均可在示例图my_graph中执行，执行前请先创建示例图my_graph，建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

4 快速入门

快速上手本章节将引导您快速熟悉StellarDB，并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中，"StellarDB初探"一节通过构建一张人物关系图，从零介绍如何在StellarDB进行基本操作；"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图，帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录，会自动跳转Federation登录页面，按如图方式登录：KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中，我们为"hello_world"图创建Boy和Girl两种类型的点，两种类型的点均包含name、salary、age、single四...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

3 安装 StellarDB

3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

7.1 自定义函数

StellarDB支持用户添加自定义函数，添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发，可继承实现两种基类，编译成jar包，通过指定命令加载到StellarDB。需要实现的基类为如下两种，可自行选择继承合适的基类：继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单，功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void，支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数，若字符串执行拼接，in...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.17 索引（新）

索引是数据库中某些数据的冗余副本，目的是使查询性能更优。作为代价，数据库需要额外存储空间和较慢写入速度，因此决定哪些字段需要索引是一项重要且不易的任务。（新）StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持，在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同，注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.2 TEoC 前置参数

通过beeline或JDBC时，设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式（默认为immediate模式）immediate模式通常用于并发及短查询场景，查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景，创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.20 StellarDB 5.0.1 动态图(Dynamic Graph)模型（新）

为什么引入动态图模型？在实际应用过程中很容易可以发现，图数据在很多图数据的应用场景中并不是静态不变的，而是动态演进的，这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等；又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来，不仅可以用于历史数据规律的总结，还可以利用动态图数据进行动态图神经网络相关技术的研究，从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景，譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类，一类是节点或边的属性的值的变化；另一类变化是子图（结构）的变化，如新增/删除点边。这两种图数据的动态变化可以单独发生，也可以同时发生。从图数据的属性变化角度来看，StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本（而非新数据覆盖旧数据）。在实际数据开发使用中，还可以结合诸如柱状图、趋势图等对历史数据进行可视化，更加直观、更加适合业务使用。从图数据的子图（结构）的角度来看，StellarDB5.0.1动态图模型还可以返回不同时间子图...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.10 表达式

类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1，2，3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

6.1 图计算

StellarDB5.0.1版本对图算法场景进行了大规模改进和提升，内置算法性能得到较大提升。在语法方面，StellarDB5.0.1的内置图算法对于返回的节点，会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid，而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外，对于图算法返回的节点，我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时，使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图，用于加速图算法执行过程。创建视图创建视图的语法如下所示：createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

产品文档

5.12 变量声明

声明简介声明是指为特定数据类型的变量分配一定的存储空间，并命名该变量以便引用它；必须先声明变量，然后才能引用它；对声明的变量可以进行赋值操作来改变它的值；声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型，且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示：语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...

来自：官网 / 产品文档 / Transwarp StellarDB / 5.0

热门活动

大数据基础平台

大数据云平台

数据库

数据开发工具

智能分析工具

AI基础设施平台

软硬一体产品

金融解决方案

交通解决方案

医疗解决方案

教育解决方案

能源解决方案

制造业解决方案

政府解决方案

运营商解决方案

比较好的宽表数据库