比较好的宽表数据库

实时NoSQL数据库
Transwarp Hyperbase是星环科技自主研发实时NoSQL数据库。Hyperbase支持百万级高并发、毫秒级低延时业务需求,可以在普通廉价服务器集群上高效支持企业高并发精确查询与范围查询、流处理应用、全文搜索以及高并发非结构化数据检索,同时支持以标准SQL为接口高效数据访问,帮助用户快速开发历史数据查询、业务在线检索等应用。

比较好的宽表数据库 更多内容

简单、更便捷进行大数据分析。为了满足更多用户在存储以及高并发点查方面的需求,此次TDH社区版推出了星环科技自主研发NoSQL数据库TranswarpHyperbase。TranswarpHyperbase介绍Hyperbase是什么TranswarpHyperbase是星环科技自主研发NoSQL数据库,支撑百万级高并发、毫秒级低延时业务需求。支持结构化数据,及文本、图像、视频、对象等实时处理应用需求。传统通用关系型数据库无法应对在数据规模剧增时导致系统扩展性和性能问题(分库分也不能很好解决),很难实现横向扩展,纵向扩展空间也比较有限。Hyperbase能够轻易地通过在集群中增加或者Hyperbase关系数据库已经流行很多年,尽管Hadoop可以很好地解决大规模数据离线批量处理问题,但是,受限于MapReduce编程框架高延迟数据处理机制,使得Hadoop无法满足大规模数据减少硬件数量来实现性能伸缩,提升集群运行速度以及处理能力,轻松应对百万级高并发查询业务。不同于传统关系型数据库,Hyperbase采用列式存储模式,每个列族都由几个文件保存,不同列族文件是
复杂多变数据成为各单位机构面临一大难题。基于上述挑战,星环推出了TranswarpHyperbaseNoSQL数据库,用来满足企业级用户经济灵活高效地管理数据需求。Hyperbase能够随着信息时代到来,数据已逐渐成为金融、企业、政府、运营商等单位机构重要决策依据。以传统关系型数据库为代表技术由于性能,成本,可扩展性等缺陷,很难满足爆炸式数据增长需要,如何经济高效地管理海量轻易地通过在集群中增加或者减少硬件数量来实现性能伸缩,从而进一步提升集群运行速度以及处理能力,轻松应对百万级高并发查询业务。Hyperbase支持以标准SQL为接口高效数据访问,并提供高效数据迁移工具,不仅能大幅度降低企业级用户数据应用变更和数据平台迁移实施成本,还满足了用户在统一数据平台上同时支撑新老业务需求,大幅度降低了企业运维成本。
被一起查询相关数据。当前DB-Engine中NoSQL数据库排名如下表,可以看到受欢迎主要是Cassandra、HBase和Azure上CosmosDB。接下来我们将介绍一下HBase情况。HBase是一个面向列分布式NoSQL数据库,是GoogleBigtable框架开源实现,能够响应随机、实时数据检索需求。HBase主要存储和处理对象是大,存储模式可以兼容本地存储机制确保数据库容错能力。通常适用场景为:面向多版本、稀疏、半结构化和结构化数据高并发写入/查询OLTP业务。HBase数据模型由不同逻辑概念构成,包括:、行、行键、列、列族、单元、时间戳。上会是层次化结构或者树形结构。这个做法好处是非常容易增加半结构化或者结构化数据处理能力。目前搜索引擎比较有代表性数据库有开源Elasticsearch,国内星环科技有自研搜索产品Scope。在。Document类似于关系型数据中行概念,一个Document包含每一个Field中与之相应数据值。Type类似数据库级别概念,而Index是Elasticsearch中大数据单位,与SQL
场景。全复制模式一般适合记录数比较,一般情况下在各个数据库节点都完整存储一份数据。这类一般情况下用于大量分析类场景,事务类操作比较少,因此虽然存储上有明显浪费,但是在分析性场景下不再需要PivotalGreenplum开源MPP数据库数据库实例采用PostgreSQL,可运行在标准硬件上华为GaussDB基于Postgres-XC深度自研分析型数据库,可运行在标准硬件上,可扩展性较好—总体架构—MPPShared-nothing架构,每个数据库节点之间没有数据共享。MPP数据库一般可以通过增加数据库计算能力,此外因为多个实例,数据库总体数据加载性能相比较单实例数据库也有很高提升。数据分片是能够实现并行化计算核心,MPP数据库有多种数据分片方式,主要包括3大类:Hash模式一般适用于事实或大,根据一条记录某个字段或组合字段hash值将数据分散到某个节点上,hash函数可以有多种方式。通过根据对给定字段hash值来做数据分布,一个大可以均匀分散到MPP数据库多个节点上,当对这个查询时,MPP数据库编译器可以根据SQL中相应检索字段将查询快速定位到某个或几个相关数据库节点并将
星环分布式图数据库-TranswarpStellarDBTranswarpStellarDB是星环科技自主研发企业级分布式图数据库,提供高性能图存储、计算、分析、查询和展示服务设计和迭代升级,推出了更高性能、更智能、更易用企业级分布式图数据库StellarDB5.0。性能数倍提升,加速数据分析创新StellarDB5.0实现了存储引擎和计算引擎双引擎升级。在存储部分,全新中落地,StellarDB5.0接入了星环科技自研ZenGraph深度图框架,将图数据库技术和深度图技术深度融合,利用图数据库优势实现图数据快速地读取和写回,提供快速子图过滤能力,从而提升整个深度图链路处理效率,StellarDB将进一步融合图数据库技术和深度图技术,提供更加易用、一体化工业级图深度学习解决方案。简洁动态图模型,图数据变化直观、高效分析许多图数据应用场景中数据并不是静态不变,而是动态变化。突破数据模型屏障,挖掘数据融合分析价值大数据时代数据量井喷、业务融合多样化,企业需要部署多个不同类型数据库用来存储不同数据类型,而在做一些复杂业务分析时需要多种类型数据进行联合分析。但数据库
数据存储方式多样,包括键值对、文档、列存储、图形数据库等。查询语言:关系型数据库:使用SQL作为查询语言,支持复杂查询和事务处理。非关系型数据库:查询语言或接口各不相同,通常不如SQL强大,但更简单程度数据不一致,以换取更高可用性和性能。性能:关系型数据库:在处理复杂查询和事务时性能较好。非关系型数据库:在处理大量非结构化数据和高并发读写操作时性能较好。适用场景:关系型数据库:适合需要高度数据关系型数据库和非关系型数据库主要区别可以概括如下:数据模型:关系型数据库:基于关系模型,数据存储在表格中,通过行和列形式组织,数据之间通过关系(外键)相互关联。非关系型数据库:不基于关系模型,更适合特定数据模型。事务处理:关系型数据库:支持ACID事务,保证事务可靠性。非关系型数据库:通常支持BASE原则,强调可用性和最终一致性。扩展性:关系型数据库:水平扩展(增加更多服务器)较为困难,通常采用垂直扩展(增加单个服务器资源)。非关系型数据库:设计上更易于水平扩展,适合大规模分布式系统。一致性:关系型数据库:强调强一致性,数据更新后立即对所有事务可见。非关系型数据库:可能允许一定
相似度搜索或“向量搜索”是向量数据库常见用例。向量搜索将索引中多个向量接近程度与搜索查询或主题项进行比较。为了找到相似的匹配项,可以使用用于创建向量嵌入相同机器学习嵌入模型,将主题项或查询转换为向量。向量数据库比较这些向量接近度以找到接近匹配项,并提供相关搜索结果。向量数据库应用一些示例包括:语义搜索:在搜索文本和文档时,传统词法搜索只能进行精确匹配,而语义搜索则更注重与搜索查询等非结构化数据很难用传统数据库来描述。用户可以使用相似的对象和机器学习模型来查询向量数据库,以便更轻松地比较和找到相似的匹配项。重复数据删除和记录匹配:对于需要删除重复项或进行记录匹配应用程序,向量数据库可以使用机器学习模型来确定相似性,避免不准确或人工分类工作。推荐和排名引擎:相似的项目通常提供好建议。例如,在电子商务领域,推荐相似或相关产品、内容或服务可以帮助消费者发现他们可能原来没有考虑过项目。异常检测:向量数据库可以找到与其他对象非常不同异常值。对于IT运营、安全威胁评估和欺诈检测等领域,异常检测非常有价值。除了上述应用之外,向量数据库还具有以下关键功能:高性能和高扩展性
行业资讯
多模态数据库
各种类型数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据统一管理需求。TranswarpArgoDB是星环科技自主研发分布式数据库,基于多模型统一架构支持关系型存储,存储。中国信通院在数据库发展研究报告(2021年)》中指出,在后关系型数据库阶段,数据结构越来越灵活多样、业务类型越来越复杂多变,为应对此类现状,越来越多用户选择通过多模型数据库实现“一多用“,将先进技术能力,一站式满足OLAP、AETP、多模型融合分析、联邦计算、数据仓库、实时数仓、湖仓集一体等场景。2019年8月,ArgoDB成为全球第四个通过TPC-DS基准测试并经过TPC官方审计数据库产品。在架构上,ArgoDB基于存算解耦,实现了多模数据库“四个统一”:统一SQL编译引擎,支持SQL99/2003标准语法,兼容TD,Oracle,DB2等多种方言,对不同模式数据提供统一接口,将多个操作访问入口变为一个入口,将多种数据库语言变为一种语言,降低开发和迁移成本,简化用户操作。统一计算引擎,将多套计算引擎变为一套引擎,将多份计算资源变为一份资源,提供高性能分析计算和执行效率
向量搜索数据库是一种以向量为基础存储单元,具备高效检索向量能力数据库。向量搜索数据库大多数适用于海量高维向量数据存储和检索,对于传统关系型数据库无法胜任或效率较低高维向量场景有较好解决效果。通过应用向量检索算法,量搜索数据库可以快速检索和匹配目标向量,不仅可以于向量相似度检索,还可以支持分类、聚类和推荐等应用场景。现在大型机构和企业广泛应用向量搜索数据库来挖掘和应用对企业有价值数据信息,比如金融行业推荐和欺诈检测,社交网络领域知识图谱与舆情应用等等。星环科技分布式向量数据库TranswarpHippo星环科技分布式向量数据库TranswarpHippo作为一款企业级云原生分布式向量数据库,支持存储、索引以及管理海量向量式数据集,提供向量相似度检索、高密度向量聚类等能力,有效地解决了大模型在知识时效性低、输入能力有限、准确度低等问题,让大模型更高效率地存储和读取知识,降低训练和推理成本,激发更多AI应用场景。在赋予大模型拥有“长期记忆”同时,还可以协助企业解决目前担忧大模型数据隐私泄露问题。与开源向量数据库不同,星环分布式向量数据库Hippo具备高可用、高性能
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...