稳定性好的数据仓库
星环数据仓库解决方案具备超高性能、高可扩展、极简易用、高性价比等特性。面对高速增长的数据规模,传统的数据仓库负荷严重超出。不扩容会影响性能与稳定性,但是扩容却十分昂贵。星环数据仓库解决方案广泛应用于金融、政企、交通、能源、电信等多个领域,可以满足大数据时代企业构建各类数据仓库的需求。
稳定性好的数据仓库 更多内容

行业资讯
数据仓库的搭建步骤
加强开发和测试工作,保证数据仓库的质量和稳定性。星环数据仓库解决方案星环数据仓库解决方案具备超高性能、高可扩展、易用、高性价比等特性。面对高速增长的数据规模,传统的数据仓库负荷严重超出。不扩容会影响性能与稳定性,但是扩容却十分昂贵。星环数据仓库解决方案广泛应用于金融、政企、交通、能源、电信等多个领域,可以满足大数据时代企业构建各类数据仓库的需求。数据仓库的搭建步骤:确定需求:明确数据仓库的目标和业务需求,以及需要整合哪些数据源。设计数据模型:设计数据仓库的数据模型,包括维度模型和星型模型等。选择数据仓库平台:选择合适的数据仓库平台。载入数据汇总表:根据查询需求建立索引和汇总表,以加速查询速度。数据质量控制:建立数据入口和出口的质量控制机制,控制数据的质量。元数据管理:建立元数据管理机制,维护数据仓库的元数据信息,并利用元数据建立关联数据模型。查询和分析:利用OLAP和数据挖掘等技术,实现对数据仓库中数据的查询、分析和挖掘,得出有用的信息和结果。在搭建数据仓库时,需要制定完善的建设方案和详细的实施计划,尽可能减少数据迁移和操作风险,并

的研究,推动相关标准制定工作、撰写行业研究报告,助力我国关键数据基础设施建设和信息化转型又快又稳。此次星环科技受邀加入分布式系统稳定性实验室,是业内对星环科技专业技术能力的充分肯定。随着海量及异构数据的重要底盘,助力我国各领域系统稳定性保障工作至关重要。加入分布式系统稳定性实验室后,星环科技将继续发挥自身在大数据行业多年积累的技术和经验优势,积极参与实验室分布式系统稳定性保障工作,帮助更多企业解决分布式系统面临的稳定性等挑战,加速企业实现数字化转型的目标。日前,星环科技正式受邀加入中国信通院分布式系统稳定性实验室,并获得相关证书。分布式系统稳定性实验室是中国信息通信研究院旗下系统稳定性研究机构,旨在集产学研多方力量,聚焦系统的稳定性保障与建设相关产业的数据分析需求增长,需要的计算、存储和IO等资源也在极速增加,分布式系统在扩展性、容错性、经济性、灵活性、可用性和可维护性方面具有明显优势,能够较好的满足大数据分析的需求。星环科技专注于分布式技术、数据库技术、SQL编译技术、数据云技术等基础软件领域的研发,致力于解决采用传统集中式软件架构的信息系统所面临的大数据处理难题,为企业提供处理海量规模、快速流转和多样化类型数据的大数据处理技术,帮助用户

行业资讯
数仓的特点
性(Integrated):数据仓库通过数据清洗、转换和加载(ETL)过程,将来自不同源系统的数据统一存储在一个中央数据库中,解决了数据孤岛问题。稳定性(Non-Volatile):一旦数据进入数据仓库。数据仓库通过其面向主题、集成性、稳定性和时变性等特点,支持高效的数据分析和决策支持。国内数仓产品在云原生架构、流与批的融合、湖仓一体、数智融合和HTAP支持等方面表现出色,具有高性能、高可用性、成本效益和数据安全性的优势,能够满足企业多样化的数据处理和分析需求。数据仓库(DataWarehouse)具有以下特点:面向主题(Subject-Oriented):数据仓库中的数据是按照特定的业务主题域进行组织的,这些主题通常与企业的业务过程或分析需求相关。集成,通常就不会再进行修改或删除,而是作为历史数据被保留,用于分析目的。时变性(Time-Variant):数据仓库能够存储和管理不同时间点的数据,支持时间序列分析,帮助企业了解业务的历史变化和未来趋势。高性能(HighPerformance):数据仓库支持高速查询和高数据吞吐量,能够凭借出色的灵活性帮助用户细分数据或降低数据量,进而执行更加细致的数据检查。支持复杂查询

行业资讯
离线数据仓库
:相比实时数据仓库,离线数据仓库在硬件和软件资源的投入上相对较少,因为不需要实时处理的高性能计算和存储设备,适合中小企业和对数据实时性要求不高的应用场景。稳定性好:离线数仓在稳定性方面表现较好,因为数据离线数据仓库是一种数据仓库架构,主要用于存储和处理历史的、静态的数据。以下是离线数据仓库的一些主要特点和应用场景:特点:处理大规模数据能力强:离线数据仓库能够处理海量的历史数据,由于是批量处理,对于生成一份客户流失分析报表,通过分析客户的购买频率、最近购买时间等因素来确定可能流失的客户名单。商业智能与数据分析:企业通过离线数据仓库汇集来自不同部门和系统的数据,进行综合分析,形成商业智能报告,帮助决策者制定战略规划。销售与市场分析:企业可以定期提取销售数据和市场数据,分析销售趋势、客户行为等,以优化销售策略和市场营销活动。财务分析:财务部门可以将历史财务数据集中存储在离线数据仓库中,以便进行数据量的容忍度较高,可以存储和分析企业多年积累的数据。数据一致性和准确性高:在ETL过程中可以对数据进行仔细的清洗和转换,保证数据在加载到数仓后的一致性和准确性,有利于进行高质量的分析。成本效益较好

行业资讯
数据仓库指标体系
在面对故障时的恢复能力和高可用性。可用性指标:用于衡量数据仓库的可靠性和稳定性,包括系统停机时间、故障恢复时间等。成本效益指标:衡量数据仓库建设投入与产出比的关键,包括数据仓库建设成本、运维成本、数据数据仓库指标体系是衡量和优化数据仓库性能、数据质量和数据价值的关键工具。以下是数据仓库指标体系的一些主要组成部分:数据质量指标:准确性:指数据记录的信息是否存在异常或错误,如缺失值占比、错误值占比格式一致性。唯一性:确保数据库的数据不存在重复的情形。及时性:指数据从产生到可以查看的时间间隔,也称为数据的延时时长。性能指标:读写性能:衡量数据仓库在读取和写入数据方面的性能表现,包括吞吐量(每秒处理的请求数量)、延迟(请求的响应时间)和并发性(同时处理的请求数量)。水平扩展性:衡量数据仓库在大规模系统中的水平扩展能力,以及随着客户端并发增长而进行弹性扩展的能力。故障恢复和高可用性:测试数据仓库价值产出等。数据可访问性:指用户能够方便地访问和使用数据仓库中的数据,这对数据分析的普及和应用至关重要。ETL流程指标:包括ETL执行时间、错误率和数据延迟等,反映数据处理的效率和数据从源系统到达数据仓库所需的时间。

行业资讯
如何构建数据仓库?
性能、高可扩展、易用、高性价比等特性。面对高速增长的数据规模,传统的数据仓库负荷严重超出。不扩容会影响性能与稳定性,但是扩容却十分昂贵。星环数据仓库解决方案广泛应用于金融、政企、交通、能源、电信等多个领域,可以满足大数据时代企业构建各类数据仓库的需求。数据仓库的构建是一个系统性的工程,一般需要按照以下步骤进行:确定数据仓库的范围和目标,包括所要构建的主题域、数据的范围和粒度、数据的质量和数据更新的频率等。设计数据仓库的结构,选择合适的数据模型,设计维度模型和事实表格,以及设计数据仓库的逻辑和物理架构等。选择合适的ETL工具和技术,从不同的数据源中抽取数据并经过清洗、整合和转换等处理,生成数据仓库中的维度和事实数据。实现数据仓库的数据加载和更新,将经过处理后的数据加载到数据仓库中,保证数据的实时性和质量。设计、实现和维护数据仓库的元数据,用于描述数据仓库中所有的数据和元素,以及说明其属性和关系。此外,在构建数据仓库时,还需要注意以下几点:数据的一致性:在数据仓库中,数据的一致性非常重要,因此需要对数据进行质量控制和管理,以确保数据的一致、可靠和准确。数据的安全性:数据仓库中存储了企业的核心信息,因此需要对数据进行安全管理,防止数据泄露和

行业资讯
数据仓库建设流程
扩容会影响性能与稳定性,但是扩容却十分昂贵。星环数据仓库解决方案广泛应用于金融、政企、交通、能源、电信等多个领域,可以满足大数据时代企业构建各类数据仓库的需求。数据仓库建设通常包括以下步骤:需求分析:确定业务需求、数据来源、数据范围和数据定期更新等。数据收集:收集并整理各种数据源数据,包括结构化、半结构化和非结构化数据。数据清洗和转换:对收集到的数据进行预处理、清洗、整理和转换,以满足数据仓库的规范和标准。数据建模:设计数据模型、主题、维度、度量、数据仓库和数据集市结构等。数据存储:确定数据存储方式和技术,包括关系型数据库、列式数据库、NoSQL数据库等。数据提取和加载:将经过转换和清洗的数据加载到数据仓库中,同时建立和维护相关元数据等。数据查询和分析:利用OLAP和数据挖掘等技术,实现对数据仓库中数据的查询、分析和挖掘,得出有用的信息和结果。数据维护和精度控制:按照数据仓库设计规范和标准,定期进行数据维护和精度控制,保证数据的完整性、正确性和一致性。数据仓库建设需要全面考虑业务需求、数据质量、技术选型和成本效益等方面,建设过程需要与业务部门

行业资讯
湖仓一体架构
什么是湖仓一体架构?湖仓一体架构是一种融合了数据仓库和数据湖的架构,将数据仓库的稳定性和数据湖的灵活性结合在一起。这种架构旨在提供一个统一的数据存储和分析平台,提高数据处理的效率和质量。湖仓一体架构的优势湖仓一体架构具有以下优点:统一的数据存储平台:湖仓一体架构将数据仓库和数据湖集成在一起,为用户提供了一个统一的数据存储和分析平台。提高数据处理效率:由于湖仓一体架构采用了分布式文件系统,可以并行处理大量数据,从而提高了数据处理效率。提高数据质量:由于在数据进入数据湖之前进行了数据转换操作,可以保证数据的准确性和一致性,从而提高数据质量。灵活的数据分析:由于数据仓库和数据湖的结合,用户可以根据需求进行灵活的数据分析操作,包括查询、分析和可视化等。湖仓一体架构将数据仓库和数据湖的优点结合在一起,为用户提供了一个高效、可靠、安全的数据存储和分析平台。星环科技湖仓一体解决方案星环科技湖仓集一体架构,打破数据湖、数据仓库、数据集市的边界,基于湖仓集一体平台,所有人都可以访问实时的数据、历史的数据、原始的数据、加工过的数据,如业务分析师可以直接访问原始的数据,数据工程师可以更高效地建模,数据

行业资讯
数据仓库与数据湖建设
和语义往往各不相同。数据仓库通过ETL(抽取、转换、加载)过程,将来自不同数据源的数据进行清洗、转换和整合,消除数据之间的不一致性,形成一个全局统一的数据视图。数据仓库的数据具有相对稳定性。一旦数据数据新时代:湖仓融合,开启数据管理新征程数据仓库:成熟稳定的“数据管家”(一)数据仓库的定义与核心特征数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。这一定义高度概括了数据仓库的核心特征,也揭示了其在企业决策支持体系中的关键作用。集成性是数据仓库的核心特征之一。企业内部通常存在多个异构数据源,如关系数据库、文件系统、ERP系统等,这些数据源的数据格式、结构进入数据仓库,就很少进行修改和删除操作,主要用于查询和分析。这是因为数据仓库主要服务于企业的决策分析,需要提供可靠的历史数据,以支持趋势分析和决策制定。数据的更新通常采用追加的方式,新的数据会被添加到已有的数据集中,而不会覆盖原有的历史数据。(二)数据仓库的架构与工作流程数据仓库的架构是一个复杂而有序的体系,它主要由数据源、数据集成层、数据存储层、数据访问层等部分组成。数据源是数据仓库的数据来源
猜你喜欢
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...
产品文档
5.6 数据操作语句
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
产品文档
5.17 索引(新)
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
产品文档
5.2 TEoC 前置参数
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...