贵州数据治理
星环科技提供体系完善的整体数据治理解决方案,涵盖数据治理战略、组织制度机制、数据管理活动和技术工具落地四个方面,同时,还为企业提供数据管理成熟度评估(DCMM)指导,在数据战略,数据治理,数据标准、数据架构、数据安全,数据质量,数据应用,数据生存周期 八大项数据管理能力方面结合企业实际需求,帮助客户制定和实施精准有效的解决方案。
贵州数据治理 更多内容
云上贵州信创工程中心大数据中台建设实现全省政务数据的数据互通和高效共享,并可通过电子政务外网支撑省直60余家政府部门数据资源的统一汇聚沉淀,并通过统一的数据服务门户,支撑政务数据平台上层业务中台20TB业务数据的存储和计算。目前信创中台数据调度任务达500+,且稳定运行。目前基于星环科技大数据中台,云上贵州和星环科技已展开全方位的合作,未来星环科技的边缘计算软件、知识图谱软件、时空数据库软件、图数据库软件、数据安全软件等均可以持续为云上贵州赋能,也能协助云上贵州拓展贵州更多的项目空间。、政务智慧大脑的各类应用场景。基于星环科技的大数据信创中台,开展了数据资产管理和数据服务建设,在数据规范化、标准化、资产化的轨道上,做到了统一入口、统一出口、集中管理、高效服务,构建成为敏捷创新的数据中台,有力支撑了地质灾害防治指挥平台项目、金融局数仓项目、共享交换平台项目、政务监管平台项目、核酸健康码项目、贵州省一张网项目等。此外,信创中台对接云上共享交换平台项目,支撑了一张网贴源层、主题层、专题层
能力,健全完善政策组合拳,推动新技术、新产品、新企业、新业态、新动能成长。按照治理有效、调度有力的要求,推进建设统一的数据中台。解决方案大数据中台整体架构:政务大数据中台将统一接入政府各业务部门系统:大数据信创中台主要采用星环科技数据云平台TDC+大数据基础平台TDH+分布式分析数据库ArgoDB+分布式交易数据库KunDB+大数据开发治理工具集TDS+数据科学平台Sophon进行构建。整体节点数为实施成效云上贵州信创工程中心大数据中台建设实现全省政务数据的数据互通和高效共享,并可通过电子政务外网支撑省直60余家政府部门数据资源的统一汇聚沉淀,并通过统一的数据服务门户,支撑政务数据平台上层业务中台、专题层20TB业务数据的存储和计算。目前信创中台数据调度任务达500+,且稳定运行。目前基于星环科技大数据中台,云上贵州和星环科技已展开全方位的合作,未来星环科技的边缘计算软件、知识图谱软件、时空数据库软件、图数据库软件、数据安全软件等均可以持续为云上贵州赋能,也能协助云上贵州拓展贵州更多的项目空间。案例背景贵州省政府出台《贵州省推进“一云一网一平台”建设工作方案》,从2019年到2021年,计划用三年时间完成“一云一网一平台”建设的目标任务。围绕解决企业群众“办事难、办事慢、办事繁”等问题,以

政务数据质量评估。开展公共数据资源开发利用试点,充分释放数据价值。2.项目需求为了落实贵州省整体信创生态建设战略布局,满足各政府单位和业务部门海量多源异构数据的采集、存储、分析、治理以及服务,贵州省建设国家标准、行业标准以及数据专家的经验,实现数据治理,可以确保业务部门数据口径统一、权责分明、用度有序,从而大大提高业务指标分析的质量和业务深度价值发掘。同时,目前云上贵州大数据产业发展公司数字化水平还在)建设业务部门分类知识库,可对政务数据进行数据治理,形成数据资产化后的智能数据仓库,实现贵州省政务数据的统一监管、统一服务、统一标准,构建全省数据治理的管控、整体化协作、持续化运营、数据价值创新。4,十四五规划中又明确提出要加快建设数字经济、数字政府、数字社会,通过以数字化转型来整体驱动治理方式、生活方式、生产方式的变革。通过运用云计算、大数据、物联网、区块链、人工智能等技术建设基础数字技术平台,探索企业“数据中台”、“业务中台”等新型IT架构,通过数字化转型顶层规划和设计,建立系统化的数据管理体系、数据治理体系以及资源协同机制,终实现大数据价值变现,从而提高政府、企业的业务高效创新

2019年7月17日,贵州省烟草公司一行50余人莅临星环科技参观考察。星环科技副总裁齐伟东陪同接待,为来访人员介绍了星环科技成立六年来,专注于企业级容器云计算、大数据和人工智能核心平台的研发和服务的兴趣。星环科技架构师向来访人员分享了大数据从1.0时代到3.0时代演变路径,并重点讲解了星环科技基于容器的智能大数据云平台TranswarpDataCloud(TDC)、一站式大数据平台TranswarpDataHub(TDH)、智子人工智能平台TranswarpSophon,并对落地标杆案例进行了生动讲解。交流会上,双方就前沿大数据及人工智能技术进行了讨论,考察团一行对星环科技在各个领域取得的成果给予了高度评价。

行业资讯
数据治理和元数据治理
数据治理和元数据治理紧密相关,元数据治理是数据治理的核心和基础,以下是对它们的详细介绍:数据治理定义:数据治理是对数据的全生命周期进行管理,包括数据的规划、采集、存储、处理、分析、应用等各个环节数据治理定义:元数据治理是对元数据的创建、采集、存储、整合、共享等过程进行管理和控制,以确保元数据的质量和一致性,提高元数据的可用性和价值,为数据治理提供有力支持。主要任务元数据的定义与规范:制定元,及时反映数据的变化和业务的需求,确保元数据的准确性和时效性。元数据的应用与服务:通过元数据管理工具,为数据治理的其他环节提供元数据服务,如数据建模、数据质量管理、数据安全管理等,提高数据治理的效率和效果。二者的关系元数据治理是数据治理的基础:元数据描述了数据的定义、结构、来源、关系等信息,是数据治理的核心要素。通过元数据治理,可以建立数据的清晰脉络,为数据治理的各项工作提供准确的依据。数据治理对元数据治理提出需求:数据治理的过程中,需要不断完善和更新元数据,以满足数据管理和应用的需求。,旨在提高数据质量,确保数据的安全性、完整性和一致性,实现数据资产的有效管理和价值最大化。主要目标提升数据质量:通过一系列的管理活动和技术手段,保证数据的准确性、完整性、一致性、时效性等,减少数据错误和

行业资讯
政务大数据中台案例
项目需求为了落实贵州省整体信创生态建设战略布局,满足各政府单位和业务部门海量多源异构数据的采集、存储、分析、治理以及服务,贵州省建设基于Hadoop架构的多租户政务大数据中台。基于政务大数据中台后的智能数据仓库,实现贵州省政务数据的统一监管、统一服务、统一标准,构建全省数据治理的管控、整体化协作、持续化运营、数据价值创新。4)建设职能部门元数据管理。元数据查询支持对元数据库中的元数据基本信息中台,可以进行全域数据的资源编目,构建以领导、主管部门、业务单位、信息科技单位等多角度的资源管理视图。借助大数据分析治理工具,依据国家标准、行业标准以及数据专家的经验,实现数据治理,可以确保业务部门数据口径统一、权责分明、用度有序,从而大大提高业务指标分析的质量和业务深度价值发掘。同时,目前云上贵州大数据产业发展公司数字化水平还在发展阶段,无法有效支撑集团公司外部、内部等多类业务协同。因此,亟需构建“安全有保障、用户有黏度、体验有温度、应用全覆盖、发展可持续”的云上贵州信创工程中心统一大数据中台。信创工程中心统一大数据中台的建设,既可服务于贵州信创生态建设,促进国产软硬件适配,又可以根据业务

行业资讯
什么是数据治理?
数据治理是对企业或组织内的数据进行全生命周期管理的一系列活动,旨在提高数据质量、确保数据安全、促进数据共享和提升数据价值。目标与意义提高数据质量:通过数据治理,能够对数据的准确性、完整性、一致性、时效性等质量维度进行有效管理和监控,及时发现并解决数据中的问题,从而为企业决策和业务运营提供可靠的数据支持。确保数据安全:数据治理涵盖了数据安全管理的各个方面,包括数据访问控制、数据加密、数据脱敏等依据。主数据管理:对企业内的关键业务数据,如客户、供应商、产品等主数据进行统一管理和维护,确保主数据的准确性、完整性和一致性。实施步骤规划与评估:明确数据治理的目标和范围,对企业现有的数据状况进行全面评估,包括数据质量、数据安全、数据管理流程等方面,找出存在的问题和差距。设计与建设:根据评估结果,设计数据治理的整体架构和实施方案,包括数据治理组织架构、数据标准体系、数据质量评估体系、数据安全管理体系等,并进行相关系统和工具的建设。执行与监控:按照设计方案,全面推进数据治理工作的实施,对数据治理的各项活动进行严格的监控和管理,及时发现并解决实施过程中出现的问题。优化与持续改进:定期对数据治理的效果
猜你喜欢
产品文档
5.17 索引(新)
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
产品文档
5.6 数据操作语句
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...
产品文档
5.2 TEoC 前置参数
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...