信息服务大数据平台

星环大数据基础平台
星环大数据基础平台(TDH) 是星环自主研发的一站式多模型大数据基础平台,包括多个大数据存储与分析产品,能够存储 PB 级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、时序、图像等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预测性分析等数据分析功能。目前 TDH 已经在政府、金融、能源、制造业等十多个行业内落地,支撑如金融风控与营销、智慧制造、城市大脑、智慧交通等多种核心行业应用。

信息服务大数据平台 更多内容

大数据金融服务平台是一种企业级、分布式、开放、统一的大数据平台,它包括数据接入、数据存储、数据处理、数据分析及数据服务相关组件。这种平台的总体目标是帮助金融机构更高效、更快速地完成金融大数据应用的开发、部署和管理,从以交易为中心转向以数据为中心,以应对更多维、更大量、更实时的数据和互联网业务的挑战。以下是大数据金融服务平台的一些关键功能和特征:数据采集与清洗:平台能够从多个来源采集数据,并进行清洗以提高数据质量。风险管理与信用评估:利用大数据分析和机器学习技术,金融机构可以整合客户的行为、财务、社交数据,建立全面的风险管理模型,实现精准的信用评估。智能投顾与资产管理:数据分析帮助智能投顾平台智能化的客户服务工具,提升客户满意度和使用频率。金融产品创新:金融机构通过数据洞察,基于客户需求和市场趋势创新金融产品,例如结合大数据和人工智能推出动态定价的贷款产品或个性化的保险服务。反洗钱与合规管理数据评估其信用风险,快速提供贷款或融资服务。保险风险定价与赔付管理:大数据和人工智能技术帮助保险公司实现更精准的风险定价和更快速的理赔管理,从而提升客户体验并降低运营成本。
大数据服务平台是为各类企业和机构提供数据存储、数据处理、数据分析等服务的综合性平台大数据服务平台大数据生态系统中的重要组成部分,为企业和机构提供了一个高效、可靠、安全的数据处理环境,帮助其解决数据处理难题,发掘数据价值,提高业务水平。大数据服务平台的构建需要综合运用各种技术,包括数据采集、数据清洗、数据存储、数据处理、数据分析、数据挖掘等。星环大数据基础平台-TranswarpDataHub星环大数据基础平台TDH是公司自主研发的一站式大数据基础平台,包括多个大数据存储与分析产品,能够存储PB级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、时序、图像等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预测性分析等数据分析功能。TDH是通用的高性能大数据平台,提供标准的SQL开发接口,有着优秀的数据库兼容性,不仅可以帮助各个行业用户开发创新的数字化业务复杂的异构硬件资源以及降低系统的运维难度,是行业内较早实现基于容器技术管理大数据基础软件的产品。2018年3月,TDH5.1成为全球第一个通过TPC-DS基准测试并经过TPC官方审计的数据平台。从
大数据知识管理服务平台是一种集成的系统,旨在帮助组织有效地管理和利用大数据资源,以支持知识发现、决策支持和业务创新。以下是这类平台的一些关键功能和特点:功能数据集成与管理:平台能够从多个数据源集成数据地理解和利用数据。智能推荐与决策支持:基于数据分析和机器学习模型,平台能够提供智能推荐和决策支持,帮助用户做出更明智的决策。应用场景科研管理:如国家自然科学基金大数据知识管理服务门户,为科研人员提供项目检索、成果统计和知识发现等服务。商业智能:帮助企业分析市场趋势、客户行为和运营数据,支持商业决策和战略规划。政府治理:政府机构可以利用这类平台进行公共数据的管理和分析,提高政府决策的科学性和透明度。,包括结构化和非结构化数据。它支持数据的清洗、转换和存储,确保数据的一致性和准确性。知识发现与分析:通过高级分析工具和算法,平台能够从大量数据中提取有价值的知识和洞察。这包括数据挖掘、模式识别和预测分析等功能。知识共享与协作:提供知识共享和协作的环境,使不同部门和团队能够共享数据和分析结果,促进跨部门的协作和知识传播。可视化展示:将复杂的数据和分析结果以直观的图表和仪表盘形式展示,帮助用户更好
值,并将来自不同源头的数据整合在一起。数据分析与挖掘:大数据服务平台提供各种数据分析和挖掘工具,用于发现数据中的模式、趋势和关联性,帮助用户提取有价值的信息以支持决策和创新。数据可视化与报告:平台能够大数据服务平台是一种提供数据采集、传输、存储、处理(包括计算、分析、可视化等)、交换、销毁等覆盖数据全生命周期的服务平台。以下是一些关键的功能和特点:数据采集与存储:大数据服务平台可以帮助组织和将分析结果以直观和易懂的方式呈现给用户,通过可视化工具和报告生成器,用户可以创建丰富、交互式的数据可视化图表和报告。数据安全与隐私:大数据服务平台致力于保护数据的安全性和隐私性,提供身份验证、数据加密API管理:大数据服务平台通常包括服务目录,展示各目录下的数据服务类型、服务流程和数据资产目录。它还支持API的管理,包括API的创建、发布和监控。数据治理与合规:平台负责数据的规范化、标准化和合规化,包括数据质量管理、元数据管理和合规性审计等功能,确保数据符合内部和外部的规定和标准。性能与弹性:使用云端大数据服务具有快速创建、弹性扩缩容、极致性能等产品特性。全链路数据治理:数据服务平台提供全链路数据治理能力,涵盖资产全景、数据地图、智能监控、数据质量、数据安全、资源优化等多个功能模块。
行业资讯
大数据服务
大数据服务是指基于大数据技术和平台,为企业和机构提供的数据采集、存储、处理、分析以及可视化等一系列服务的统称。服务类型数据采集与整合服务数据采集:从各种数据源(如数据库、文件系统、传感器、网络日志等的数据分析报告,为决策提供依据。服务模式软件即服务(SaaS):供应商将大数据服务以软件的形式提供给用户,用户通过互联网访问和使用这些服务,无需在本地安装和维护软件和硬件设备。如一些云端的数据分析平台,用户只需上传数据,即可进行各种分析操作。平台服务(PaaS):提供大数据处理平台和开发环境,用户可以在平台上开发、测试和部署自己的大数据应用程序。基础设施即服务(IaaS):主要提供计算、存储批处理框架,对大规模数据集进行批量处理,如数据挖掘、统计分析等。流处理服务:利用流处理平台,实时处理源源不断的数据流,实现实时监控和决策。高级分析服务:运用机器学习、深度学习等技术,进行预测分析、文本、网络等基础设施资源,用户可以根据自己的需求租用这些资源来构建自己的大数据环境。应用领域金融领域:用于风险评估、信贷审批、投资决策、市场预测、反欺诈等,通过对海量金融交易数据和客户数据的分析,提高金融机构
电力大数据平台是指利用先进的技术方法来实现业务趋势预测并挖掘数据有价值的信息,以完善营销策略制定等决策性活动的平台。它通过集成管理技术、数据挖掘技术、数据存储技术以及数据计算技术的帮助,实现对电力行业数据的深度分析和应用。数据采集与整合:平台能够整合来自传感器、智能设备、视频监控设备、音频通信设备、移动终端等各类信息获取渠道的海量结构化、半结构化、非结构化的业务数据数据存储与管理:电力大数据组成。公共服务能力:电力大数据平台具备面向社会的公共服务能力,能够为能源调度、政策制定和市场交易提供精准数据支持。。数据可视化:电力大数据平台提供数据可视化功能,将分析结果转化为图表、仪表板,帮助用户理解数据。业务应用:平台支持智慧电厂各领域应用的建设,包括经营决策分析、生产运行管理、设备状态检修系统等。数据治理分析、跨域协同计算等功能,试点开展实时采集、外域数据集成等。智能运维:电力大数据平台数据采集、存储、计算、分析挖掘及可视化展示等核心功能于一体,由数据可视化模块、自助式分析模块、智能运维模块等八个部分
大数据服务平台是一种集成了数据采集、存储、处理、分析和可视化等多种功能,以云计算和分布式技术为基础,为企业和组织提供海量数据管理和深度挖掘服务,帮助其实现数据驱动决策和业务创新的综合性平台。功能特点。智能城市建设:在城市管理中,分析交通、能源、环境等数据,实现智能交通管理、能源优化调配、环境污染监测等,提高城市的运行效率和居民生活质量。发展趋势智能化:随着人工智能技术的不断发展,大数据服务平台将更加分析工具和算法,如SQL查询、机器学习算法、深度学习模型等,支持用户进行交互式分析和探索性分析。数据服务层:将分析结果以API接口、报表、可视化等形式提供给用户,方便用户进行数据消费和决策支持。管理层:负责平台的管理和监控,包括用户管理、资源管理、任务管理、监控告警等功能,确保平台的稳定运行和高效使用。应用场景企业决策支持:帮助企业整合内部和外部数据,通过数据分析和挖掘,为企业的战略规划、市场分析、产品研发、客户服务等提供决策依据。市场营销与客户洞察:分析消费者的行为数据、偏好数据等,实现精准营销、客户细分、客户流失预测等,提高营销效果和客户满意度。金融风险防控:在金融领域,通过对海量金融交易数据
商用大数据平台是指一种能够提供大数据处理和分析功能的商业化软件或服务平台。该平台通常包括数据采集、存储、处理、分析和可视化等功能,以帮助企业或组织对海量的数据进行深入的挖掘和分析,从而提供更好的商业可视化和报告:商用大数据平台通常提供丰富的数据可化和报告功能,以便企业可以将复杂的数据信息转化为易于理解和使用的图表、图形和报告。这样,企业可以更直观地了解数据的内在规律和趋势,进而作出更明智的决策决策依据。商用大数据平台可以帮助企业或组织实现以下目标:数据采集和存储:商用大数据平台能够支持多种数据源的采集,并提供可靠和高容量的数据存储。例如,可以从传感器、社交媒体、网站日志等多种来源采集数据,并将其保存在分布式存储系统中。数据处理和分析:商用大数据平台提供强大的数据处理和分析能力,包括数据清洗、转换、聚合、筛选和建模等。通过这些功能,企业可以将海量的数据整理成可用的形式,并进行各种分析、挖掘和预测工作。可扩展性和弹性:商用大数据平台通常采用分布式计算和存储架构,可以根据需求进行水平扩展和弹性调整。这意味着企业可以根据需要增加或减少计算和存储资源,以适应不断增长的数据量和分析需求。数据
大数据平台建设是一个涉及多个层面的复杂过程,包括数据采集、存储、处理、分析和服务等多个环节。以下是一些关键点和实践案例,可以帮助理解大数据平台建设的各个方面:需求分析与规划阶段业务需求调研:与企业因素,选择最适合的技术组合。设计大数据平台的架构,一般包括数据来源层、数据接入层、数据存储层、数据处理层、数据服务层和应用层。数据采集与存储建设阶段数据采集系统搭建:针对不同类型的数据源,采用相应的安全审计、数据备份与恢复策略、安全事件应急响应机制等。平台测试与优化阶段平台功能测试:对大数据平台的各个功能模块进行测试,包括数据采集、存储、处理、分析、服务和应用等方面。进行集成测试,检查各个功能模块内各个业务部门(如销售、市场、财务、生产等)深入沟通,了解他们对数据的使用场景、痛点以及期望从大数据平台获取的价值。梳理业务流程,确定哪些环节产生数据、需要收集什么样的数据以及数据如何在业务流程中流动和被使用。确定平台目标与功能:根据业务需求,明确大数据平台建设的目标,如提高数据处理效率、实现数据共享与整合、支持数据驱动的决策制定或推动业务创新等。规划大数据平台的功能模块,通常包括数据采集、存储
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...