煤矿集团大数据平台建设

星环大数据基础平台
星环大数据基础平台(TDH) 是星环自主研发的一站式多模型大数据基础平台,包括多个大数据存储与分析产品,能够存储 PB 级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、时序、图像等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预测性分析等数据分析功能。目前 TDH 已经在政府、金融、能源、制造业等十多个行业内落地,支撑如金融风控与营销、智慧制造、城市大脑、智慧交通等多种核心行业应用。

煤矿集团大数据平台建设 更多内容

行业资讯
煤矿数据治理
按照机密级别、重要性等进行分类,针对不同等级的数据采取相应的保护措施。数据治理体系构建:智能化煤矿建设大数据服务中心,统一数据采集、传输、存储和访问接口标准,构建煤矿数据治理体系。这包括支持多种数据系统集成到综合管理平台,实现数据的集中管理和服务。数据管理机制:建立完善的数据质量管理组织架构,明确数据权属、管理者、使用者等,运用新一代信息技术建设业务中台和数据中台,为上层业务应用提供统一的数据汇聚与,建立矿井多源异构信息数据共享平台。技术架构:煤矿行业数据治理技术架构包括“数通、数聚、数治、数融、数信、数享”六个环节,从数据的采集到加工,最终形成企业数据资产的转变过程。数据安全定级原则:立统一、完善煤矿智能化建设整体目标的重要基础,对于加快煤矿智能化建设、促进煤炭工业数字化转型、构建现代化能源体系、建设数字中国具有重要意义。数据治理框架与发展路径:智能煤矿数据治理的发展路径包括完善煤矿全局全息信息数据采集、构建适宜煤矿数据中台、研发融合智能决策的数据应用、夯实煤矿数据治理的基础设施保障。煤矿数据治理是一个复杂的过程,它涉及到数据的采集、管理、安全和合规性等多个方面。数据安全管理:煤矿数据安全管理是保障煤矿数据不被泄露、篡改或丢失的重要措施。煤矿应建立完善的数据分类管理制度,将数据
随着信息化技术的高速发展,越来越多的企业重视数据的价值,并且将大数据平台视为集团管理的核心。建设一个数字化的大数据平台能够帮助企业更地管理数据,并提高数据的利用率和价值。在建设集团大数据平台业务部门之间需要实现信息的共享。但同时也需要考虑如何保护数据的安全,包括数据的加密、权限管理、访问控制等。集团大数据平台的数字化建设需要综合考虑数据采集、整合、处理、分析、挖掘、运营、共享、安全等各个方面,利用现代化的信息技术来实现数据的全面利用和优化。业务方案,提高业务效率以及类似的需求需要快速响应,确保数字化平台在常规管理和运维日夜工作的情下,能够快速响应业务需求。4.信息共享与数据安全数据共享是大数据平台建设中非常重要的环节,企业内部不同数字化建设时,需要考虑以下几个方面:1.数据采集和整合数据采集是整个大数据平台建设的关键步骤,需要通过各种数据源来获取企业内部及外部的数据。透过现有的公司设施(软件,硬件和数据),通过寻求扫描,抓取,解析和,通过数据分析,对采集来的数据进行处理,并产生高质量的报告,提供数据可视化方案等。此外,我们还需要运用数据仓库,大数据分析工具等相关的IT解决方案,确保实现一个高效完成各项业务任务的数字化平台。3.数据
务单位实现数字化转型,业务应用事业部提出由信息公司自主建设集团大数据基础服务平台,作为集团数字基础设施支撑集团各级次的数据应用。二、大数据平台建设需求中化集团目标建立一个以数据驱动为核心,以技术支撑为和人工智能应用基础软件平台。自主可控:大数据是企业核心资产,应自主建设,遵循先进适用、稳定安全、灵活开放的原则设计。平台借助多租户的模式,可以满足集团及各个板块对数据和权限的管理要求,使得集团建设一、项目背景为响应国资委在《关于2019年进一步加强中央企业集团管控信息化工作有关事项的通知》中对央企提出的“系统、大平台大数据”信息化要求,同时为了推进集团“数字中化”的战略目标,助力集团各业基础,赋能企业一体化协同、管理创新和业务创新的大数据平台。技术先进:先进的技术能够保证整个大数据系统的稳定性与兼容性,同时能够合理利用资源,避免有限的资源浪费。集团需要建立一个结合先进技术一体化的大数据服务。快速落地:通过外部厂商实施,快速建立平台,支持多元化数据应用搭建,使得集团能够及时把握市场机会。星环大数据平台提供强大兼容能力,大大降低平台的使用门槛,用户可以结合通用数据技术快速上手。三、项目实施1.
一体化。图4:沙钢工业互联网平台云边一体架构图应用成效1、海量业务数据分析与展示基于工业互联网平台的分布式计算能力,实现了沙钢集团财务、生产等主要业务领域的大数据批量分析与展示。2、生产现场实时监控和告警Sophon搭建的工业互联网平台,打通汇聚了各个业务环节的海量数据,通过大数据分析与机器学习工具将沉睡数据唤醒,促进了集团的业务数字化转型;同时工业互联网平台建设,显著提高了沙钢集团炼钢工艺的质量和效率,大大减少了人力投入与生产过程中的碳排放,实现了由科技驱动的工业数字化、绿色化转型。、风险投资、大数据等板块在内的跨国企业集团,连续11年跻身世界500强。沙钢集团积极响应国家号召,以节能减排为己任,以科技为引领,通过管理和技术变革实现钢铁工业的节能、减排与降耗,全面推进工业数字化转型人工控制,容易导致终钢水质量参差不齐;且如今工厂年轻力量越来越薄弱,炼钢过程亟需从经验化转换为标准化。需求需要构建沙钢的工业互联网平台,利用大数据平台的分布式计算能力、实时流计算能力、机器学习能力,帮助企业实现效率提升基于工业互联网平台机器学习能力,通过转炉炼钢的生产过程大数据,找出了吹炼过程中供氧和造渣操作之间很好的协调方式,沉淀了转炉炼钢的工业生产模型,做到了标准化的炼钢生产。模型沉淀后可进行生产化参数
星环科技以大数据基础平台TDH为数据底座,替代国外传统关系型数据库,利用大数据开发工具TDS进行数据开发和治理,结合智能分析工具Sophon构建基于客流预测算法的大数据分析平台,充分利用清分数据起到了积极的推动作用。未来,星环科技将与该城市轨道交通该集团携手,持续深化客流分析与预测应用场景,探索智能设备运维、能耗分析建设、供应链智能协同等创新场景,构建智能化数据分析场景体系,实现“数据变现”模式,让数据产生价值,为“数字地铁”提供数据保障。、行车计划以及车站闸机设备等各类数据,实现更加稳健灵活的客流分析与预测功能,提升线路、车站在客流运营方面的管理能力。该方案服务于科学合理化的行车计划安排,对提升线网客流综合服务水平、强化线网整体管控能力
战略目标,助力集团各业务单位实现数字化转型,业务应用事业部提出由信息公司自主建设集团大数据基础服务平台,作为集团数字基础设施支撑集团各级次的数据应用。二、大数据平台建设需求中化集团目标建立一个以数据驱动为需要建立一个结合先进技术一体化的大数据和人工智能应用基础软件平台。自主可控:大数据是企业核心资产,应自主建设,遵循先进适用、稳定安全、灵活开放的原则设计。平台借助多租户的模式,可以满足集团及各个板块对数据数字经济正在成为时代发展的主旋律,对传统行业而言,数字化转型已经不再是可有可无的选择项,而是关乎企业生死存亡的必答题,每个企业都应该有自己个性化的数字化战略,其中,建设统一大数据平台是描绘数字化王国蓝图浓墨重彩的一笔。一、项目背景为响应国资委在《关于2019年进一步加强中央企业集团管控信息化工作有关事项的通知》中对央企提出的“系统、大平台大数据”信息化要求,同时为了推进集团“数字中化”的核心,以技术支撑为基础,赋能企业一体化协同、管理创新和业务创新的大数据平台。图大数据平台蓝图技术先进:先进的技术能够保证整个大数据系统的稳定性与兼容性,同时能够合理利用资源,避免有限的资源浪费。集团
来自: 官网 / 案例
大数据平台建设是一个涉及多个层面的复杂过程,包括数据采集、存储、处理、分析和服务等多个环节。以下是一些关键点和实践案例,可以帮助理解大数据平台建设的各个方面:需求分析与规划阶段业务需求调研:与企业被使用。确定平台目标与功能:根据业务需求,明确大数据平台建设的目标,如提高数据处理效率、实现数据共享与整合、支持数据驱动的决策制定或推动业务创新等。规划大数据平台的功能模块,通常包括数据采集、存储因素,选择最适合的技术组合。设计大数据平台的架构,一般包括数据来源层、数据接入层、数据存储层、数据处理层、数据服务层和应用层。数据采集与存储建设阶段数据采集系统搭建:针对不同类型的数据源,采用相应的内各个业务部门(如销售、市场、财务、生产等)深入沟通,了解他们对数据的使用场景、痛点以及期望从大数据平台获取的价值。梳理业务流程,确定哪些环节产生数据、需要收集什么样的数据以及数据如何在业务流程中流动和、处理、分析、可视化和数据治理等功能。技术选型与架构设计规划:评估不同的大数据技术框架和工具,如分布式存储系统、分布式计算框架、数据仓库、数据挖掘工具和数据可视化工具。根据平台的目标、功能需求和数据规模等
架构图应用成效1、海量业务数据分析与展示基于工业互联网平台的分布式计算能力,实现了沙钢集团财务、生产等主要业务领域的大数据批量分析与展示。2、生产现场实时监控和告警基于边缘计算和实时流引擎,实现了现场了各个业务环节的海量数据,通过大数据分析与机器学习工具将沉睡数据唤醒,促进了集团的业务数字化转型;同时工业互联网平台建设,显著提高了沙钢集团炼钢工艺的质量和效率,大大减少了人力投入与生产过程中的碳排放,实现了由科技驱动的工业数字化、绿色化转型。、风险投资、大数据等板块在内的跨国企业集团,连续11年跻身世界500强。沙钢集团积极响应国家号召,以节能减排为己任,以科技为引领,通过管理和技术变革实现钢铁工业的节能、减排与降耗,全面推进工业数字化转型终钢水质量参差不齐;且如今工厂年轻力量越来越薄弱,炼钢过程亟需从经验化转换为标准化。需求需要构建沙钢的工业互联网平台,利用大数据平台的分布式计算能力、实时流计算能力、机器学习能力,帮助企业实现如下。钢水合格后,可以浇成钢的铸件或钢锭,钢锭可以再轧制成各种钢材。炼钢流程示意图问题与需求问题1、经过多年信息化建设,沙钢集团已具备生产、质量、采购、销售、财务等业务系统,拥有大量的业务数据,各业务系统
来自: 官网 / 案例
方案针对京博集团智能调度和会员营销的建设需求,星环科技基于自主知识产权的数据平台TranswarpDataCloud(以下简称TDC)、大数据基础平台TranswarpDataHub(以下简称TDH)、大数据开发工具TranswarpDataStudio(以下简称TDS)打造为其提供了企业级的、由各产业公司集中统一管控的数据平台解决方案,方案架构如下图所示:京博集团数据平台架构图京博集团的企业实现一站式数字化转型、加速业务创新的致胜关键。智能调度系统京博集团智能在途排队系统由京博石化、邦维公司、星环科技联合开发。系统应用微信小程序+大数据技术,前端使用微信小程序司机可随时随地进行在途智能排队;后端采用邦维Guns+星环大数据技术搭建的智能排队模型,实现分钟级结果反馈,提升排队的准确性和实时性。京博石化智慧在途排队系统架构图具体而言,京博石化的智慧在途排队系统基于TDC星环数据平台系统京博新能源在星环数据平台TDC上划分独有的租户,通过星环大数据基础平台TDH建立了自己的会员营销分析系统,实现了驾驶舱、运营灵活分析、零售分析、建立客户画像及分类标签、会员运营与营销评估等功能
来自: 官网 / 案例
产品文档
5.12 变量声明
声明简介声明是指为特定数据类型的变量分配一定的存储空间,并命名该变量以便引用它;必须先声明变量,然后才能引用它;对声明的变量可以进行赋值操作来改变它的值;声明的变量其作用域是Session级别的。变量声明使用decl关键字声明一个变量必须为变量指定名称和类型,且名称不能与已有的变量名相同。声明但未赋值的变量的默认值为null。变量名声明对大小写敏感。变量声明的语句遵循如下格式:DECL[<variable_name>:<variable_type>];使用方法示例如下表所示:语句说明declx:int;声明一个类型为int的变量xdecls:string;声明一个类型为string的变量sdecll:long;声明一个类型为long的变量ldeclb:boolean;声明一个类型为boolean的变量bdecld:double;声明一个类型为double的变量ddecltime:localdatetime;声明一个类型为localdatetime的变量timedecld1:decimal;声明一个类型为decimal的变量d1decllist1:list[int...
产品文档
3 安装 StellarDB
3.1在TDH平台安装StellarDB3.2StellarDB安装校验3.3StellarDB低版本升级至StellarDB5.0.1
为什么引入动态图模型?在实际应用过程中很容易可以发现,图数据在很多图数据的应用场景中并不是静态不变的,而是动态演进的,这些场景中包括例如金融反欺诈场景中金融交易网络随着时间的推进而发生的交易变化、交易社群变化等;又比如社交网络中新增用户、用户关注或者取消关注、更改账户信息等。将图数据变化的历史记录下来,不仅可以用于历史数据规律的总结,还可以利用动态图数据进行动态图神经网络相关技术的研究,从而进一步挖掘数据中潜在的数据价值和更加灵活高效的业务场景,譬如预测某一个时刻某一事件是否会发生。动态图模型的动态变化图数据的动态变化主要分为两类,一类是节点或边的属性的值的变化;另一类变化是子图(结构)的变化,如新增/删除点边。这两种图数据的动态变化可以单独发生,也可以同时发生。从图数据的属性变化角度来看,StellarDB5.0.1动态图模型可以记录图中节点或者边属性的所有历史版本(而非新数据覆盖旧数据)。在实际数据开发使用中,还可以结合诸如柱状图、趋势图等对历史数据进行可视化,更加直观、更加适合业务使用。从图数据的子图(结构)的角度来看,StellarDB5.0.1动态图模型还可以返回不同时间子图...
通过beeline或JDBC时,设置参数configquery.langcypher;将查询语言切换为TEoC模式。根据使用场景选择查询模式(默认为immediate模式)immediate模式通常用于并发及短查询场景,查询结果和中间结果通常不超过百万。通过configcrux.execution.modeimmediate;切换。analysis模式通常用于分析场景,创建图、插入数据以及图算法相关的语句必须在该模式下进行。通过configcrux.execution.modeanalysis;切换。
产品文档
7.1 自定义函数
StellarDB支持用户添加自定义函数,添加后可在cypher语句中使用。自定义函数实现自定义函数通过java/scala语言开发,可继承实现两种基类,编译成jar包,通过指定命令加载到StellarDB。需要实现的基类为如下两种,可自行选择继承合适的基类:继承UDF基类继承GenericUDF基类。继承UDF基类该类实现简单,功能较为单一。支持Quark的基本类型、数组和Map。适合实现简单的逻辑。继承org.apache.hadoop.hive.ql.exec.UDF类继承UDF类必须实现evaluate方法且返回值类型不能为void,支持定义多个evaluate方法不同参数列表用于处理不同类型数据。@Description(name="my_plus",value="my_plus()-ifstring,doconcat;ifinteger,doplus",extended="Example:\n>selectmy_plus('a','b');\n>ab\n>selectmy_plus(3,5);\n>8")/***实现UDF函数,若字符串执行拼接,in...
产品文档
5.10 表达式
类型表达式类型例子十进制型整数10,-213十进制小数1.25,3.604E-14,-2.31十进制型长整数199345843592l,-12381543923L任意精度的有符号十进制数123bd,123.31BD八进制整数(0开头)084,-096字符串"星环",'信息科技'布尔类型true,false,TRUE,FALSE数组类型[1,2,3],["星环","信息科技"],[decimal(10.2,3,1),decimal(100.2,3,2)],[localdatetime("2021-01-18T09:50:12.627"),localdatetime("2021-11-18T03:50:12.113")]时间类型localdatetime("2021-01-18T09:50:12.627")Decimal类型decimal(10.2,3,1)地理空间类型point(20.5,30.5),point(-20.5,-30.5)时序类型{localdatetime("2023-01-01T15:16:17")::"nice"},{localdatetime("1997-01-01...
产品文档
6.1 图计算
StellarDB5.0.1版本对图算法场景进行了大规模改进和提升,内置算法性能得到较大提升。在语法方面,StellarDB5.0.1的内置图算法对于返回的节点,会直接以节点类型返回。因此可以直接使用uid(vertex)访问节点的uid,而不再需要node_rk_to_uid函数进行uid的转换。可以参考PageRank等函数。另外,对于图算法返回的节点,我们也可以灵活的访问其其他属性作为返回值。图计算简介StellarDB的图计算使用TEoC语句调用相应图算法。算法的输入数据为图的点、边数据。当前版本中图计算支持结果返回、结果导出和结果写回。在使用图算法时,使用configcrux.execution.modeanalysis;语句切换到分析模式下使用图算法语句。图数据视图StellarDB支持创建一个可被持久化的视图,用于加速图算法执行过程。创建视图创建视图的语法如下所示:createquerytemporarygraphviewGRAPH_VIEW_NAMEas(v)[e]withGRAPH_ALGO(@GRAPH_VIEW_NAME,VIEW_STORE_PATH,CONFI...
产品文档
4 快速入门
快速上手本章节将引导您快速熟悉StellarDB,并为您初步介绍如何通过KGExplorer和beeline客户端操作StellarDB。其中,"StellarDB初探"一节通过构建一张人物关系图,从零介绍如何在StellarDB进行基本操作;"StellarDB进阶"一节为您提供了内置于StellarDB的《哈利·波特》人物关系图,帮助您进一步探索StellarDB。StellarDB初探使用KGExplorer构建图从Manager页面进入KGExplorer页面。若KGExplorer开启了单点登录,会自动跳转Federation登录页面,按如图方式登录:KGExplorer用戶开启方法以及详细使用说明请查看章节《KGExplorer使用文档》。点击登录后进入KGExplorer主页面。我们首先需要构建图名为"hello_world"的图。在主页面右上角点击创建图按钮开始图谱schema的构建。按照引导填写图基本信息后点击确定进入构建页面。在画布中,我们为"hello_world"图创建Boy和Girl两种类型的点,两种类型的点均包含name、salary、age、single四...
索引是数据库中某些数据的冗余副本,目的是使查询性能更优。作为代价,数据库需要额外存储空间和较慢写入速度,因此决定哪些字段需要索引是一项重要且不易的任务。(新)StellarDB5.0.1版本不再对旧版本使用的manipulatecreate_index和manipulatedelete_index语法进行支持,在新版本中统一使用createindex和dropindex进行索引的创建和删除新增索引CREATEINDEX[IFNOTEXISTS]FOR(LabelName)ON[f1,f2,...];CREATEINDEX[IFNOTEXISTS]FOR[LabelName]ON[f1,f2,...];不支持对TIME_SERIES类型的属性创建索引默认情况下,对同一个Label的某个属性多次创建索引会报错;但如果带有IFNOTEXISTS,则不会抛出任何错误包裹点边LabelName的括号不同,注意区分示例1.在点labelperson的属性name和age上建立索引CREATEINDEXIFNOTEXISTSFOR(person)ON[name,age];示例2.在边labelask...
本章节的示例语句均可在示例图my_graph中执行,执行前请先创建示例图my_graph,建图语句如下:creategraphmy_graphwithschema(:Boy{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})(:Girl{namestring,salarydouble,ageint,singleboolean,birthdaylocaldatetime,reservelong,ratedecimal(38,10),hobbysarray<string>,geoPointgeo<double>})[:Friend{sinceint}][:Likes{sinceint}]graphproperties:{`graph.shard.number`:3,`graph.replication.number`:...