物流安全大数据平台建设方案
星环大数据基础平台(TDH) 是星环自主研发的一站式多模型大数据基础平台,包括多个大数据存储与分析产品,能够存储 PB 级别的海量数据,可以处理包括关系表、文本、时空地理、图数据、文档、时序、图像等在内的多种数据格式,提供高性能的查询搜索、实时分析、统计分析、预测性分析等数据分析功能。目前 TDH 已经在政府、金融、能源、制造业等十多个行业内落地,支撑如金融风控与营销、智慧制造、城市大脑、智慧交通等多种核心行业应用。
物流安全大数据平台建设方案 更多内容

行业资讯
物流大数据平台
物流大数据平台是利用大数据技术,对物流行业中的各类数据进行收集、存储、处理、分析和可视化展示,从而为物流企业提供决策支持、优化运营流程、提升服务质量和增强竞争力的综合性平台。数据来源运输环节数据清洗、转换和整合技术,将分散、异构的数据统一存储到大数据平台的数据仓库或数据湖中,确保数据的一致性和可用性。数据分析与挖掘:运用统计分析、机器学习、深度学习等算法,对物流数据进行深度挖掘。例如,通过:通过安装在运输车辆上的卫星定位系统(GPS)、传感器等设备,收集车辆的行驶位置、速度、行驶路线、油耗、货物状态(如温度、湿度,对于冷链物流至关重要)等信息。这些数据可以实时传输回平台,用于监控运输有助于优化仓库布局、提高库存周转率、合理安排仓储设备维护和人员工作任务。订单管理数据:电商平台、企业的销售系统或物流企业的订单管理系统产生的订单信息,包括订单的发货地、收货地、货物种类、数量、下单时间过程、优化运输路线、预测车辆故障和确保货物安全运输。仓储环节数据:仓库管理系统(WMS)记录了货物的入库时间、存储位置、库存数量、出库记录、仓库设备的运行状态(如货架、叉车等)以及人员的操作记录等。这些数据

行业资讯
大数据平台建设
大数据平台建设是一个涉及多个层面的复杂过程,包括数据采集、存储、处理、分析和服务等多个环节。以下是一些关键点和实践案例,可以帮助理解大数据平台建设的各个方面:需求分析与规划阶段业务需求调研:与企业被使用。确定平台目标与功能:根据业务需求,明确大数据平台建设的目标,如提高数据处理效率、实现数据共享与整合、支持数据驱动的决策制定或推动业务创新等。规划大数据平台的功能模块,通常包括数据采集、存储因素,选择最适合的技术组合。设计大数据平台的架构,一般包括数据来源层、数据接入层、数据存储层、数据处理层、数据服务层和应用层。数据采集与存储建设阶段数据采集系统搭建:针对不同类型的数据源,采用相应的参数、返回格式、安全认证和访问权限等。数据应用开发与集成:将数据应用与企业的业务流程和其他系统进行集成,实现数据驱动的业务创新和优化。数据治理与安全建设阶段数据治理体系构建:建立元数据管理系统,对大数据安全审计、数据备份与恢复策略、安全事件应急响应机制等。平台测试与优化阶段平台功能测试:对大数据平台的各个功能模块进行测试,包括数据采集、存储、处理、分析、服务和应用等方面。进行集成测试,检查各个功能模块

行业资讯
物流数据中台
等手段确保数据的安全性和隐私性。智慧园区案例:物流数据中台可以作为智慧园区建设的一部分,通过智能分析优化资源配置和提高出行效率。未来趋势:物流数据中台将更加注重与业务场景的紧密结合,通过技术创新和生态协同来不断提升其价值和竞争力。它将更加智能化和个性化,为物流企业提供更精准的决策支持和业务优化方案。物流数据中台是物流行业数字化转型的关键组成部分,它通过整合和分析物流数据,为企业提供决策支持和业务优化方案。以下是物流数据中台的主要建设内容和特点:技术体系:物流数据中台的技术体系包括数据采集、加工业务或下游系统使用,实现D2V(DatatoValue)的理念。它支持数据大屏和BI报表等数据应用,为运营分析提供直接有效的服务。运营体系:物流数据中台的运营体系包括数据质量管理、数据安全和隐私保护等。它还包括数据备份与恢复机制、权限管理和开发与生产环境物理隔离等安全保障措施。安全保障:数据安全与隐私保护是物流数据中台建设的重要环节,涉及到客户信息、订单信息等敏感数据的保护。采用数据加密、访问控制(公共数据中心)和应用层(萃取数据中心和主题中心)。物流数据中台能够整合物流行业多源异构数据,打造统一的数据平台,实现数据的集中管理和治理。服务体系:物流数据中台提供数据服务化,将数据封装成服务提供给

行业资讯
建设大数据平台案例
综合性治理为基础,建立有效的组织保障及制度保障,重点围绕IT治理体系和信息安全体系开展管控建设,为开展大数据平台建设、推动数据治理工作的基础保障支撑。解决方案某电器企业基于星环科技企业级一站式大数据综合平台TDH作为技术平台底座,搭建了统一的大数据异构存储平台,提升多模数据存储能力,为数据治理保障和应用建设提供支撑。治理保障层面,某电器企业基于TDH大数据基础平台,对19个业务系统进行数据归集和线生产、仓储楼饱和度等运营状况。2.质量追溯平台一期质量追溯平台基于Oracle数据仓库支撑,由于无法承载和响应大量MES订单明细数据,故在二期质量追溯平台建设中,考虑将原有数据迁移至星环科技大数据大管理体系,加速推动某电器企业数字化转型。为实现数字化转型目标,某电器企业希望与星环科技的合作,构建统一的大数据平台,掌控企业的运营情况;建立公司级综合度量指标体系,统一度量口径、业务目标和交流语言;进行数据归集,挖掘数据价值,通过大数据平台积极探索新型业务价值,支撑业务应用的建设。具体需求如下:1.统一数据标准规范通过大数据对公司数据资产进行清洗、转换、整合,实现企业数据标准化、集成化、标签化
“绿盾”工程项目建设了统一的大数据平台,解决了用户原系统各自为政、多平台、数据孤岛的问题,全组件的安全统一配置管理,既解决了用户原开源平台缺乏安全防护的问题,又简化了整个平台的安全管控政府行业内影响深远。星环科技为项目建设的大数据平台总结的Slipstream+AgroDB流批一体化方案,使用UDTF多线程的方式在不加大Kafka负载的情况下增大并发度、提高吞吐量方案,通过一体化的需求。2020年双十一业务高峰期内,平台运行稳定,做到所有任务零积压。作为国家发改委重点项目,国家邮政局邮政寄递渠道安全监管“绿盾”工程建设项目接入数据量大,应用场景丰富,辐射面广,在国家层面及SlipstreamStudio、Slipstreamcheckpoint功能实时监控任务的TPS、挤压量情况、各时间维度流量方案,以及多用户下全组件安全模式下的权限细分方案等,丰富了Stuido在流任务监控上的一些盲点,完善了产品的功能与特性,都是可复用的典型场景方案,具有广泛的行业应用前景。

行业资讯
大数据建设方案
解锁大数据建设方案,开启数据驱动新时代大数据:开启新时代的钥匙随着大数据应用的不断深入,各行业对大数据的依赖程度与日俱增,构建一套科学、高效、安全的大数据建设方案,已成为企业和组织在激烈竞争中大厦根基搭建大数据中心架构体系,是大数据建设的核心任务,如同为数据大厦奠定坚实的根基,对后续的数据汇聚、流通与应用起着关键的支撑作用。建立中心主平台,在整个大数据中心架构体系中占据着统筹全局的关键地位。主平台就像是数据世界的“指挥中枢”,承担着统筹建门户、出标准、定规则的重任。在硬件设施方面,需要建设高性能的数据存储、灾备以及交互服务器集群,确保数据能够安全、稳定地存储,并实现高效的交互传输。在软件系统层面,构建数据管理发布、共享交互、应用服务以及安全保障等系统,让数据的管理、共享和应用有章可循,同时全方位保障数据的安全性。统一的数据标准规范体系是主平台的重要建设内容。不同来源的数据,其格式的数据安全保障体系同样不可或缺。随着数据价值的不断提升,数据安全面临的威胁也日益严峻。主平台需要依据数据的重要性、敏感性等因素,对数据进行科学合理的分类分级,针对不同级别的数据采取相应强度的安全

行业资讯
数据安全平台建设方案
搭建数据安全堡垒,解锁数据价值密码蓝图初绘:平台建设目标与原则数据安全平台建设的总体目标是实现数据的可视、可管、可用、可溯、可控,确保数据在全生命周期内的安全性、完整性和可用性,有效防范数据泄露安全风险的有效控制和管理。制定完善的数据安全策略和应急预案,及时发现和处理数据安全隐患,降低数据安全事件的发生概率和影响程度。为了实现上述目标,数据安全平台建设应遵循以下原则:先进性:采用先进的数据安全紧密围绕企业的实际业务需求,注重实用性和可操作性。确保平台能够切实解决企业在数据安全管理方面的痛点和问题,为企业提供实实在在的价值。可扩展性:考虑到企业未来的发展和数据量的增长,平台应具备良好的可扩展性。能够方便地进行功能扩展和性能提升,以适应不断变化的业务环境和安全需求。安全性:作为数据安全平台,安全性是首要原则。平台应具备完善的安全防护机制,包括身份认证、访问控制、数据加密、安全审计等,防止数据被非法获取、篡改和滥用。同时,加强平台自身的安全管理,确保平台的稳定运行。易用性:平台的操作界面应简洁明了,易于使用和管理。减少用户的学习成本,提高工作效率。同时,提供完善的用户培训和技术支持,确保用户能够熟练掌握平台的使用方法。

行业资讯
大数据平台建设和数据治理案例
基于Slipstream、Inceptor等TDH组件设计的星环平台架构替换原有开源平台架构,降低了大数据建设的安全风险;通过星环智能大数据资产目录catalog保证平台执行sql可追踪、智能分析一、背景近年来,随着金融科技的快速发展以及互联网机构不断加大数字金融布局,大数据平台建设和数据治理逐渐成为证券公司建设现代化投资银行面临的重要挑战。基于大数据技术,整合现有数据,接入外部数据,构建高性能大数据平台,能够满足证券企业高计算、高存储、高负载的要求;通过数据治理,建设组织级标准体系、健全数据质量控制机制、加强数据内部协同、规范外部数据合作,提升数据管理水平来保障公司数据化战略的落地,利用星环大数据基础平台TranswarpDataHub(TDH)和大数据开发工具TranswarpDataStudio(TDS)进行大数据平台建设和数据治理,并在部署后的运行期间,数据资产规模突破120TB,数据库采集超过50个,采集表规模突破7000+,全年完成的开发需求超过200个,涉及部门数量10+,在大数据平台的支撑下开发了安全微管家、日志数据上链、埋点管理系统等,数据治理体系进一步完善

行业资讯
大数据平台建设
大数据平台建设是一项系统工程,涵盖从规划设计到运维优化的多个关键环节,以下是具体介绍:规划设计需求调研:与各部门沟通,明确数据来源、处理需求、应用场景及性能要求等。架构选型:根据需求选择合适的架构,方便决策。应用开发部署:开发数据报表、数据挖掘、智能决策等应用,集成到业务系统,为用户提供数据服务。安全与运维保障安全体系建设:实施身份认证、访问控制、数据加密、审计等安全措施,保障数据安全。运维管理实施:通过监控工具对平台的硬件、软件、数据进行实时监控,建立故障处理、备份恢复、版本更新等运维机制,确保平台稳定运行。,确定技术栈。资源评估:估算数据量、计算量,确定服务器、存储、网络等硬件资源规模。数据采集与预处理采集:运用具,从数据库、文件系统、传感器、网络日志等多源采集结构化、半结构化和非结构化数据。传输:通过消息队列实现数据的高效传输,确保数据的实时性和稳定性。预处理:使用ETL工具或编写脚本,对采集数据进行清洗、去重、格式转换等,提高数据质量。数据存储与管理存储系统构建:基于分布式文件系统或NoSQL
猜你喜欢
产品文档
8 性能分析
本节测试主要描述了Hippo1.0在关键测试上的一些性能表现,该份测试同样也是Hippo的基准测试,后续版本发布也会在不同版本上进行该测试进行对比分析。术语表142.Hippo性能测试术语TermDescriptionnq一次搜索请求中搜索的向量个数topk一次请求中对于要检索的每个向量(依赖nq),所能检索到最近距离的向量个数RT一次请求从发起到接受响应的时间]QPS请求在每秒内成功执行的次数dataset测试所用数据集,不同数据集表示不同的业务场景测试集群配置硬件配置表143.性能测试硬件配置硬件规范Nodes3CPUIntel®Xeon®Gold5218RCPU@2.10GHzMemory16*\16GBRDIMM,3200MT/sDISKNVMeSSD2T*4GPUNONE软件配置表144.性能测试软件配置软件版本Hippov1.2TranswarpManagerTDH9.3.0测试集表145.性能测试数据集数据集名称数据集介绍向量维度向量总数查询数量数据总量距离类型Sift-128-euclidean该数据集是基于Texmex的数据集整理,使用SIFT算法得到的图片特征向量。...
产品文档
5.3 写入类操作
本节介绍Hippo表写入相关操作。Hippo会返回写入成功数据的下标以及总共写入成功的数据条数,如果出现行级错误(比如主键冲突),Hippo会返回具体的行级错误。插入本节介绍如何向Hippo中插入数据。curl-ushiva:shiva-XPUT'localhost:8902/hippo/v1/{table}/_bulk?database_name={database_name}&pretty'-H'Content-Type:application/json'-d'{"fields_data":[{"field_name":"book_id","field":[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74...
产品文档
1 Introduction
OverviewUnstructureddatamanagementismoreimportantthaneverduetotheriseofbigdata.Managingandgleaningbusinessvaluefromunstructureddataisofutmostimportancetoenterprisestoday.Advancementsinmachinelearning,aswellasdeeplearning,technologiesnowenableorganizationstoefficientlyaddressunstructureddataandimprovequalityassuranceefforts.Inthefieldofartificialintelligenceormachinelearning,embeddingsandvectordatabaseshavebecomeincreasinglyimportantfortacklingawiderangeofproblems.Thesetechniquesareusedtorepresen...
产品文档
5.18 全文检索
Hippo在1.2版本提供了全文索引能力,兼容ElasticSearch6.7.2语法,在底层架构上复用了公司产品TranswarpScope的一部分特性,支持以Java/HTTPRestful的形式通过Hippo的HTTPServer接口进行全文索引的创建、查询、使用等各类需求,通过该能力的支持,可以更好的实现向量与全文的混合检索。通过将向量检索加全文检索的联合召回,可以降低漏检和误检的概率,能够实现比单独使用向量或全文更高的精度。同时,一套数据库系统可避免部署多套系统带来的架构复杂、开发运维成本高等问题。具体的使用方法除了访问端口需要将端口从8902调整为9200外,均可参考《TranswarpScope手册》4.TranswarpScopeAPI介绍。
产品文档
5.8 查看集群信息
查看Master节点通过以下命令,查看集群Master节点信息:curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/master?v'返回结果:epochtimestampactive.master.hostactive.master.portmaster.group169079683909:47:19172.29.203.18926841172.29.203.189:26841,172.29.203.189:26851,172.29.203.189:26861查看数据节点curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/nodes?v'//查看所有节点curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/_cat/nodes/{node}?v'//{node}表示待匹配的节点地址,支持以*通配,支持指定多个pattern,多个pattern以逗号分割返回结果:
产品文档
10 Hippo 运维
运维管理界面WebserverWebserver是Hippo提供运维监控的界面。默认访问地址为:4567"class="bare">http://<webserver_ip>:4567。或者在Manager管理界面我们可以通过下图所示的查看链接这里进行跳转。图15.登录HippoWebserverWebserver主要由下面几个部分构成。概况图16.概况该页面展示了Hippo集群的基本信息,包括:Masterstatus:当前的ActiveMaster,MasterGroup,MasterAddress,Master的健康状态TabletServerStatus:TabletServerAddress,健康状态,逻辑机架和数据中心信息,容量使用以及Tablet个数TabletNum:当前集群表的个数Version:Hippo版本信息库表图17.库表页面以库和表的概念集群存储的各类数据信息。库信息:库名库创建时间库内各类表的信息:点击某个库,可以看到库下所有表的信息,主要包括:••表的ID••表的名字••表的状态••表的Tablet数量••表的Engine类型••表的副本数•...
产品文档
5.7 查询类操作
过滤条件表达式Hippo当前支持如下表达式,可用于标量或向量查询。表46.过滤条件表达式表达式描述and当前版本支持and,不支持or/not==等值<小于⇐小于等于>大于>=大于等于inin[1,2,3]notinnot_in[1,2,3]like'_'表示匹配任一字符,'%'表示匹配任意字符,'\'为转义符向量相似性检索本节描述如何进行向量相似度搜索。Hippo中的向量相似性搜索计算查询向量与表中向量的距离,返回最相似的结果集。通过指定标量过滤条件,用户可以进行向量与标量的混合搜索。curl-ushiva:shiva-XGET'localhost:8902/hippo/v1/{table}/_search?pretty'-H'Content-Type:application/json'-d'{"output_fields":["book_id"],"search_params":{"anns_field":"book_intro","topk":2,"params":{"nprobe":10},"embedding_index":"ivf_flat_index"}...
产品文档
3.3 Cluster
OverviewAclusterisaHippoCloudinstanceassociatedwithspecificcomputingresources.Youcancreaterelatedtables,insertcorrespondingdata,andcompleteproductexperiencewithinacluster.Beforeyouusethedemoenvironment,youneedtocreateacluster.CreateClusterYouneedtogotothespecificproject.Iftherearenoclustersunderthecurrentproject,youcanclickthe'Createcluster'buttonbelowtheclustercreationguidancepagetoentertheclustercreation.Ifthereareclustersunderthecurrentproject,youcanclickthe'+Cluster'buttonabovetheclusterlist...
产品文档
2 Quick Start
ThistutorialwillguideyouthroughthefollowingtaskswithinHippoCloud:EstablishingatablePerusingthetableIncorporatingdataExecutingsearchoperationsEliminatingrowsDissolvingthetableBeforeyoustartInthisguide,wewillbeutilizingthePythonAPI.Priortocommencement,ensurethatyouhave:RegisteredforaHippoCloudaccount.SubscribedtothecomplimentaryplanandestablishedatrialclusterwithinHippoCloud,orsubscribedtothestandard/enterpriseplansandconstructedadedicatedcluster.IfyouanticipateemployingPythonfordevelopment,ascert...
产品文档
5.10 任务相关
在Hippo中,比较耗时的操作如激活、加载向量索引实际上是一个分布式任务,用户可以通过任务相关接口查看、删除任务。查看任务curl-ushiva:shiva-XGET"localhost:8902/hippo/v1/_jobs?pretty"-H'Content-Type:application/json'-d'{"job_ids":["fc6feff4f303455a9347f9aab323dfc8"],"action_patterns":["hippo*"]}';返回结果:{"jobs":[{"job_id":"810935a1d91a46b7af2ec35013454fed","job_status":"SHIVA_JOB_SUCCESS","embedding_number":100,"task_results":[{"id":"54ab52493dfb4bab9fb7742d850c64c4","status":"TASK_SUCCESS","server":"172.29.40.26:27841","embedding_number":100,"execute_time":...