新闻中心  >  您当前的位置 : 石油科技

奋斗百年路 启航新征程·转观念 勇担当 高质量 创一流 着力打造提质增效“升级版”

安全环保院语义识别模型构建HSE风险研判新模式

数据“沉睡”二十载 一觉醒来会“说话”

  中国石油网消息(记者刘志坚)忽如一夜春风来,“沉睡”数据似花开。9月22日,安全环保院HSE信息中心数据分析人员,打开“QHSE文本语义识别系统”,点击“加载数据”按钮,再点击“生成智能报告”,只需5秒钟,便可生成图文并茂的报告。

  “与传统的人工数据分析方式相比,‘机器’分析效率提升了近4000倍,更重要的是将安全管理人员从繁杂的数据分析工作中解脱出来,让他们有更多时间专注于提升知识、技能空间。” HSE信息中心主任吴顺成说。

  吴顺成说的这种“机器”,是他们的新近攻关成果“基于大数据的石油石化行业HSE风险智能管控新模式及关键技术”。通过石油石化联合会专家鉴定,这项技术整体达到国际先进水平。

  据了解,我国石油石化企业各类信息系统产生了海量、业务类型丰富的文本数据,约占数据总量的75%,由于缺乏分析手段,大多数文本数据的应用止步于数据上报、人工查阅,加上分布在不同的归口管理部门,数据“孤岛”现象突出。据分析,过去20年,65.9%的事故与风险辨识不全面有关,亟须构建集成化的全产业链“业务+安全”数据池,研发面向石油石化企业的文本挖掘技术,将非结构化的文本数据转化为结构化的风险信息。

  项目组经过对“沉睡”了近20年积累的海量文本数据进行3年科技攻关,构建了石油石化领域词典构建工具,积累了14万条领域专业词典,定制化研发了系列石油石化领域语义识别模型。从“业务”和“安全”全面发力,积极构建“业务”和“安全”深度融合的HSE风险管控新生态,解决了文本数据深度挖掘的问题,实现了非结构化数据向结构化风险信息转变、由局部认知到系统认知转变、由“事故潜在风险信息”到“风险预警信息”转变。

  据悉,定制化石油石化领域语义识别模型赋予机器“文本阅读理解”能力,替代安全管理人员阅读各类文本数据、提取风险信息、进行各维度风险量化分析,最后撰写分析报告。现在只要输入excel格式的问题检查表、word格式的事故事件报告等文本数据,就可以“一键”搞定。

  “目前,这一成果不仅为完成单位带来上千万元的项目合同收入,还为3家应用企业每年节约人员用工成本约2000多万元。”项目主要完成人阎红巧说,更重要的是能够使管理者从安全生产“宏观”把握向“微观”运用、从严格监管向风险主动预测的转变转型升级。

版权所有:中国石油新闻中心 | 京ICP经营许可证010289号 | 互联网新闻信息服务许可证编号:国新网许可证1012006016号

电话:010-62094114 | 网站不良信息举报电话:010-64523205 | 编辑信箱:news@vip.oilnews.cn