《大数据》2023年第6期目次&摘要

8f7ef0863f618ecfa6239cf3f9a1d8de.png

点击上方蓝字关注我们

93588edf786fadde012290871449a9ec.png

af99d1aa716cd7a77a210249529ec3a8.png

《大数据》

第9卷第6期 2023年11月

大数据2023年第6期

(点击原文链接在官网阅读完整文章)

目次

01 专题:大数据安全与隐私计算

  • 凌捷

02 大数据技术在数据安全治理中的应用

程伟, 马成, 凌捷

03 基于多方安全计算的公共数据融合创新模式研究及应用

金加和, 赵程遥, 求昊泽, 刘鹏

04 支持互联互通的隐私计算网关设计与实现

叶剑, 李文

05 基于区块链的感知数据交易隐私保护方案

  • 李云辉, 陈家辉

06 表现性语音合成综述

唐浩彬, 张旭龙, 王健宗, 程宁, 肖京

07 融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督分类算法

  • 曹峰, 李文涛, 骆剑承, 李德玉, 钱宇华, 白鹤翔, 张超

08 基于用户交互体验的品牌数字化传播评估模型

刘英新

09 数据要素价值化发展路径与对策研究

杨云龙, 张亮, 杨旭蕾

10 城市疫情态势发展与动态调控可视分析

王松, 陈仕杰, 李杭霖, 李孝慧, 冯琼芳, 王慧杰

11 基于深度学习的施工安全隐患整改智能推荐系统

刘震, 赵嵩, 杨涛, 蔡太伟

12 数据中台框架与实践

吴信东, 应泽宇, 盛绍静, 蒋婷婷, 卜晨阳, 张赞

13 长短期记忆网络在虚拟电厂数据中心的应用

陈峻, 宁思衡

14 基于图论的产业网络知识图谱挖掘与构建

李振军, 刘祖军, 王鹏, 杨斌, 李大中, 郭钰, 赵华

15 数据资产入表需要一种可计量的技术形态

朱扬勇, 叶雅珍

摘要

‍专题:大数据安全与隐私计算

专题导读

作者:凌捷

摘要:社会发展进入了数字时代,数据被誉为新时代的石油,是企业和个人的宝贵资产。随着数据的不断增长和应用的不断普及,数据安全和隐私保护面临前所未有的挑战,大数据应用面临的数据安全威胁与隐私泄露严重破坏了正常的社会经济秩序,大数据平台抵御安全风险的能力亟须加强。隐私计算可在保护数据本身不对外泄露的前提下实现对数据的分析计算,达到数据“可用不可见”的目的。目前以多方安全计算、联邦学习、可信执行环境等为代表的隐私计算技术研究,彰显了其在充分保护数据和隐私安全的前提下,实现数据价值转化和释放的巨大潜力。

本刊以“大数据安全与隐私计算”为主题进行征文,旨在集中展示大数据安全与隐私计算中的大数据平台攻击检测、行业大数据应用安全、联邦学习中的数据安全与隐私保护、隐私计算与区块链、隐私计算的行业应用场景等方面的最新研究成果。本专题最终录用4篇文章,涵盖了大数据安全治理、数据交易的隐私安全、隐私计算可信网关、安全多方计算技术应用等领域的关键技术。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00001.shtml

大数据技术在数据安全治理中的应用

作者:程伟, 马成, 凌捷

摘要:面对新形势下的数据安全治理挑战,顺应数据安全领域的技术发展趋势,针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题,提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素,并可从多个角度衡量不同含义的权重影响力,识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题,提出一种基于生成对抗网络的用户与实体行为异常检测方法,实验结果表明,所提方法的精确率、召回率和F1值的平均值均优于对比基线模型方法。设计开发了数据安全平台,平台在降低数据安全风险、辅助企业合规建设、促进数据开发利用等方面起到了重要作用,已在多个数据集中管理项目中得到应用,能满足安全场景下的大数据处理需求,具有较好的应用推广价值。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00003.shtml

基于多方安全计算的公共数据融合创新模式研究及应用

作者:金加和, 赵程遥, 求昊泽, 刘鹏

摘要:多方安全计算技术已广泛应用于金融、互联网等领域,用于解决“数据孤岛”难题,然而其在公共数据领域的应用尚不成熟。针对公共数据领域提出了基于多方安全计算的公共数据融合创新模式,开发设计了在保护数据安全前提下利用各主体公共数据联合计算的技术架构。该模式通过技术创新突破制度制约,实现数据价值提升和保障数据安全的兼顾。主要分析了模式中多方安全计算核心系统的3个子层:联合计算子结构层、安全关系代数层和多方安全计算基础算子层。此外,还给出了实现公共数据融合创新模式的通用流程,并对公共数据融合创新模式的应用实例进行了阐述,为助力数字中国建设、畅通数据资源大循环提供新模式的借鉴。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00015.shtml

支持互联互通的隐私计算网关设计与实现

作者:叶剑, 李文

摘要:基于国内外隐私计算发展现状,总结了隐私计算互联互通研究进程。运用系统架构视角,阐述互联互通技术的“应用层、协议层、通信层”三层次实现路径。针对目前互联互通平台计算原理复杂、架构多样化等特点,创新性地提出Adaptation机制互联互通框架。通过关键技术的设计和实现,在保证原有功能实现的基础上,解决了不同架构的兼容问题。通过传统机器学习、横向联邦、纵向联邦具体实验场景,针对数据量、特征分布等维度,验证了Adaptation框架下互联互通可信网关的有效性和合理性。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00028.shtml

基于区块链的感知数据交易隐私保护方案

作者:李云辉, 陈家辉

摘要:感知数据交易能将感知数据转化为经济价值,促进数据的有效利用和共享。为了确保感知数据交易的可靠性和隐私安全,提出了一个基于混洗差分隐私的区块链感知数据交易方案。该方案设置了审计节点进行用户筛选和任务执行,混洗节点进行争议处理和奖励分发,并使用混洗模型下的差分隐私技术对用户的数据进行加噪。此外,还使用加法秘密共享技术划分数据到r个混洗器,以隐藏用户和数据的映射关系。该方案不需要可信的第三方,数据消费者可通过区块链交易平台发布任务并进行广播,进行安全隐私的数据交易。同时,根据隐私放大定理,该方案可获得接近中心化差分隐私的隐私保护效果。最后通过实验验证了方案的可行性,对比相关算法,该方案得到的数据准确性更高。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00039.shtml

研究

表现性语音合成综述

作者:唐浩彬, 张旭龙, 王健宗, 程宁, 肖京

摘要:语音合成是语音、语言和机器学习领域的一个热门研究课题,旨在合成给定文本的可理解和自然的语音,在工业中有广泛的应用。语音合成的目标之一是合成自然的语音,而目前的语音合成在情感、韵律等方面还有很大的改进空间。对表现性语音合成进行了全面的调查,旨在更好地了解当前的研究现状和未来的趋势。对近年来基于情感及韵律的表现性语音合成进行了全面的总结、比较和分析。首先介绍了普通语音合成的传统实现方式及瓶颈;然后引入表现性语音合成并描述表现性语音合成在情感、韵律等方面为语音合成自然化带来的增益;最后对表现性语音合成进行了展望和总结。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00053.shtml

融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督分类算法

作者:曹峰, 李文涛, 骆剑承, 李德玉, 钱宇华, 白鹤翔, 张超

摘要:针对海量的高光谱遥感图像光谱和丰富的空间信息中可用于分类的有标记样本远少于无标记样本的数据特性,提出了一种融合光谱度量标记迁移和Tri-training的高光谱遥感图像半监督光谱-空间分类算法。该算法提出了一种基于光谱度量的标记迁移方法,通过结合迁移标记和Tri-training预测标记进行扩充样本标记预测,提高了扩充样本标记的准确性。同时,该算法基于空间相关性选择扩充样本,综合运用光谱和空间特征提升图像分类的精度。在两个公开的高光谱遥感图像数据集上进行了实验,结果表明该算法优于基于Tri-training算法的高光谱遥感图像的分类性能。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00072.shtml

基于用户交互体验的品牌数字化传播评估模型

作者:刘英新

摘要:伴随着数字经济的快速发展,品牌传播有利于提升数字品牌影响力,助力企业数字转型。基于交互情感评估地标产品品牌传播效果,能够助力县级政府更好地打造地标产品品牌。首先,提出基于交互情感的品牌数字化传播评估模型,发现并解决现有地标产品品牌数字化传播体系化缺失的问题,以系统化动力学机制提升数字品牌影响力;然后以浙江省地标产品为背景,采用微博数据,分析了地标产品品牌传播效果层级模型的可用性。实际应用结果表明,提出的基于交互情感的品牌数字化传播评估模型具备指引地标产品品牌数字化建设的普适性。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00090.shtml

数据要素价值化发展路径与对策研究

作者:杨云龙, 张亮, 杨旭蕾

摘要:基于国内外数据要素市场化的发展情况,总结了国外数据要素价值化发展的路径及特点。概括了我国数据要素市场在交易市场、应用场景等方面的现状,针对目前我国数据要素市场的发展情况,结合我国数据要素市场环境及发展特色,提出了构建中国特色数据要素市场模式的建议,以加快释放数据要素价值。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00100.shtml

城市疫情态势发展与动态调控可视分析

作者:王松, 陈仕杰, 李杭霖, 李孝慧, 冯琼芳, 王慧杰

摘要:为了解决新冠肺炎疫情医疗资源的合理调配问题,以武汉方舱新冠肺炎疫情数据为基础,融合舆情、时空轨迹等多源数据,针对疫情防控搭建了方舱医院动态调控平台。引入水滴图表征方式动态监测方舱医院,采用主题模型融合情感词典提取群众情感特征,并借助WordStream呈现城市舆情发展,提出基于医院负载量的路径规划算法实现合理路线推荐,提供面向群众的科普信息和城市复苏板块以提升抗疫信心。该系统有利于实现人力、物力的合理配置,及时引导群众的情绪动向,关注新政策/决定发布后的舆情变化,减缓患者聚集现象。最后,结合多组案例分析验证了系统的功能性和有效性。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00110.shtml

基于深度学习的施工安全隐患整改智能推荐系统

作者:刘震, 赵嵩, 杨涛, 蔡太伟

摘要:水利工程施工安全隐患治理正向信息化与智能化转型,为了高效地从大量非结构化的施工安全隐患数据中挖掘出有价值的潜在信息,提出了基于深度学习的施工安全隐患整改智能推荐系统。该算法基于词频逆向文档频率算法,提取施工安全隐患的特征词,构建安全隐患关联桑基图,展示施工标段、隐患特征、隐患类型之间的信息流动特征;基于FP-Growth算法挖掘历史数据中的关联规则;结合序列相似度匹配(sequence similarity matching,SSM)算法和Doc2Vec模型,优化案例检索推荐的过程。该算法利用珠江三角洲水资源配置工程2019—2023年记录的80 953条施工安全隐患信息作为数据源。实例验证表明,该算法能够为当前的施工安全隐患匹配出较为准确的整改措施,可有效辅助施工安全管理者排查治理隐患问题。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00124.shtml

应用

数据中台框架与实践

作者:吴信东, 应泽宇, 盛绍静, 蒋婷婷, 卜晨阳, 张赞

摘要:数据中台将一个机构(企业、事业或政府部门)的数据作为战略资产进行管理,是从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化。给出数据中台的定义,提出数据中台参考技术框架,并分别对物理管理、逻辑管理、数据资产管理、数据服务和信息安全管理的组成和技术进行了展开讨论。最后以华谱系统建设为例,介绍面向家谱大数据、结合HAO智能模型的数据中台实现——华谱数据中台。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00137.shtml

长短期记忆网络在虚拟电厂数据中心的应用

作者:陈峻, 宁思衡

摘要:可再生能源发电具有间歇性、随机性和不可控性,为绿色能源的充分利用带来了挑战。虚拟电厂数据中心具有高能耗特性,因此成为可再生能源中间歇性(非调度性)电力的高效吸纳与调控手段。基于此,提出了一种通过时间嵌词编码的长短期记忆(long short-term memory,LSTM)网络对虚拟电厂“源荷”双侧状态进行预测的方法。该方法可实现15分钟级的“电力短缺”主动预警,为容器的暂停和备份创造充分的缓冲时间窗口,结合容器技术实现数据中心的动态能耗管理,从而提升了虚拟电厂数据中心应对电力供需失衡的鲁棒性。这对稳定电网运行、加速绿色清洁能源应用、构建能源生态的服务格局、加速电网数字化转型具有重要的意义。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00160.shtml

基于图论的产业网络知识图谱挖掘与构建

作者:李振军, 刘祖军, 王鹏, 杨斌, 李大中, 郭钰, 赵华

摘要我国是全球产业规模最大、产业覆盖最全的国家,但受多种因素的影响,发现产业链的堵点断点、识别卡点、寻找代替通路、全面优化产业链势在必行。从数据底座构建、核心知识图谱挖掘、兼容传统产业链知识3个方面,阐述了基于图论的产业网络知识图谱的构建过程,以实现产业优化升级与模拟仿真。分析了产业网络知识图谱的应用场景和优势,并给出了其在集成电路行业的应用案例。

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00174.shtml

专栏:专家视点

数据资产入表需要一种可计量的技术形态

作者:朱扬勇, 叶雅珍

原文链接:https://www.infocomm-journal.com/bdr/article/2023/2096-0271/2096-0271-9-6-00184.shtml

联系我们:

Tel: 010-81055490

       010-81055534

       010-81055448

E-mail:[email protected] 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

转载、合作:010-81055307

大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

15449a55ed9b5dd2738776c9b4460207.jpeg

关注《大数据》期刊微信公众号,获取更多内容

猜你喜欢

转载自blog.csdn.net/weixin_45585364/article/details/134797021