• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会

第九届中国计算机学会大数据学术会议论文

来源:太原理工大学学报

行业视野

智能化

类别

25个

关键词

15位

专家

6篇

论文

758IP

点击量

853次

下载量
  • 作者(Author): 王莉

    摘要:<正>在信息技术快速发展的时代,数据已成为重要的生产要素,大数据上升为国家战略。本期本栏目专门刊发了由中国计算机学会CCF主办,CCF大数据专家委员会和中山大学联合承办的第九次全国大数据学术会议推荐的5篇优秀论文,内容涵盖了电力数据挖掘,智慧司法,医学图像分类,推荐系统,实体关系抽取等各方面的内容。反映了当前大数据在各行业的广泛应用,相关成果将为研究人员带来启发。杜清月等的文章"基于帕累托效应视角下的推荐系统多角度公平性",
    免费下载
    太原理工大学学报
    2022年第01期
    144
    87
  • 作者(Author): 杜清月, 黄晓雯, 桑基韬

    摘要:提出了一种从帕累托视角解决推荐系统多角度公平性的方法,通过对抗正则化器消除用户嵌入中的敏感属性信息,采用基于曝光的负采样策略提高推荐系统的准确率,从而达到帕累托最优。并且,基于曝光的负采样策略在一定程度上解决物品曝光偏差的问题,保证了物品角度公平性,实现了用户、物品的多角度公平性。实验结果表明,该方法在保证推荐准确率的同时有效提高了用户和物品角度的公平性。
    免费下载
    太原理工大学学报
    2022年第01期
    140
    108
  • 作者(Author): 许梓涛, 黄炳森, 潘微科, 明仲

    摘要:根据现有的类案推荐方法得到的相似案件,其精确度通常很难满足法官的需求,辅助判案效果有限。为此,提出了一个基于上下文感知的类案匹配和推荐模型(CASCMR).模型为实现端到端高效率的文本匹配与推荐,使用多语义文档表达框架,并通过文本向量预先计算与存储,减少匹配时间,进而提高效率。具体而言,为了更好地对法律长文本进行建模,CASCMR使用BERT对数据进行编码,利用其注意力机制捕获文本长距离依赖信息。同时,考虑法律文本从局部到全局的信息,利用双向LSTM和CNN分别获取文本的上下文信息和局部语义特征,提高法律文本的表征能力,从而提升模型的预测性能。将所提出的模型应用到中国法研杯2019相似案件匹配任务,实验结果显示,与目前最好的方法相比,匹配和推荐精度的提升效果较为明显。
    免费下载
    太原理工大学学报
    2022年第01期
    99
    100
  • 作者(Author): 王红, 吴燕婷

    摘要:针对现有方法中缺乏实体之间潜在的隐性关系挖掘和头实体信息提取不够充分的问题,提出了一种头实体增强的多跳注意力隐性关系联合挖掘模型Multi-Air(multi-hop attention implicit relations joint mining method).该方法首先使用BERT(bidirectional encoder representations from transformers)模型对输入句子进行特征编码并通过Sigmoid函数预测出头实体的位置,然后通过双向门控循环单元(bidirectional gated recurrent unit, Bi-GRU)对头实体进行特征增强。在充分利用头实体的深层信息后,输出多关系尾实体可能的开始和结束位置,最后将输出的尾实体又作为下一跳的头实体,迭代执行多跳尾实体预测并利用注意力权重动态调节学习到的多跳实体和关系特征进而实现文本中潜在的隐含关系三元组挖掘。Multi-Air模型在公开数据集NYT和民航突发事件数据集上都取得了较好的提升。
    免费下载
    太原理工大学学报
    2022年第01期
    124
    90
  • 作者(Author): 谢娟英, 夏琴

    摘要:新型冠状病毒(COVID-19)感染者胸部X射线(Chest X-ray, CXR)图像不同于正常人,是诊断的有效依据。在ResNeXt模型基础上,加入交叉堆叠的通道注意力模块和残差注意力模块以及提出的维度降解模块,提出了针对COVID-19 CXR图像分类的COVID-SERA-NeXt模型。对公开访问的基准数据集COVIDx进行图像分类,实验结果显示,提出的COVID-SERA-NeXt模型在多项指标上优于其基础模型ResNeXt,其中准确率、宏召回率分别提高到96.11%、95.46%.经过ChestX-ray8医学图像预训练的COVID-SERA-NeXt模型对COVIDx数据集的分类性能更进一步提升。
    免费下载
    太原理工大学学报
    2022年第01期
    146
    326
  • 作者(Author): 陈曦, 宋纯贺, 王天然

    摘要:针对国内外在220 V和380 V供电电压的低压地区电力消耗的研究较少,很难探究实时线损的问题。对供电、用电、线损、窃电4个方面进行数据分析,建立统计模型与聚类模型,探索电力消费和窃电的规律。利用时间序列分析、频谱分析、概率密度函数、互补累积分布函数的统计模型进行分析。结果表明窃电用户用电周期是正常用户的2倍,窃电用户的日均用电量大于正常用户,窃电用户在台区线损率大于40%时数量激增,线损率到达65%时数量放缓,可以优先排查此区间的台区。基于时间序列相似度度量和k-means聚类相结合的聚类模型,将566个台区365维的时间序列聚类得到6类不同的台区线损率模式,并通过核密度估计对比了他们的分布差别,可以帮助快速排查出重点窃电台区并监测线损率改善的情况。
    免费下载
    太原理工大学学报
    2022年第01期
    105
    142

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联