×

注意!页面内容来自https://www.ecice06.com/CN/highlights,本站不储存任何内容,为了更好的阅读体验进行在线解析,若有广告出现,请及时反馈。若您觉得侵犯了您的利益,请通知我们进行删除,然后访问 原网页

< type="text/css"> .tabbox { width: 400px; margin-top: 5px; margin-bottom: 5px } .tabmenu { width: 400px; height: 28px; border-left: 1px solid #CCC; border-top: 1px solid #ccc; } .tabmenu ul { margin: 0; padding: 0; list--type: none; } .tabmenu li { text-align: center; float: left; display: block; width: 99px; overflow: hidden; background-color: #f1f1f1; line-height: 27px; border-right: #ccc 1px solid; border-bottom: #ccc 1px solid; display: inline; } .tabmenu .cli { text-align: center; float: left; display: block; width: 99px; overflow: hidden; background-color: #fff; line-height: 27px; border-right: #ccc 1px solid; border-bottom: #fff 1px solid; display: inline; cursor: pointer; color: #c30000; font-weight: bold } #tabcontent { width: 399px; background-color: #fff; border-left: #CCC 1px solid; border-right: #CCC 1px solid; border-bottom: #CCC 1px solid; height: 65px; } #tabcontent ul { margin: 0; padding: 5px; list--type: none; } #tabcontent .hidden { display: none; } img[src*='.traceImg']{ width:44px; height:22px; }
作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

热点文章

< type="text/css"> .black_overlay{ display: none; position: absolute; top: 0%; left: 0%; width: 100%; height: 100%; background-color: #D8D8D8; z-index:1001; -moz-opacity: 0.8; opacity:.80; filter: alpha(opacity=80); } .waiting_content { display: none; width: 50%; padding: 16px; border: 1px solid orange; background-color: white; z-index:1002; overflow: auto; position:absolute;/**绝对定位**/ left:50%;/**左边50%**/ top:50%;/**顶部50%**/ margin-top:-50px;/**上移-50%**/ margin-left:-100px;/**左移-50%**/ } .hiden { display: none; }
Please wait a minute...
下载引用文件后,可以用常见的文献管理软件打开和编辑,包括: BibTexEndNoteProCiteRefWorksand Reference Manager.

选择文件类型/文献管理软件名称

选择包含的内容

  • 全选
    |
  • 热点与综述
    廖牛语田沄李岩松薛海峰杜长坤张国华
    计算机工程. 202551(12): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0253230
    摘要 (377) PDF全文 (294) HTML (38)   可视化   收藏

    近年来以GPT、LLaMA、Qwen、DeepSeek等为代表的大模型在自然语言处理、计算机视觉及多模态等领域取得了突破性进展。然而受限于其推理机制、参数规模和固有的训练数据知识等因素这些模型在处理复杂任务、解答专业领域问题及生成时效性内容时常出现答案不准确乃至事实性偏差幻觉等问题严重制约了其在高可靠性场景中的应用。为突破上述能力瓶颈工具学习范式应运而生并迅速成为研究热点其核心旨在使大模型理解并使用外部工具以完成特定任务。通过调用数据库、搜索引擎、数学工具等外部工具大模型能够超越自身参数化知识提升其推理、决策和执行能力缓解幻觉问题。本文系统综述了大模型工具学习的发展脉络与技术进展剖析了工具对大模型能力的扩展梳理了从上下文学习到微调训练的工具调用机制进而探讨了工具调用性能优化、自适应工具生成等关键问题分析了大模型工具调用的测评方法最后总结了当前工具学习面临的挑战并对大模型工具学习未来发展方向进行展望。

  • 人工智能与模式识别
    袁英华金英然高赟
    计算机工程. 202551(12): 96-108. https://doi.org/10.19678/j.issn.1000-3428.0069871
    摘要 (325) PDF全文 (529) HTML (37)   可视化   收藏

    孪生跟踪网络是主流的目标跟踪框架之一,其包括骨干网络、融合网络和定位网络3个模块。对于融合网络模块,Transformer是较新且有效的融合网络实现方法。Transformer的编码器和解码器中使用自注意力机制对卷积神经网络(CNN)特征进行增强。然而,自注意力机制仅能从空间维度进行特征增强,未考虑从通道维度进行特征增强。为了使得Transformer的自注意力网络同时对特征的空间维度和通道维度进行增强,为目标定位网络提供准确的相关性信息,提出一种基于双维度特征增强的Transformer跟踪器,对Transformer融合网络进行改进。首先,采取骨干网络的第三和第四阶段特征作为输入;然后,在Transformer编码器与解码器的自注意力模块中,通过CAE-Net网络进行通道维度的特征增强,用于增强通道上的重要性,通过SAE-Net网络实现两阶段特征的加权融合与线性变换,获取自注意力因子QKV;最后,通过自注意力运算实现空间维度特征增强。在5个主流的公开基准数据集上进行实验,结果表明,改进后的Transformer特征融合模块可以用极小的速度代价提升跟踪器的跟踪性能。

  • 移动互联与通信技术
    王华华黄烨霞李玲王嘉程
    计算机工程. 202551(12): 255-267. https://doi.org/10.19678/j.issn.1000-3428.0069877
    摘要 (295) PDF全文 (849) HTML (6)   可视化   收藏

    在无蜂窝网络环境下实施联邦学习(FL)时用户调度和资源分配策略对优化系统时间开销、提升用户可达速率以及加速FL收敛速率至关重要。为解决资源分配不均的问题设计一种联合用户调度、CPU处理频率和功率分配的优化方案。通过最大化系统的最小用户速率来实现资源的公平分配并提升FL性能。联合优化问题被分解为用户调度和功率分配两个子问题。在用户调度方面设计基于k-means聚类的贪婪调度算法以综合评估用户的信道状态和数据"价值"并将用户划分为不同的群组。随后针对每个群组的资源占用情况为组内用户制定个性化的CPU处理频率分配方案。最后通过在各群组中独立执行用户调度实现高效且精准的用户选择并通过提前分组有效降低用户选择的复杂度。在功率分配方面引入基于二分法的功率分配算法(BM-PA)。该算法不仅考虑了用户间的公平性还针对资源受限用户进行了优先处理以确保其能够获得更优质的资源分配。BM-PA算法通过低复杂度的迭代优化过程实现了功率分配的快速收敛并在保证系统性能的同时显著提升了资源的利用效率。合理的用户调度策略是功率分配子问题获得最优解的基础采用交替迭代的方法允许在每个子问题中独立进行优化同时考虑到另一个子问题的解。这种相互依赖的关系通过多轮迭代优化过程确保功率资源被合理地分配给那些最需要或最有可能有效利用它们的用户从而使系统整体性能得到提升实现联合优化求解显著提升系统整体性能。仿真实验结果表明与基准算法相比所提算法在下行可达速率方面最佳平均提升幅度高达103.34%在上行可达速率方面最佳提升幅度达到102.78%。此外相较于基准算法还能平均节省67.44%的FL任务训练时间特别是在FL学习模型精度达到90%时所提算法的时间开销最小。

  • 图形图像处理
    王国明贾代旺
    计算机工程. 202551(12): 294-303. https://doi.org/10.19678/j.issn.1000-3428.0070027
    摘要 (694) PDF全文 (301) HTML (31)   可视化   收藏

    深度学习在目标检测领域的广泛应用显著提升了对大中目标的检测能力。然而针对小目标检测由于其固有的尺度小、背景复杂等挑战传统的目标检测算法常常会出现漏检、误检。为了提高小目标检测的精度对YOLOv8模型进行研究。首先将主干部分的卷积模块替换为RFAConv模块增强了模型对于复杂图像的处理能力; 其次在Neck部分引入混合局部通道注意力(MLCA)机制能够在保持计算效率的同时帮助模型更高效地融合不同层次的特征; 再次将YOLOv8的Detect头替换为Detect_FASFF头以解决不同特征尺度间的一致性问题并增强模型对小目标的检测能力; 最后将完全交并比(CIoU)损失函数替换为Focaler-IoU损失函数使模型更关注难以精确定位的小目标。实验结果显示: 改进后的模型在小目标稀疏的FloW-Img数据集上[email protected]提高了4.8百分点[email protected]:0.95提高了3.0百分点; 在小目标密度高的VisDrone2019数据集上[email protected]提升了5.9百分点[email protected]:0.95提高了4.0百分点。同时还在低空数据集AU-AIR以及行人密集检测数据集WiderPerson上做了泛化对比实验。结果表明优化后的模型相比较原模型在小目标检测精度上有显著提升且适用范围更广。

  • 开发研究与工程应用
    朱亚州杜平川柴志雷
    计算机工程. 202551(12): 337-345. https://doi.org/10.19678/j.issn.1000-3428.0069437
    摘要 (368) PDF全文 (170) HTML (3)   可视化   收藏

    Kubernetes作为容器编排的主流工具可支持自动部署、服务发现以及负载均衡且具有高可用性、高效能的特点。然而Kubernetes采用的最佳适应算法或最小负载法等调度策略忽略了节点的异构性和性能的差异性。此外Kubernetes工具仅考虑CPU资源和内存资源且预先设置统一权重机制容易导致负载不均衡、性能下降以及无法满足精细化调度等问题。针对这些问题提出了一种基于多维度资源的异构任务调度(A-KCSS)算法该算法基于集群的异构计算资源增加磁盘输入/输出(I/O)、网络I/O负载以及GPU资源作为评价指标进行过滤和筛选更全面地考虑了node的异构性。此外引入一种基于多维度资源因素的权重计算模型依据待调度任务的资源需求计算待调度任务各维度资源因素的权重值结合集群node的实时资源利用率计算出每一个node的评分依据评分进行优先级排序并选择优先级最高的node进行调度。通过实验在Kubernetes集群上测试了A-KCSS算法的性能该算法与Kubernetes默认的调度算法以及Kubernetes容器调度(KCSS)算法相比平均响应时间分别减少10%和4%吞吐量分别提高30%和15%可用性分别提高40%和30%负载均衡性分别提高23%和18%集群的整体性能得到提高。

  • 热点与综述
    孙丽郡孟繁军徐行健
    计算机工程. 202551(11): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0069543
    摘要 (581) PDF全文 (4496) HTML (43)   可视化   收藏

    在教育信息化持续推进的背景下构建精准且高效的课程知识图谱已成为推动教育个性化发展的关键任务之一。课程知识图谱作为一种结构化的知识表示模型旨在揭示课程内容与学习目标之间的复杂关联关系以优化教育资源配置并为学习者定制个性化的学习路径。围绕课程知识图谱的构建技术进行探讨首先阐述知识图谱、教育知识图谱、课程知识图谱的基本概念及其之间的内在联系与显著差异; 其次深入剖析课程知识图谱构建的关键技术涵盖课程本体设计、实体抽取、关系抽取等方面并对其发展历程、特点及局限性展开详细分析与总结; 再次探讨课程知识图谱在学习资源推荐、学习者画像建模和多模态课程知识图谱构建等场景中的应用价值; 最后聚焦于课程知识图谱在构建过程中所面临的难题如数据多样性和异构性、知识图谱质量难以评估以及多课程交叉融合不足等从深度学习、大语言模型(LLM)等前沿技术的角度出发对未来的发展趋势进行展望。

  • 热点与综述
    邸钦渤陈劭力时良仁
    计算机工程. 202551(11): 35-44. https://doi.org/10.19678/j.issn.1000-3428.0069780
    摘要 (476) PDF全文 (598) HTML (22)   可视化   收藏

    随着多变量时序数据在各行业中的广泛应用开发有效的异常检测方法对于保障系统的稳定运行和安全性变得极为关键由于多变量时序数据内在的复杂性和动态变化特性对异常检测算法提出了更高的要求。针对现有异常检测方法在处理含有复杂变量关系的高维数据时存在效率不足的问题提出一种基于图神经网络(GNN)与扩散模型的多变量时序数据异常检测算法GRD。通过节点嵌入和图结构学习GRD算法能有效地捕捉和表示变量间的复杂关系并通过门控循环单元(GRU)和去噪扩散概率模型(DDPM)进一步提取特征实现了对异常数据的高精度检测。在以往的实验评估中大多数算法在评分前会采用点调整(PA)评估协议该协议会严重高估算法的检测能力。为了更准确地评估算法性能采用新的评估协议和评价指标。实验结果表明GRD算法在3个公开数据集上的F1@k指标分别是0.741 4、0.801 7、0.767 1性能优于现有方法。特别是在高维数据处理方面GRD算法展现出显著优势证明了其在现实场景的异常检测应用中的实用性和鲁棒性。

  • 热点与综述
    俞继涛程路维韩伟力
    计算机工程. 202551(11): 22-34. https://doi.org/10.19678/j.issn.1000-3428.0069794
    摘要 (181) PDF全文 (91) HTML (11)   可视化   收藏

    口令泄露事件常常涉及用户口令和用户身份信息的泄露。由于用户在多个网络服务中习惯于重用口令这使得攻击者能够通过调整泄露的口令来针对性地攻击用户的账户称为凭证调整攻击。通过分析大规模的泄露口令和相应的用户身份信息发现用户创建口令的策略往往与用户身份信息相关联。然而目前关于凭证调整攻击的研究在预测用户调整口令的策略时仅依据泄露口令的结构而忽略了泄露的用户身份信息。为了提升凭证调整攻击的准确性设计了一种基于用户身份信息的凭证调整攻击优化方法。在预处理阶段从用户身份信息中提取用户名信息和地域信息按照地域统计用户选择不同口令创建策略的概率。在训练阶段结合地域信息学习用户在泄露口令上采取的字符级编辑操作。在口令生成阶段设计了一种综合字符级编辑操作、结构级编辑操作和用户名信息的口令生成方法。实验结果表明在猜测次数为103的攻击中该方法的命中率和现有最优的方法(PassBERT)相比最高提升了41.8%说明利用用户身份信息能扩大凭证调整攻击对口令安全带来的威胁。

  • 热点与综述
    肖志鹏何书峰田春岐
    计算机工程. 202551(11): 54-62. https://doi.org/10.19678/j.issn.1000-3428.0069761
    摘要 (161) PDF全文 (82) HTML (10)   可视化   收藏

    针对面部情绪识别过程中存在的难以捕获有效特征信息、无法使关键面部信息占据更主要地位的问题提出一种基于UniRepLKNet的面部情绪识别网络。为了更精确地提取面部情绪特征设计一个掩码极化自注意力模块其结合了U-Net和极化自注意力机制。这一模块能够深入挖掘通道和空间之间的依赖关系并通过多尺度特征融合策略强化人脸局部关键信息在情绪识别过程中的影响力。同时对大核卷积神经网络(CNN)UniRepLKNet进行优化提出EmoRepLKNet神经网络结构。在EmoRepLKNet中利用掩码极化自注意力模块使网络专注于提取面部情绪识别的关键信息并结合大核CNN感受野广的特点实现对面部情绪的有效识别。实验结果表明在面部情绪识别数据集FER2013上该方法达到了76.20%的准确率不仅超越了现有的对比模型而且相较于UniRepLKNet也显著提高了面部情绪识别的准确率。同时在RAF-DB数据集的单标签部分进行实验所提方法取得了89.67%的准确率。

  • 网络空间安全
    凌海凌捷
    计算机工程. 202551(11): 162-170. https://doi.org/10.19678/j.issn.1000-3428.0069983
    摘要 (180) PDF全文 (144) HTML (4)   可视化   收藏

    对抗样本可以在不知道黑盒模型内部的结构以及参数时利用代理模型进行迁移性攻击现有研究针对黑盒模型的定向目标攻击可迁移性都比较弱。提出一种基于特征融合增强图像定向目标攻击可迁移性的方法。通过模型集成攻击得到对抗样本以现有对抗样本的梯度方向为基准利用从原图提取出的干净特征作为干扰来微调现有的对抗样本以提高定向目标攻击的可迁移性。对于模型集成根据每个模型对整体对抗目标的贡献大小引入梯度自适应模块为减少不同模型之间的梯度差异提出梯度滤波器来同步控制梯度方向通过特征融合模块混合原图的干净特征对现有对抗样本的梯度方向进行微调以缓解过度关注特定特征的问题。在ImageNet-Compatible数据集上的对比实验结果表明所提方法对非鲁棒性训练模型相较CFM(Clean Feature Mixup)方法平均攻击成功率提升了7.7百分点对鲁棒性训练模型以及Tansformer模型相较CFM方法平均攻击成功率提升了5.3百分点验证了方法的有效性。

  • 热点与综述
    路悦周翔宇张世周梁国强邢颖慧程德张艳宁
    计算机工程. 202551(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575
    摘要 (521) PDF全文 (529) HTML (49)   可视化   收藏

    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来预训练模型的发展为持续学习提供了新的研究方向有望进一步提高性能表现。首先分析了现有基于预训练的持续学习方法按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后分析了持续学习方法存在的主要挑战归纳了各类持续学习方法的适用场景和局限性在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后对基于预训练的持续学习方法的研究趋势进行展望。

  • 热点与综述
    彭龙高元钧刘晓东余杰
    计算机工程. 202551(10): 37-52. https://doi.org/10.19678/j.issn.1000-3428.0069708
    摘要 (263) PDF全文 (619) HTML (30)   可视化   收藏

    算力和网络技术的发展使得机器人逐渐向小型化、群体化、智能化方向发展,部署在硬件设备上的机器人软件需要集成从底层设备驱动和控制到上层运动规划和推理等多种软件模块,软件架构日益复杂。群体机器人通信编程框架从机器人软件标准化、模块化、平台化等目标出发,减轻了机器人通信编程的复杂度。分析总结机器人软硬件架构发展趋势,得出群体机器人系统是由各类计算节点、执行器、传感器等硬件设备通过有线或无线网络互联构成的多域异构分布式系统。这种硬件设备的异构性使得软件模块难以通过单一框架集成。归纳分析现有群体机器人系统通信编程框架在易用性、可移植性等方面的特点,从编程模型、异构硬件平台支持、组件间通信机制、编程语言等核心能力方面对通信编程框架进行对比,并在实时性、虚拟化、组件编排和容错支持等扩展能力方面展望通信编程框架的发展趋势,聚焦于以元操作系统(OS)为底座的下一代编程框架,以期构建人机物泛在融合的群体机器人软件架构。

  • 热点与综述
    李亚康李健芳胡鹏陈娟王声翔齐法制陈刚
    计算机工程. 202551(10): 53-70. https://doi.org/10.19678/j.issn.1000-3428.0069651
    摘要 (193) PDF全文 (192) HTML (14)   可视化   收藏

    探讨人工智能(AI)技术在中子散射实验全生命周期中的应用,旨在梳理AI技术如何革新中子散射实验装置、数据采集、数据处理等关键环节。首先介绍中子散射技术的基本原理和实验流程,然后重点讨论AI技术在中子散射实验中的多方面应用,包括实验基础设施的优化设计、数据采集与成像的数据预处理以及中子衍射、中子反射、非弹性中子散射(INS)等实验样品表征方面的应用,展示AI技术在提高实验的智能化水平、加快数据处理速度、提升数据分析的准确性和可靠性等方面的重要性。此外,对AI技术在中子散射实验中的未来应用进行深入讨论,指出随着多模态学习、可解释模型、大语言模型、AI-Ready数据库等技术的不断进步和应用领域的拓展,AI技术有望为中子散射实验带来革命性的变革,为揭示复杂物质系统的微观结构和性质开辟新的途径。

  • 人工智能与模式识别
    张红李峰马彦宏姬文宣郑启鹏
    计算机工程. 202551(10): 140-149. https://doi.org/10.19678/j.issn.1000-3428.0069489
    摘要 (229) PDF全文 (223) HTML (9)   可视化   收藏

    准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。基于多种特征选择机制筛选输入特征,增强对光伏数据特征的表征能力;利用粗粒度构造模块和PAM优化Transformer编码器,在多尺度上捕获光伏功率的长期时间依赖特征;利用光伏功率日出日落效应约束机制和TCN优化Transformer解码器,增强光伏功率的短期变化特征,以更好地捕捉其短期变化模式。在澳大利亚Sanyo数据集上进行实验,结果表明,Solarformer能够有效提高光伏功率的预测精度,相比DLinear模型,其均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)分别降低了约7.45%、6.99%和14.10%。

  • 图形图像处理
    肖剑黄博程鸿亮胡欣袁晔
    计算机工程. 202551(10): 319-326. https://doi.org/10.19678/j.issn.1000-3428.0069182
    摘要 (200) PDF全文 (168) HTML (9)   可视化   收藏

    传统的人脸识别系统在最终人脸分类问题上,通常借助各种仿生学算法与支持向量机(SVM)相结合组成相应的人脸识别模型。该方法通过算法的迭代选取最优SVM参数,然而这种策略在人脸识别方法上存在分类精度较低、训练时间较长且容易陷入局部最优解的问题。针对上述问题,提出利用改进人工蜂鸟算法(AHA)优化SVM的人脸识别算法。首先通过引入Tent映射的混沌序列改进人工蜂鸟算法,使蜂鸟种群初始化更为均匀,避免算法陷入局部最优解;其次在SVM进行人脸识别的方法中引入改进AHA,通过设定一定的迭代次数,选择用来优化SVM的最优相关参数,达到提高人脸识别准确率的目的。实验结果表明,将改进的人工蜂鸟算法与灰狼优化(GWO)算法、麻雀搜索算法(SSA)、鲸鱼优化算法(WOA)进行对比,改进AHA在基准函数的求解上具有更快的收敛速度同时在ORL人脸数据库进行人脸识别实验,将改进AHA与SVM相结合,相比于将GWO、SSA和WOA与SVM相结合,在人脸识别的准确率指标方面,改进AHA结合SVM方案具有更高的准确率和召回率,并且模型推理速度更快。

  • AI算力赋能的车载边缘计算
    秦敏浩孙未未
    计算机工程. 202551(9): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0069416
    摘要 (333) PDF全文 (735) HTML (50)   可视化   收藏

    交通信号灯控制对缓解交通拥堵、提升城市通勤效率有着重要作用。近年来,以实时交通数据为输入的基于深度强化学习的信号灯控制算法已取得突破性进展。然而,现实场景中的交通数据通常伴随着数据失真。传统方法在修复失真数据后使用强化学习算法控制信号灯,但一方面信号灯相位的动态性给失真修复引入了额外不确定性,另一方面失真修复难以与深度强化学习框架相结合来提升性能。为此,提出基于隐状态预测的失真交通信号灯路口控制模型HCRL。HCRL模型由编码子模型、控制子模型和编码预测子模型组成,通过引入信号灯路口的隐状态表示机制,更好地适应深度强化学习框架,有效表达信号灯路口的控制状态,并使用特殊的迁移训练方法避免数据失真对控制子模型的干扰。使用两个真实数据集验证了数据失真对智能信号灯控制算法的影响。实验结果表明,HCRL模型在所有失真场景和失真率下均优于基于失真修复的信号灯控制模型,并在与其他基线模型的对比中表现出了对数据失真更强的鲁棒性。

  • 图形图像处理
    王舒梦徐慧英朱信忠黄晓宋杰李毅
    计算机工程. 202551(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353
    摘要 (1006) PDF全文 (433) HTML (57)   可视化   收藏

    在无人机(UAV)航拍中目标通常是密集分布、特征不明显的小目标且物体尺度变化较大。因此目标检测容易出现漏检和误检的问题。为了解决这些问题提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层将浅层和深层的特征图进行拼接以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv)替换Neck网络中的C2f(Concatenation with Fusion)实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network)以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制使网络更好地关注有用的通道减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数将边界框的形状差异也考虑在内以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8nPECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度([email protected])提高了3.5%交并比为0.5∶0.95的平均精度([email protected]∶0.95)提高了3.7%模型参数量减少了约25.7%检测速度提高了约65.2%。综上所述PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

  • AI算力赋能的车载边缘计算
    崔萌萌施静燕项昊龙
    计算机工程. 202551(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836
    摘要 (429) PDF全文 (195) HTML (32)   可视化   收藏

    为了进一步优化车载服务的服务质量(QoS),移动边缘计算(MEC)被深度整合于车联网(IoV)中,旨在为车辆提供地理位置较近的计算资源,降低任务处理延迟和能耗。然而,传统的MEC服务器部署主要依赖于地面基站(BS),这不仅导致高昂的部署成本,而且限制其覆盖范围,难以确保为所有车辆提供无间断服务。为了应对上述挑战,空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU),为车辆用户提供更为灵活的计算资源,进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构,构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型,并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP),基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比,实验结果表明,DVETOM在提升车辆用户QoS的同时,在降低系统时延方面优于现有方法3.45%~23.7%,在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述,DVETOM有效地优化了IoV中的车载边缘任务卸载,为IoV用户提供了更高效、更节能的服务解决方案,展现了其在智能交通系统领域的广泛应用潜力。

  • AI算力赋能的车载边缘计算
    朱思远李佳圣邹丹平何迪郁文贤
    计算机工程. 202551(9): 14-24. https://doi.org/10.19678/j.issn.1000-3428.0069534
    摘要 (281) PDF全文 (200) HTML (41)   可视化   收藏

    非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先,引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息,避免了后续匹配造成的计算资源浪费。其次,设计混合数据增强策略,将缓存的伪标签图像与无标签图像混合输入学生模型,以增强模型对新数据的泛化能力,并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制,并且更好地保持了目标框的一致性,避免了计算一致性损失。实验结果表明,MAM算法相比其他全监督学习和半监督学习算法更具优越性,在自建的非结构化道路缺陷数据集Defect上,在标注比例为10%、20%和30%的场景下,MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点,在自建的非结构化道路坑洼数据集Pothole上,在标注比例为15%和30%的场景下,MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。

  • 人工智能与模式识别
    翟志鹏曹阳沈琴琴施佺
    计算机工程. 202551(9): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0069439
    摘要 (313) PDF全文 (121) HTML (19)   可视化   收藏

    精准的交通流预测是实现智能交通系统的关键前提,对加强系统的仿真和控制、提高管理者的决策等方面具有重要意义。针对大多数现有的图卷积网络(GCN)模型忽略交通流数据的动态时空变化、对节点信息使用不足导致时空相关性提取不充分的问题,提出一种基于多时空图融合与动态注意力的交通流预测模型。首先,以不同的卷积单元提取交通流数据中多时域状态下的时间特征;然后,构建多时空图体现节点在空间分布中的动态变化趋势和异质性,并结合GCN提取空间特征;最后,利用多头自注意力机制分别对时空特征进行分析与融合,输出预测结果。在两个实际的公共数据集PeMS04和PeMS08上进行实验分析,并与基于注意力的时空图卷积网络(ASTGCN)、多视角的时空Transformer网络(MVSTT)和动态时空感知图神经网络(DSTAGNN)等基于时空图卷积网络的基准模型对比,结果表明所提模型在平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)指标上分别平均降低了7.10%、7.22%和6.47%,具有较强的适应性和鲁棒性。

  • 热点与综述
    赵楷胡煜环闫俊桥毕雪华张琳琳
    计算机工程. 202551(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (474) PDF全文 (277) HTML (65)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 人工智能与模式识别
    王帅史艳翠
    计算机工程. 202551(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (465) PDF全文 (259) HTML (54)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用通过设计有效的自监督信号增强模型在稀疏数据场景下的表征能力。首先针对随机数据增强易引入数据噪声的问题提出融合用户偏好的个性化数据增强方法通过用户评分引导增强过程同时对长、短序列使用不同的增强方法组合生成符合用户偏好的增强序列; 其次为了缓解训练中出现的数据特征学习不平衡问题设计一种混合增强训练法在训练前期通过随机选择增强方法生成增强序列提高模型的性能和泛化能力在训练后期选择与原始序列相似度较高的增强序列使模型全面学习用户的实际偏好和行为模式; 最后将传统的序列预测目标与SSL目标相结合推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证结果表明相较于基线模型中的最优结果所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%NDCG@5指标分别提升了11.40%、3.50%和2.16%上述实验结果验证了该方法的合理性和有效性。

  • 开发研究与工程应用
    高庆鑫刘聪张在贵郭娜苏轩曾庆田
    计算机工程. 202551(8): 396-405. https://doi.org/10.19678/j.issn.1000-3428.0069301
    摘要 (246) PDF全文 (69) HTML (17)   可视化   收藏

    作为组织数字化转型的关键技术,机器人流程自动化(RPA)近年来得到了学术界和产业界的广泛关注。成功部署RPA的关键是确定哪些活动应该自动化。然而,现有的部署策略缺乏对流程的分析,导致RPA机器人的部署错误,造成资源的浪费。此外,已有的基于流程挖掘的RPA机器人部署方法过度依赖于专家的领域知识,缺乏通用性。针对上述问题,将流程挖掘与RPA相结合,提出一种基于流程挖掘的RPA机器人优化部署方法。首先提出从事件日志中挖掘全局流程模型的方法,挖掘得到含有时间信息的时间Petri网模型;其次通过关键流程路径识别方法得到关键流程路径;最后提出RPA机器人优化部署策略,结合时间和成本约束确定RPA机器人的最佳部署结点集合。该方法已在开源流程挖掘工具平台ProM中实现,并将其与已有的4种部署方法进行时间效率提升实验比较。实验结果表明,与其他部署方法相比,该方法在不依赖于专家领域知识的前提下,流程的性能提升率为22%~41%,RPA机器人的部署正确率达到1,验证了该方法的通用性和准确性。

  • 图形图像处理
    郝宏达罗健旭
    计算机工程. 202551(8): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0069269
    摘要 (278) PDF全文 (103) HTML (21)   可视化   收藏

    深度学习逐渐被广泛应用于医学图像分割领域,基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果,而忽略了切片中小目标特征信息的丢失或欠分割问题,使模型分割性能受到限制。针对这一问题,提出一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构,编码器采用ResNet 50,与解码器之间设置跳跃连接。注意力机制由1个双重注意力模块(DAM)和1个小目标提取(SOC)模块的并联结构实现,从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息,还可以通过注意力权重重建的方式保留小目标的特征信息,提高了模型的分割性能。在CHAOS数据集上的实验结果表明,DASC-Net在灵敏度、Jaccard相似系数、正类预测值(PPV)、Dice相似系数和平均交并比(mIoU)上分别可以达到83.72%、75.79%、87.75%、85.63%和77.60%,在Synapse数据集上的Dice相似系数和95%豪斯多夫距离(HD95)指标数值分别为82.44%和21.25 mm。DASC-Net在2个数据集上的表现均优于其他分割网络,具有可靠、准确的分割性能。

  • 图形图像处理
    苗茹李祎周珂张俨娜常然然孟更
    计算机工程. 202551(8): 292-304. https://doi.org/10.19678/j.issn.1000-3428.0068856
    摘要 (265) PDF全文 (172) HTML (25)   可视化   收藏

    针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融合浅层和高层语义信息,进一步加强特征融合效果;最后,在分类和回归分支中,添加动态权重机制,促进网络在训练过程中更关注高质量候选框,提高目标定位和分类的精确度。在RSOD数据集上的实验结果表明,所提模型相较于Faster R-CNN模型每秒浮点运算次数(FLOPs)大幅度减少,并且模型的[email protected] ∶0.95提高了10.7百分点,平均召回率提高10.6百分点。相较于其他主流检测模型,所提模型在降低漏检率的同时,取得了更高的精度,能显著提高复杂背景下遥感图像的检测精度。

  • 热点与综述
    张锦陈铸陈照云时洋陈冠军
    计算机工程. 202551(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (424) PDF全文 (704) HTML (44)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 人工智能与模式识别
    彭菊红张弛高谦张光明谈栋华赵明俊
    计算机工程. 202551(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (886) PDF全文 (486) HTML (81)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此提出一种改进的YOLOv8算法YOLOv8n-MDC。首先在骨干网络中加入多尺度交叉融合网络(MCN)通过在特征层之间建立更紧密的连接促进信息的均匀传递减少跨层特征融合时的语义信息损失从而增强模型对钢材缺陷的感知能力; 其次在模块中引入可变形卷积自适应地改变卷积核的形状与位置从而更灵活地捕捉不规则缺陷的边缘特征减少信息丢失提升检测的准确性; 最后加入坐标注意力(CA)机制将位置信息嵌入到通道中解决了位置信息丢失的问题使模型能够更精确地感知缺陷的位置及其形态特征从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明YOLOv8n-MDC算法的[email protected]达到了81.0%相比原基准网络提升了4.2百分点该算法收敛速度较快、精度较高更能满足实际工业生产的要求。

  • 图形图像处理
    刘春霞孟吉星潘理虎龚大立
    计算机工程. 202551(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (400) PDF全文 (120) HTML (23)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度([email protected])分别达到78.6%、95.5%和73.3%,优于其他先进模型在遥感小目标检测中表现出良好的性能。

  • 图形图像处理
    沙宇洋陆京涛杜浩凡翟小兵孟维宇廉旭罗刚李克峰
    计算机工程. 202551(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (336) PDF全文 (218) HTML (24)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 人工智能与模式识别
    宋杰徐慧英朱信忠黄晓陈晨王泽宇
    计算机工程. 202551(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (361) PDF全文 (170) HTML (27)   可视化   收藏

    在室内场景下受角度、光线变化等因素的影响导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块优化了核空间的4个维度以增强特征提取能力而且有效减少了计算负担。同时为了捕获更细粒度的特征在颈部网络中引入高效多尺度注意力(EMA)模块进一步聚合像素级特征提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想使模型对难分类样本给予更多关注优化模型整体性能。实验结果表明相比YOLOv8nOEF-YOLO跌倒检测算法在[email protected]指标上提升了1.5百分点[email protected]∶0.95提升1.4百分点参数量和计算量分别为3.1×106和6.5 GFLOPs在图形处理器(GPU)上FPS提高了44在提高精度检测跌倒事件的同时兼顾了低算力场景下的部署要求。

  • 热点与综述
    庞鑫葛凤培李艳玲
    计算机工程. 202551(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (387) PDF全文 (260) HTML (40)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 网络空间安全
    姚玉鹏魏立斐张蕾
    计算机工程. 202551(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (506) PDF全文 (133) HTML (29)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    秦永旺张洋胡星刘胜李少青
    计算机工程. 202551(6): 29-37. https://doi.org/10.19678/j.issn.1000-3428.0068882
    摘要 (255) PDF全文 (160) HTML (21)   可视化   收藏

    随着集成电路设计复杂度的急剧攀升,其呈现出全球化和分工化的发展趋势,需要越来越多的第三方知识产权(IP)核提供者的参与。第三方IP核的广泛使用会引入硬件木马,为了检测和评估第三方IP核是否存在硬件木马以及硬件木马的功能,迫切需要探索出一种可行的IP核硬件安全评估方法,数字电路模块的功能识别作为硬件木马分析的基础研究引起了人们的广泛关注。将电路功能检测任务转换为多分类任务,结合电路结构和图数据结构的特点,提出一种基于图注意力网络(GAT)的门级电路功能分类和检测方法。首先,针对门级网表缺乏功能识别数据集的问题,通过搜集具有代表性的寄存器传输级(RTL)代码并综合生成门级网表,构建一个规模适当、种类多样的门级电路数据集。然后,为了提取和处理电路特征信息,开发了一种基于文本识别的软件工具,将复杂的电路互连结构映射为结构简单的JSON(JavaScript Object Notation)格式,便于神经网络处理。最后,采用图注意力神经网络,利用构建的门级网表数据集对多分类器进行训练,经过训练后的多分类器能够对未知门级电路进行分类和识别。实验结果表明,该多分类器通过对自建数据集中6类共计3 000多条网表数据进行学习后,最终对6类645个网表能够达到90%的分类正确率。

  • 网络空间安全
    曹蓓赵奎
    计算机工程. 202551(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158
    摘要 (375) PDF全文 (137) HTML (11)   可视化   收藏

    在信息爆炸且真伪难辨的网络环境中,精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征,以捕捉文本中不同层次的语义信息,但简单拼接这些特征会导致信息冗余和噪声,限制检测的准确性和泛化性,目前缺乏有效的深度融合方法。此外,现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题,提出一种基于双重情感和多特征融合的虚假新闻检测(DEMF-FND)模型。首先,通过情感分析提取新闻和评论的情感特征,并利用相似度计算引入反映两者关联性的情感差异特征,构建双重情感特征集。然后,采用基于多头注意力的融合机制,将双向长短期记忆网络(BiLSTM)与设计的集成静态-动态嵌入的卷积神经网络(ISDE-CNN)所捕捉的新闻文本全局与局部语义特征进行深度融合。最终,将双重情感特征集与经深度融合得到的语义特征拼接融合,输入由全连接层构成的分类层,以判断新闻的真假。实验结果显示,该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法,在准确率上分别实现了2.5、2.3和5.5百分点的提升,凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

  • 热点与综述
    刘凯任洪逸李蓥季怡刘纯平
    计算机工程. 202551(6): 49-56. https://doi.org/10.19678/j.issn.1000-3428.0068910
    摘要 (207) PDF全文 (123) HTML (16)   可视化   收藏

    医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前,Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了图像的局部特征所包含的医学信息与跨模态间的交互作用,从而限制了图像内容理解。针对以上问题,提出一种交叉模态注意力特征增强的Med-VQA模型(CMAG-MVQA)。基于U-Net编码有效增强图像局部特征,从交叉模态协同角度提出选择引导注意力方法,为单模态表征引入其他模态的交互信息,同时利用自注意力机制进一步增强选择引导注意力的图像表征。在VQA-RAD医学问答数据集上的消融与对比实验表明,所提方法在Med-VQA任务上有良好的表现,相比于现有同类方法,其在特征表征上性能得到较好改善。

  • 空天地一体化算力网络
    李斌山慧敏
    计算机工程. 202551(5): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0069423
    摘要 (270) PDF全文 (271) HTML (27)   可视化   收藏

    针对算力网络中终端用户计算能力不足及边缘节点算力分配不均的问题提出一种以激励机制为基础的无人机(UAV)协同终端直连(D2D)边缘计算方案。首先在满足计算资源、发射功率、计算资源单价等限制条件下通过联合优化任务卸载比例、计算资源限制量、UAV飞行轨迹、UAV和用户的发射功率以及计算资源出售单价提出一个系统收益最大化问题。其次利用近端策略优化(PPO)确定用户卸载和购买策略通过在多个时间步骤上迭代优化策略最大化累积奖励并引入剪切项以限制策略更新的幅度以确保求解算法的稳定性。仿真结果显示基于PPO的系统收益最大化算法相比基线算法具有更好的收敛性并能够有效提升系统总收益。

  • 人工智能与模式识别
    黄昆齐肇建王娟敏胡倩胡伟超皮建勇
    计算机工程. 202551(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (526) PDF全文 (334) HTML (47)   可视化   收藏

    密集行人检测是公共智能监控的关键技术其采用目标检测方法对视频中的行人位置和数量进行检测进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先在主干网络使用nostride-Conv-SPD模块增强对图像小目标特征等细粒度信息的提取能力; 其次在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合以提高在小目标情况下的检测效果。实验结果表明所提模型在CrowdHuman数据集上[email protected][email protected]∶0.95分别取得了84.3%和58.2%的检测效果与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%与原YOLOv8n相比提高了1.1和1.5百分点。

  • 开发研究与工程应用
    周思瑜徐慧英朱信忠黄晓盛轲曹雨淇陈晨
    计算机工程. 202551(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (413) PDF全文 (139) HTML (18)   可视化   收藏

    手机屏幕作为人机交互的主窗口已成为影响用户体验和终端整体性能的重要因素。因此市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头并结合SeaAttention注意力模块有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块在保证精度的同时降低模型的参数量提高瑕疵检测的速度与效率。实验结果表明在北京大学手机屏幕表面瑕疵数据集中相较于YOLOv8nPGS-YOLO算法的[email protected]提升了2.5百分点[email protected]∶0.95提升了2.2百分点在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测还能对小瑕疵保持一定的准确度。此外检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时参数量仅为2.0×106小于YOLOv8n满足工业场景对手机屏幕瑕疵检测的需求。

  • 开发研究与工程应用
    陈梓延王晓龙何迪安国成
    计算机工程. 202551(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (382) PDF全文 (128) HTML (24)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高无法在交通智能设备上良好运行而轻量化的车辆检测模型精度普遍较低不适用于实际任务。为此提出一种改进YOLOv8的轻量化车辆检测网络将主干网络替换为计算量和内存访问更小的FasterNet网络并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN)简化特征融合过程。同时引入一种融合注意力机制的动态检测头实现检测头和注意力的无冗余结合; 此外针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后为尽量减小模型对边缘设备的算力需求进行基于幅值的层自适应稀疏化剪枝进一步压缩模型大小。实验结果表明提出的改进模型相较于原模型YOLOv8s在精度上升1.5百分点的情况下参数量降低78.9%计算量下降67.4%模型尺寸降低77.8%达到了比较优秀的轻量化效果具有很强的实用性。

  • 空天地一体化算力网络
    王克文张维庭孙童
    计算机工程. 202551(5): 52-61. https://doi.org/10.19678/j.issn.1000-3428.0069471
    摘要 (293) PDF全文 (209) HTML (11)   可视化   收藏

    为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求聚焦于采用分层控制和人工智能技术的方法设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域分别部署域控制器负责本地域的资源管理同时通过卫星和无人机的覆盖范围进行地面区域划分确保地面区域能够得到有效的服务保障以实现高效的数据传输和任务处理。为了优化空天地算力网络资源利用率引入多智能体强化学习算法对不同场景下产生的计算任务进行实时处理将每个域控制器视为具备任务调度和资源分配能力的智能体在满足时延和能耗的约束下通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明该机制能够有效提高资源利用率和缩短任务响应时间。

  • 上海市计算机学会40周年庆
    齐凤林沈佳杰王茂异张凯王新
    计算机工程. 202551(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222
    摘要 (798) PDF全文 (889) HTML (81)   可视化   收藏

    人工智能(AI)的快速发展已为众多领域赋能对社会带来了深远的影响其出色的处理效果、广泛的适用性以及强大的扩展能力为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发探讨了两者的发展历程及其关联在国内外高校信息化建设中尽管各自对AI的关注点有所不同但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域详尽归纳并分析了AI赋能高校信息化中的典型应用案例展现了其如何有效提升教育质量与管理效率同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题列举了常见的应对策略如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析进一步展望了AI在高校信息化中的未来优化方向强调技术创新与伦理规范并重倡导建立跨学科合作机制共同推动AI技术在高校信息化领域的健康、可持续发展。

  • 人工智能与模式识别
    周翰祺方东旭张宁波孙文生
    计算机工程. 202551(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100
    摘要 (571) PDF全文 (750) HTML (81)   可视化   收藏

    无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而目前已有的多目标跟踪算法多用于单无人机多目标跟踪而单无人机的视角通常具有一定的局限性当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式利用多架无人机同时跟踪目标弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

  • 开发研究与工程应用
    汤静雯赖惠成王同官
    计算机工程. 202551(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897
    摘要 (454) PDF全文 (228) HTML (30)   可视化   收藏

    智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生然而面对遮挡和远距离行人的情景现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM)使得网络更好地学习行人特征和捕捉行人特点在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块重新整合后的检测层增强了网络对小目标的识别能力有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络即双向扩张残差-特征金字塔网络(BDR-FPN)利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征缓解网络对遮挡行人不敏感问题。实验结果表明在CityPersons数据集上进行训练和验证相比原算法YOLOv8ME-YOLO算法的AP50提高了5.6百分点模型参数量减少了41%模型大小压缩了40%在TinyPerson数据集上验证算法的有效性和泛化性AP50提高了4.1百分点AP50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时有效提高了检测精度在智慧社区场景中有较好的应用价值。

  • 开发研究与工程应用
    张博强陈新明冯天培吴兰刘宁宁孙朋
    计算机工程. 202551(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338
    摘要 (494) PDF全文 (330) HTML (16)   可视化   收藏

    在限定场景内无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离导致发生车辆与障碍物发生剐蹭的问题提出基于混合A*算法和修正RS曲线融合的路径规划。首先将提出的基于KD-Tree算法的距离代价函数加入到混合A*算法的代价函数中。其次改变混合A*算法的扩展策略根据车辆周围环境动态改变节点扩展距离实现节点的动态扩展提高算法的节点搜索效率。最后改进混合A*算法的RS曲线生成机制使生成的RS曲线直线部分与周围障碍物边界保持平行从而符合厂区内道路行驶要求通过对局部路径进行平滑处理在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性从而提高生成路径的质量。实验结果表明与传统算法相比提出算法的搜索时间缩短了38.06%最大曲率减少了25.2%路径到障碍物的最近距离增加了51.3%有效提高了混合A*算法生成路径的质量并能较好地在限定场景中运行。

  • 人工智能与模式识别
    孙子文钱立志袁广林杨传栋凌冲
    计算机工程. 202551(4): 158-168. https://doi.org/10.19678/j.issn.1000-3428.0068892
    摘要 (317) PDF全文 (182) HTML (11)   可视化   收藏

    基于Transformer的目标跟踪方法广泛应用在计算机视觉领域并取得了优异的效果。但是由于在实际跟踪任务中受目标变换、目标遮挡、光照变化以及目标快速运动等因素的影响导致目标信息发生变化现有方法对目标模板变化信息利用不足限制了跟踪性能的提高。为此通过附加一条动态模板更新分支反映目标最新的外观和运动状态提出一种基于实时动态模板更新的Transformer目标跟踪方法TransTRDT。该分支通过模板质量评分头对模板是否更新进行判断当判定可以进行更新时随后将初始模板、前一帧动态模板以及裁剪后的最新预测结果传入动态模板更新网络中更新动态模板通过获取更可靠的模板从而实现更准确的目标跟踪。在公共数据集上的实验结果表明TransTRDT在GOT-10k、LaSOT以及TrackingNet上的跟踪性能优于SwinTrack和StarK等算法在OTB100中的跟踪成功率为71.9%跟踪速度为36.82帧/s达到目前行业的领先水平。

  • 热点与综述
    次天钊杨昊周游谢长生吴非
    计算机工程. 202551(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 (513) PDF全文 (797) HTML (65)   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中存储子系统是关键的组成部分对用户体验有重要影响。不同于服务器场景安卓手机存储系统的设计需要考虑诸多独特因素如资源受限、成本敏感、前台应用优先等学术界对此已经展开大量研究。针对该方向研究现状进行总结分析首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题对现有工作进行分类介绍并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结并讨论了未来潜在的研究方向。

  • 热点与综述
    蒋淇淇张亮彭凌祺阚海斌
    计算机工程. 202551(3): 24-33. https://doi.org/10.19678/j.issn.1000-3428.0069378
    摘要 (284) PDF全文 (364) HTML (36)   可视化   收藏

    大数据时代的到来与信息种类的丰富对数据的受控共享提出了更加细粒度的要求基于属性的分布式加密(DABE)可以支持多个参与方之间的数据细粒度访问控制。时兴的物联网数据共享场景对于数据的跨域访问、透明可信度与可控性都有着更高需求传统的基于属性的加密(ABE)方案的计算开销对于资源有限的小型设备造成了一定的负担。为了解决上述问题提出一种基于区块链的可问责可验证外包分层属性加密方案。该方案支持数据跨域流通通过区块链技术保障数据流通的透明度与可信性引入可验证凭证(VC)概念解决用户身份认证问题借助外包思想将复杂的加解密过程造成的负担分散给外包计算节点最终利用分层思想实现更加细粒度的数据访问控制。安全性分析表明该方案可以抵抗选择明文攻击。通过使用Docker模拟算力有限的小型设备进行实验结果表明该方案相较现有方案具有更低的计算开销在属性个数为30时各个算法的计算开销不超过2.5 s平均开销为1 s适用于资源受限的应用场景。

  • 人工智能与模式识别
    戴康佳徐慧英朱信忠李悉钰黄晓陈国强张志雄
    计算机工程. 202551(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 (393) PDF全文 (309) HTML (33)   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的然而在现实场景中往往存在动态物体这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差甚至出现跟踪丢失的情况。针对上述问题基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征根据获取的语义信息利用Z-score和对极几何算法剔除动态特征以改进SLAM在动态场景中的表现。此外鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明相比ORB-SLAM2YGL-SLAM系统准确率提升超过90%对比其他动态SLAMYGL-SLAM也具有较高的准确度和鲁棒性。

  • 图形图像处理
    赵宏宋馥荣李文改
    计算机工程. 202551(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481
    摘要 (453) PDF全文 (390) HTML (26)   可视化   收藏

    对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展但该方法生成的扰动稀疏性不足且幅度较大导致对抗样本的真实性较低。为解决这一问题基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征限制扰动生成位置SE残差判别器指导生成器避免生成无关扰动。同时在SE注意力生成器的损失函数中加入以l2范数为基准的边界损失以限制扰动的幅度从而提高对抗样本的真实性。实验结果表明在白盒攻击场景下SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小并且在不同目标模型上均取得了更好的攻击效果说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

  • 体系结构与软件技术
    张明郭文康王海峰
    计算机工程. 202551(3): 197-207. https://doi.org/10.19678/j.issn.1000-3428.0068477
    摘要 (296) PDF全文 (230) HTML (15)   可视化   收藏

    图形处理器(GPU)异构集群中处理大规模动态图时GPU计算资源未被充分利用并且面向GPU的图划分方法存在局限性导致出现性能瓶颈。为提高图计算系统性能提出一种中央处理器(CPU)/GPU分布式异构图计算系统引擎(DH-Engine)用于提升异构处理器的计算性能。首先提出新的异构图分割算法该分割算法以流式图划分为核心通过贪心策略调整顶点位置进而实现计算节点之间、CPU/GPU之间的动态负载均衡。在初始图划分时基于最多邻居顶点分配图顶点在迭代时基于最少连接边动态调整顶点位置。其次设计GPU异构计算模型通过CPU/GPU功能并行的方式实现协同计算。CPU与GPU并行执行图算法提高CPU核心的利用率进而提升图计算效率。实验以图算法PageRank、CC(Connected Components)、SSSP(Single-Source Shortest Path)与k-core为例将DH-Engine与其他图计算系统展开对比。与未考虑异构计算的图引擎相比DH-Engine能更好地平衡各节点计算负载以及计算节点内部的异构处理器之间的负载通过缩短局部时延来提高整体的计算速度。实验结果表明DH-Engine的CPU/GPU协同度趋于1。相较于其他图计算系统DH-Engine异构计算的加速比达到5倍可以提供更好的图异构计算方案。