beat·365(中国)-官方网站

beat365 > 研究生教学 > 正文

快速导航

beat365信息技术研究生论坛（二十四）

时间：2022年07月01日 17:15点击数：

beat365

信息技术研究生论坛

场次一、

时间：2022年7月4日（星期一）8:00-12:00

地点：beat365516

报告题目一：图像联合分类与超分辨率技术研究

报告人：高小强

报告简介：低分辨率(Low Resolution, LR)图像的分类因其嘈杂的表示和有限的信息而臭名昭著。现有方法主要通过在LR数据集上训练精心设计的架构或通过直接使用图像调整算法来解决这一挑战。然而，在LR图像的情况下，这些方法的性能改进通常是有限的甚至微不足道的。图像的超分辨率网络就是要先设计一个网络结构，通过利用特征域先验，从现有的特征检测器骨干中提取出来，指导高分辨率图像重建，而不再是使用峰值信噪比和结构相似性作为重建的指导。在本实验中，将超分辨率技术和分类算法联合实现低分辨率图像的高效分类，利用超分辨率技术将LR图像的表示提升为“超分辨率”表示，这种方法赋予的特征类似于高分辨率(High Resolution, HR)图像的特征，因此对图像分类更具辨别力和代表性。

报告题目二：双环辅助MZI滤波器研究

报告人：赖明彬

报告简介：随着密集波分复用（DWDM）技术的快速发展，以微环谐振器为核心设计的光电子器件得到国内外研究者的广泛关注，以微环谐振器为核心期间相继研发出光电开关、光波导滤波器、密集波分复用器等潜在商业价值的光学器件，在全光通信网络和集成光学领域具有广阔的应用前景。报告介绍了基于MZI滤波器、基于MRRs滤波器以及微环辅助MZI滤波器，分析他们的优缺点，并提出双环辅助MZI滤波器结构，从数学模型和物理模型两个角度分析其性能，与基于MZI滤波器和基于MRRs滤波器进行对比总结其优势之处。并对双环辅助MZI滤波器的下一步发展进行展望。

报告题目三：基于深度学习的暗光图像增强方法介绍

报告人：黄梦源

报告简介：近年来，随着硬件条件的改善，深度学习得以兴起，应用在许多的领域上面来，都得到很好的效果，诸如图像分类、目标检测等计算机高层视觉任务和暗光增强、图像超分辨率等计算机低层视觉任务，深度学习在这些任务上都取得了许多的成果。在暗光条件下拍摄的图像通常能见度较差，而暗光图像增强(LLIE)旨在提高在低照度环境下捕获的图像的感知或可解释性。报告将介绍基于深度学习的暗光图像增强方法的发展和该领域的研究对图像质量的提高等相关工作提供的帮助。

报告题目四：基于深度感知和时空失真分析的立体视频重定向质量客观评价算法

报告人：卢铭胜

报告简介：介绍3D视频重定向质量客观评价问题的理论基础、研究难点、国内外研究现状、发展和应用，对3D视频重定向质量评价方法进行研究，提出一种基于深度感知和时空失真分析的立体视频重定向质量客观评价算法，衡量了时间和空间失真的同时，考虑深度信息失真，并加权融合时空指标和深度指标，获得一种3D重定向视频的整体客观质量分数。

报告题目五：图像联合超分辨率与目标检测技术研究

报告人：覃庆炮

报告简介：目标检测技术是高层计算机视觉领域中重要而实用的研究课题，其旨在从图像中获取其中包含的物体的类别和位置信息。尽管目标检测技术取得引人瞩目的进步，但其对低分辨率图像的检测效果远不尽人意。一种解决方法是在目标检测之前采用超分辨率技术提升低分辨率图像的分辨率。然而，一方面，当前超分辨率技术的目的是重建出主观质量舒适，纹理细节丰富的高分辨率图像，对低分辨率图像的检测效果提升有限；另一方面，现有的大多基于卷积神经网络的超分辨率算法，网络尺寸大，复杂度较高，不仅难以在实际应用中部署，而且与目标检测模型级联时在一定程度上影响了检测速度。同时现有的目标检测算法也大都只是采用领域适应的方法解决图像分辨率不足的问题，并没有探索如何有效地利用底层视觉任务模型来提升检测精度。因此，本文提出了一种面向目标检测的轻量级超分辨率网络以及一种基于域适应的联合超分辨率与目标检测算法，从而有效提升低分辨率图像中的目标检测精度。

报告题目六：基于内容的立体图像重定向方法研究

报告人：黄悦铭

报告简介：图像重定向方法可分为两大类，传统重定向方法以及基于内容的重定向方法。传统重定向方法直接对图像进行分辨率调整直至满足设备要求，忽视了不同图像存在的结构内容差异性，所以存在较大的技术缺陷。而基于内容的图像重定向方法能够在保存图像重要区域内容的条件下对图像进行分辨率调整。由于立体图像具有的视差、景深等特性，为了达到最佳显示效果，需同时减少视觉失真以及视差失真。若直接将平面图像重定向算法应用于立体图像中，则会破坏左右视图中的匹配关系，造成严重的视差失真。因此，对立体图像进行重定向操作时应结合立体图像的特性。研究如何在避免视觉失真、视差失真、保持深度的情况下自适应地调整立体图像大小以适应不同的终端设备并获取优质显示效果的立体图像重定向算法变得越来越重要，也成为当前数字图像处理算法领域的一个研究热点。

报告题目七：基于显著区域形变和深度感相似度的3D图像重定向质量评价方法

报告人：罗媛婷

报告简介：随着数字多媒体技术的迅猛发展，数字图像/视频已逐渐从平面走向了立体，在不同终端设备的显示和播放仍然面临着分辨率和宽高比需要自适应调整的问题。近年来，人们提出了各种3D图像重定向方法，但对视觉质量评价的研究很少。而现有评价方法在对显著性物体的整体形变的衡量、以及深度感相似度的衡量上仍存在不足。针对上述两个问题，设计两个相关的衡量指标：首先对于重要物体的整体形变进行衡量，在基于块的ARS指标上进行创新，从重要物体整体出发，度量几何形变；其次，通过建立人眼感知的坐标系，衡量重要物体在三维空间中的位置，得出原始图像与重定向图像的相对位置，并以此作为客观评价的依据；最后，对不同立体重定向图像采用分类评价等策略来实现评价算法性能的有效提升，为SIR质量的客观评价提供新的理论和方法支持，同时也为改善SIR方法性能奠定基础。

报告题目八：基于深度保留的3D视频重定向变形算法研究

报告人：蔡凌徽

报告简介：首先介绍基于变形warping算法的视频重定向的相关背景和课题来源。变形算法的基本思想是根据图像或者视频不同区域的显著度进行非均匀缩放，将变形分布在不容易引起人们注意的区域，以此保护视频的显著内容。深度保留是从人眼3D视觉舒适度的角度，对观众的3D体验给予最大的保护。该方法在空间、时间以及深度三大约束中权衡利弊，给予深度更大的保护，同时保留另外两项适当的约束。报告详细介绍了该方法在3D视频重定向中的整个流程，并且介绍该方法中对于三大约束的自适应权衡流程。通过与传统的均匀缩放、letterboxing等方法相比，该方法以更优秀的主观体验脱颖而出。

场次二、

报告题目：字典学习在非侵入式负荷分解的应用

报告人：蒙源

时间：2022年7月7日 17:30-19:30

地点：beat365601教室

报告简介：

能量分解是将整栋建筑的总能量分离成单个电器所消耗的能量。这是一个单通道(唯一的通道是智能电表)盲源(不同电器)分离的问题。近年来，基于字典学习的方法已经显示出解决分解问题的希望。通常的方法是为每个设备学习一个字典，并在分解时将其作为盲源分离的基础。此次汇报将介绍使用字典学习的方式来解决负荷分解问题。

报告题目：基于机组组合的电力调度系统设计

报告人：覃庆鸿

时间：2022年7月7日 17:30-19:30

地点：beat365601教室

报告简介：介绍机组组合的相关概念，以及运用机组组合模型设计一个可供用户操作使用的web电力调度系统。

报告题目：Lipschitz常数在神经网络中的应用

报告人：张庆

时间：2022年7月7日 17:30-19:30

地点：beat365601教室

报告简介：神经网络模型的正则化是一个特别困难的挑战。目前最有效的方法是启发式的方法。相比之下，从线性模型改编而来的正则化方法，如l2惩罚项，并不如启发式方法有效，因此，开发一种良好且有效的神经网络正则化方法是很有必要的。根据这样的一种思路，即当函数变化的速度很慢时，这些函数可视为简单函数，因此我们可以通过控制网络的Lipschitz常数，来对神经网络模型施加一种有效的控制手段。

报告题目：机组组合问题的多阶段自适应鲁棒优化

报告人：任宇晨

时间：2022年7月7日 17:30-19:30

地点：beat365601教室

报告简介：针对一些电力系统关键的日常运行问题，在节点净电力负荷不确定的情况下的机组组合问题，提出了一个多阶段适应性强的优化模型。并且为了处理大规模电力系统，我们探索了简易仿射规则并且设计了一种基于约束生成的解决方法。

场次三、

时间：2022年7月4日（星期一）8:00-12:00

地点：beat365516教室

报告题目一：基于卷积神经网络的联合去噪、去马赛克和超分辨率网络

报告人：银梦雨

报告简介：在目前的图像复原问题中，去噪、去马赛克和超分是三个很重要的任务。大部分数码相机拍摄到的图片通常以拜尔模式（Bayer Pattern）呈现，即每个像素仅记录单一颜色，需要根据每个像素周围的颜色来恢复它原来的值，得到真实的全彩图像）的滤镜采集色彩阵列，而且由于机器和环境的原因还存在一定的噪声和分辨率限制。因此，完成去噪（DN）、去马赛克（DM）和超分（SR）这些底层任务，对应用于随后的高层任务（如目标检测和分类问题）发挥着举足轻重的作用。

报告题目二：基于图像序列识别的端到端可训练神经网络

报告人：陈凯

报告简介：基于图像的序列识别一直是计算机视觉中长期存在的研究课题。在本文中，我们研究了场景文本识别的问题，这是基于图像的序列识别中最重要和最具挑战性的任务之一。我们一种新颖的神经网络架构，集成了特征提取，序列建模和转换的统一框架。在标准基准上的实验，包括IIIT-5K，街景文本和ICDAR数据集，证明了所提出的算法优于现有技术的优越性。此外，该算法在基于图像的乐谱识别任务中表现良好，显然验证了它的通用性。

报告题目三：低光照图像增强算法设计

报告人：韩冯刚

报告简介：低光照图像增强一个富有挑战性的计算机视觉任务，现有的方法难以同时处理图像中的亮度、对比度、伪影和噪声等多个问题。本次报告对一个基于深度学习的低光照图像增强模型——多分支低光增强网络进行了研究。其核心思想在于通过卷积神经网络从输入的低光图像中提取不同层级的特征，然后对提取到的特征进行增强，最后将增强的结果进行融合产生一张正常光照的图像。主观和客观两方面的实验结果证明了该多分支低光增强网络能够对低光照图像进行亮度的提升及噪声抑制。

报告题目四：基于知识蒸馏的卷积神经网络压缩

报告人：李健泽

报告简介：随着训练可用数据量的增长与计算平台处理能力的增强，卷积神经网络(CNN)能够完成越来越复杂的任务，在计算机视觉，自然语言处理等人工智能领域取得重大的突破。然而，这些深度模型具有庞大的参数规模，与此相伴的可畏的计算开销与内存需求使其在计算能力受限平台（例如移动嵌入式设备）的部署中遇到了巨大的困难与挑战。因此，如何在不影响深度学习模型性能的情况下进行模型压缩与加速成为研究热点。针对教室模型与学生模型进行设计并采用知识蒸馏的方法进行压缩，实验最后使学生网络的效果得到了进一步提升。

报告题目五：暗光条件下的联合图像增强与目标检测

报告人：韦新杰

报告简介：目标检测是从一幅图像中获取其中包含的物体的类别和位置信息，是目前高层次计算机视觉领域中的最基本并最具挑战性的问题之一。在暗光条件下采集的图像会出现包括低对比度和强噪声等多种退化问题。现有的目标检测技术大都只适用于高质量图像，而对低质量图像如低亮度和低分辨率图像的检测效果却不太好。我们提出了一种具有鲁棒性的亮度增强网络和目标检测网络的级联网络结构，具体来说，给定一幅包含有待检测目标的低亮度图像作为整个级联网络的输入图像，首先应用增强网络，然后将亮度增强后的图像输入到目标检测网络进行检测任务，最后输出目标检测结果。将亮度增强网络与检测网络联合，大大提升了模型的检测性能。

报告题目六：面向图像分类的图像超分辨率技术研究

报告人：袁梓健

报告简介：图像分类是图像信息领域内的主流研究热点，目前主要分类训练的都是高清的真实图像，若图像的分辨率过低，会使得分类精度下降。现有的方法主要通过在低分辨率数据集上训练精心设计的体系结构或以简单的方式使用图像调整算法来解决这一挑战，这些方法的性能改进通常是有限的。设计一种更加针对高层任务的超分辨率网络，提升其训练和测试的速度及性能。充分利用两者的相关性，网络以端到端的方式通过多损失函数进行优化，为多任务设计一个有效的网络结构，突出超分辨率图像以进行精确识别。

报告题目七：基于生成对抗网络的知识蒸馏算法研究

报告人：崔振雷

报告简介：知识蒸馏从充分发掘神经网络潜力出发，旨在实现使用层级浅、结构简单的神经网络发挥良好的性能，使得获得的小模型可以应用在资源能力受限的移动嵌入式设备当中。当学生网络比教师网络小很多时，强迫学生网络精确模拟教师网络是很困难的，而生成对抗网络有助于保持输出分布的多模态性质。因此，本文研究了一种基于生成对抗网络的知识蒸馏，提供了知识蒸馏的一种全新的思路，通过使用判别器和学生网络交叉迭代训练使得学生网络不断向教师网络靠近，该方法不仅可以实现端到端的训练，而且解决了人工调参带来的误差和麻烦，训练效果较好。

报告题目八：多信道无线网络动态频谱接入深度多用户强化学习

报告人：王怡

报告简介：在多信道无线网络中网络效用最大化的动态频谱访问问题。由于大的状态空间和状态的部分可观测性，获得频谱接入问题的最优解通常需要大量的计算，开发了一种基于深度多用户强化学习的分布式动态频谱访问算法。目标是找到一种多用户策略，该策略以分布式方式最大化某个网络效用，而无需用户之间的在线协调或消息交换。在每个时隙，每个用户将其当前状态映射到基于经过训练的deep-Q网络的频谱访问操作，用于最大化目标函数。

场次四、

时间 2022年7月7日17：30-19：30

地点：计电学院601

报告题目一：基于拉格朗日松弛算法的UAV路径规划研究

报告人：贾哲松

报告简介：根据最新的研究，即在无人机额定功率的前提下，无人机有两个特殊的速度，（最大航程速度）以及（最大量耐力速度），经证实: < < ，且三者都与无人机自身重量有关，这就为我们研究变速（Variable speed）的TSP（VSTSP）提供了可能性。现有的研究方法，模拟退火算法，遗传算法，蚁群算法等都是针对速度不变的TSP，经相关文献的阅读和学习，我们可以寄希望于使用拉格朗日松弛法来探寻优化策略。

场次五、

时间：2022年7月4日（周一）上午8--12点

地点：beat365807B教室

报告题目一：链路故障下的无线传感器网络虚拟骨干重构研究

报告人：何峰

报告简介：无线传感器网络的虚拟主干是一个连通的子网，它使得子网外的每个节点在子网中都有一个邻居结点。在理论分析中，无线传感器网络通常被建模为磁盘图，而其虚拟骨干则相应地建模为磁盘图中的连通控制集。由于外部因素和内部设置，在高速通信的大规模无线传感器网络中，一些节点或链路的故障是不可避免的。这意味着设计对节点和链路故障具有鲁棒性的容错CDS是有价值的。在本次报告中，我们介绍了链路故障下的无线网络中虚拟骨干的重构。

报告题目二：新型负载均衡的数据收集树的构建

报告人：曾伟健

报告简介：首先介绍无线网络虚拟骨干的背景和课题来源。虚拟骨干网络常常用于承担整个无线传感器网络的路由工作，能够有效的降低整个网络的能量开销，从而延长网络寿命。Directional Virtual Backbone Based Data Aggregation Scheme(DVBDAS)是一种新型的虚拟骨干，该骨干是一棵树。同时每个节点向外广播信号的方向是可选择的，不需要每个方向都发送信号。可以进一步的降低能量消耗延长网络寿命。

报告题目三：基于灭点检测的高速公路监控场景下视觉测速方法

报告人：梁书伟

报告简介：室内场景三维重建是计算机领域中的重要研究课题。快速、精确、低成本的室内场景三维重建在虚拟现实、室内定位、机器人导航等方面有着广泛应用。常见的基于图像的三维重建技术通常使用多张图像作为输入，相比普通图像，全景图像有着更大的视野，能够减少数据量和数据复杂度，但图像中也存在较大畸变。针对全景图像的特点，结合深度学习技术提出一种多视图室内场景重建方法。

报告题目四：基于弱标签的半监督语义分割研究
报告人：肖毅烽

报告简介：通过伪标签进行自训练是一种利用无标签数据进行半监督学习的简单方法。为了减少伪标签方法中错误或者低质量的伪标签使用，本研究提出一个伪标签筛选方法来进行伪标签的筛选。同时为了缓解伪标签方法中重新训练的学生模型和教师模型之间的耦合问题，本研究通过扰动的方式使重新训练的学生模型能够从受干扰的数据中学习到更多不同的知识，从而提高学生模型重新训练的效果。

报告题目五：基于经验小波变换的微震信号识别研究

报告人：刘冠霆

报告简介：首先介绍微震信号识别的相关背景和课题来源。对于矿山等地的微震信号，可能包括的类型主要有岩石破裂信号和爆破信号等，微震信号识别的最终目的是识别出有用的岩石破裂信号，在岩石破裂信号的识别中，改进的经验小波变换被用于信号特征的提取，针对传统经验小波变换的频谱过切分问题，采一种平滑化频谱曲线的改进方法，以得到更合理的频谱切分，从而得到信号的时频特征，将信号的时频特征等构建成向量作为信号的特征向量，训练出集成学习模型，模型可给微震监测提供参考。

报告题目六：基于卷积神经网络的混凝土裂缝结构自动检测方法

报告人：郑力文

报告简介：建筑物在其生命周期内，由于长期的超载和环境影响，容易过度老化。特别是老化的混凝土建筑，正面临着使用的退化，这可能会危及它们的安全和使用能力，而裂缝是最常见的缺陷之一，因此对于观测到的裂缝结构正确地识别和解释裂缝形态是至关重要的。为了解决上述问题，本文分析了混凝土结构不同的结构裂缝和非结构裂缝形态特征及其产生的原因，并将裂缝形态分为两类。在裂纹模式分类的基础上，提出了一种基于计算机视觉算法的裂纹模式自动检测方法。

场次六、

时间：2022年7月9日（星期六）15:00-17:00

地点：北京农科大厦A820 腾讯会议号893375879

会议密码638653

报告题目一：一种实时高精度的小交通标志识别方法

报告人：丁智欢

报告简介：随着计算机视觉和人工智能的快速发展，交通标志识别系统已应用于高级驾驶员辅助系统和自动驾驶系统，帮助驾驶员和自动驾驶车辆准确捕获重要的道路信息。然而，在实际应用中，小型交通标志识别仍然具有挑战性。(1)对于模型的主干，我们引入高级特征来构造更好的探测头；(2)对于模型的颈部，利用RFB块来获取特征图的上下文信息；(3)对于头部模型，我们对检测器头部网格进行细化，以实现对小型交通标志的更精确检测；(4)对于输入，我们提出了一种随机消除注意的数据处理方法，该方法可以增加困难样本，增强模型的鲁棒性。在具有挑战性的数据集TT100K上的实际实验表明，与现有技术相比，我们的方法可以实现显著的性能改进。此外，它是一种实时的方法，在高级驾驶辅助系统和自动驾驶系统中显示出巨大的潜在应用。

报告题目二：黄瓜温室环境下的气候预测调控模型研究

报告人：黄天艺

报告简介：介绍温室环境调控研究现状。研究针对目前的研究中缺乏考虑温室环境中噪声传感器数据引入的不确定度、温室内外环境的随机性引起的预测不确定度等问题以及深度学习模型相关的模型不确定度等问题，为了量化这些不确定性来源对于温室环境预测的综合影响，提出利用LASSO回归筛选出与温室湿度变化强相关的环境因子，在减少环境因子输入数量的情况下，利用bayesian_LSTM网络，将神经网络的权重由常数设置为概率分布，捕捉温室环境因子的数据变化规律和不确定性，利用dropout技术捕捉模型感知不确定性，与LSTM等模型进行对比实验，验证所提出模型的预测精度后，将模型部署至树莓派。

报告题目三：对GRU模型语言建模的改进

报告人：王奥

报告简介：介绍语言建模的GRU模型，对比传统语言建模模型与引入额外门控的GRU明显对比，针对传统特征提取模型的循环神经网络提出改进意见，提出一种当前信息和前一时刻状态在进入神经元之前进行多轮交互的方法，并对基于改进GRU模型的方法的下一步发展进行展望。

报告题目四：基于深度学习的小样本目标检测算法研究

报告人：刘春磊

报告简介：首先介绍两种经典的目标检测算法，以一阶段算法yolo v3和二阶段算法faster rcnn为例，针对通用目标检测训练所需数据量大的问题，引出小样本目标检测方法，小样本图像目标检测只需要提供少量的标注信息，就能够检测出感兴趣的对象，对小样本图像目标检测研究做了详细的综述。将现有小样本图像目标检测基于迁移学习和基于元学习的两种经典范式。根据不同算法改进方法的不同，将小样本图像目标检测分为注意力机制，图卷积神经网络，度量学习和数据增强四种，对这些方法进行分析总结，最后讨论了小样本图像目标检测的未来发展趋势。

报告题目五：用于光谱成像多分量同步分析的 Python 框架

报告人：靳远

报告简介：光谱成像具有可视化、精度高、灵敏度高的特点，适用于分析复杂材料的空间分布。介绍一种用于光谱成像多分量同步分析的Python框架，该框架基于特征波段法和fast-NNLS算法，可处理复杂样本的光谱数据，获取基于目标组件的像素尺度上的样本的半定量信息。用户可选择合适的处理方法，使得分析物质的目标成分更加直观省时。

场次七、

时间：2022年7月7日（星期四）19:30-21:00

地点：beat365601教室

报告题目一:分布式优化热点研究

报告人:王思鉴

报告简介:分布式优化早已成为研究热点，本次报告旨在介绍分布式优化的发展历程和国内外研究现状。为了实现保持所有节点状态一致和共同找到原分布式优化问题的解，在设计算法时，通常需要设计一致项协议并且与集中式优化算法结合，但寻求一致所有节点状态一致的方向与梯度方向相冲突，为了克服这种冲突一个可行的方案是采用衰减步长，但是其会导致收敛速度变慢。本报告讨论克服上述缺陷的分布式优化算法，并对更复杂的分布式优化算法设计进行可靠的指导。

报告题目二：加权平衡图上的连续时间的分布式凸优化

报告人：李浩宇

报告简介：首先介绍基于有向图的凸函数连续时间分布式优化的概念以及适用场景。在基于动力学的一致性问题上，无向图的连续时间优化问题在转化为有向图时会有无法收敛的情况。本次汇报的主要内容就是介绍一个推论，并通过将不变性和强制性的概念与图矩阵的正定性特性结合来确定推论的正确性，即在保证任何强连通并且加权平衡的有向图上，一定能找到一个目标函数收敛到具有全局Lipschitz梯度的凸可微函数的之和的最小化集上。

报告题目三：分布式伪凸优化

报告人：黄镘潼

报告简介：首先介绍分布式优化相关背景和课题来源。在基于集中式优化的基础上，汇报当前分布式优化的研究进度。主要研究为分布式优化模型的证明，在原有的凸函数优化上进一步探索伪凸优化的收敛性，根据伪凸函数和问题建立的神经网络模型是否能证明可行。

报告题目四：非凸分布式优化的研究

报告人：覃海华

报告简介：首先介绍非凸分布式优化的研究背景以及研究的意义。目前在分布式优化中大多数的研究是以凸函数为目标函数，但是现实存在的基于非凸函数的问题是常见的，并且目前以非凸函数作为目标函数的分布式优化研究成果比较少。报告详细介绍了几种目前比较新的基于非凸函数的分布式优化算法，并且对其算法进行分析和总结。

报告题目五：分布式优化问题模型的构建方法

报告人：周顺

报告简介：目前分布式优化问题已经成为研究热点。与集中式的神经网络模型相比，分布式还需要解决一致性等相关问题，报告分享了一些分布式优化相关的模型并给出在构建模型时常用的方法以及它们的特点，常见的方法有：罚函数法、投影法、拉格朗日乘子法等等。

报告题目六：密峰聚类优化算法研究

报告人：张睿权

报告简介：密度峰聚类算法有许多优点，例如：可以对任意形状的簇进行聚类，具有对球形数据集进行聚类的能力；不需要预先知道簇的数目，大大提高了算法的适用性；抗噪声能力较强；算法速度较快等。然而密度峰算法也有一定的缺点：需要从决策值中选择簇中心点，具有一定的随意性，使得算法不够严谨；密度的定义过于简单，且参数对密度的影响较大；分配剩余点的时，一次分配的鲁棒性差；依然会被噪声干扰等。

报告题目七：基于递归正则化的层次分类特征选择框架研究

报告人：曹玉怡

报告简介：大规模的分类任务有数百、数千甚至数万个类别标签，这些类标签之间通常存在层次结构，这种任务称为层次分类。针对层次分类，可以考虑层次结构中不同类之间的依赖性，父子关系的类的可能共享某些共同特征，兄弟关系的类需要不同的特征进行区别。因此，报告介绍一个具有递归正则化的层次特征选择框架用于层次分类，介绍了如何使用层次递归正则化建模父子关系、兄弟关系和家庭关系来进行层次特征选择，以此实现一个强大的分类模型。

报告题目八：蚁群优化算法及其在TSP问题上的应用

报告人：黎国伟

报告简介：传统的TSP问题是组合优化中的一个NP困难问题，在运筹学和理论计算机科学中非常重要，但难以在多项式时间内找出答案，而群智能算法是一种新兴的演化计算技术，目前广泛应用于工程领域。报告介绍了传统蚁群算法（Ant colony optimization）的常用框架、参数设置原则及常见蚁群变种（MMAS、ANT-Q），并基于群智算法的研究热点、应用进行展望。

场次八、

时间：2021年7月8日（星期五）14:00-15:00

地点：beat365807B教室

报告题目一：基于多源交互融合的跨网络实体对齐

方法研究报告人：莫少聪

报告简介：基于在网络表示学习层面的研究基础，对目前的网络实体对齐方法进行深入分析，从实际场景下跨网络实体对齐标记数据难以大量获取的现实问题出发，提出一种残差循环对抗实体对齐方法。利用本文提出的残差对抗实体对齐模型实现了无监督场景下的实体对齐学习，在此基础上，利用重建损失模型和循环对抗模型对其进行了优化。在真实数据和生成数据上对所提出的方法进行了验证，实验结果表明，本文提出的方法相比目前的方法有较大提升，无监督学习的特性也提升了模型在实际场景下的应用能力。

场次九、

时间：2022年7月7日（星期四）8:00-12:00

地点：beat365604教室

报告题目一：KDM安全公钥密码方案的挑战函数集合的放大

报告人：连毓晨

报告简介：首先介绍公钥密码方案为何需要KDM安全，在公钥加密的场景中经常会遇到需要加密密钥相关信息，但这实则存在很大的安全隐患，当敌手获得足够多的密钥相关信息的密文后可破解密钥，而KDM安全可以保证密钥相关信息加密后密文的安全。其次，介绍KDM安全的定义及其挑战函数，密码方案的KDM安全性的高低取决于其挑战函数集合的大小，挑战函数集合越大，包括的函数越多，方案KDM安全性越高。

报告题目二：格上可撤销的基于身份加密方案研究

报告人：范辉凤

报告简介：首先介绍身份加密的相关背景和课题来源。基于身份的加密(IBE)是一种无须使用公钥证书进行身份认证的密码系统，能够克服公钥尺寸对密码体制实际应用效率的影响。而可撤销的基于身份加密(RIBE)方案的研究，目的是解决系统用户的公私钥因各种原因有时需要被撤销并替换为新的密钥的问题，实现密钥撤销和更新的机制。针对现有的RIBE方案中密文尺寸受身份长度线性增长问题，在格基问题下利用完全子树CS选择算法提出新的用户撤销机制，可以有效实现用户的身份管理；再利用多位加密方案的结构方法，改进密文大小。

报告题目三：基于RLWE的多密钥全同态加密方法研究

报告人：陈宇月

报告简介：全同态加密的诞生，为云计算安全提供了理论上的解决方案，可在不泄露敏感信息的前提下完成对密文的处理任务，有着与生俱来的保护用户数据安全和隐私的特性，在很大程度上解决云计算上的数据安全问题。同时，全同态加密本身在密文检索，隐私保护数据挖掘以及加密数据处理等方面具有广泛应用前景。而多密钥全同态加密方案允许云服务器对多个用户的密文进行任意计算，更适用云计的应用场景。多密钥全同态加密支持对不同用户（不同密钥）的密文进行任意的同态运算，且运算之后的结果由参与计算的所有用户联合解密，可用于安全多方计算、隐私保护等场景。（1）首先设计一个基本的单密钥全同态加密方案；（2）加入密文扩展部分，使得单密钥全同态转为多密钥全同态；（3）利用工具矩阵G修改密文扩展部分，使密文不再随用户加入而指数增长；（4）采用低位比特丢弃技术优化计算密钥生成部分，减少比特展开技术带来的冗余；（5）将单密钥全同态加密中优化的密钥交换技术扩展到多密钥全同态加密中，解决密钥交换过程复杂的问题。。

报告题目四：多密钥TFHE加密方案的研究

报告人：王冠伦

报告简介：首先介绍TFHE方案的来源与发展，TFHE是基于GSW发展而来的全同态加密方案，他是FHEW的改进版本，其主要提出了外积这一算法来保证对同态乘法的支持的同时也解决密文乘积为矩阵相乘的形式，使得同态运算的开销大大减小，提升了方案的效率。其次，介绍TFHE方案的三种密文形式以及外积的运算过程与原理，其将FHEW中的RGSW×RGSW改进为TGSW×TLWE形式。介绍查找表以及盲旋转算法，其中查找表使用CMUX门电路，盲旋转算法用于方案的电路自举。最后对多密钥TFHE方案进行改进，使用横向压缩与纵向压缩技术加快查找表的效率，使用XOR门电路优化多密钥方案的同态运算，使其支持SIMD技术，提高方案的效率。

场次十、

时间：2022年7月4日（星期一）8:00-10:00

地点：beat365807B教室

报告题目一：基于深度学习的图像去雾算法研究进展

报告人：李雅

报告简介：图像是信息的重要承载形式。雾霾的出现降低了图像采集设备采集到的图像质量，容易出现色彩暗淡、对比度和饱和度降低、细节信息丢失等问题，直接影响了有用信息的表达和利用。目前对图像去雾的研究多采用深度学习的方法，卷积神经网络代替了人工特征提取方式，取得了优于传统算法的去雾效果，但普遍存在着对真实世界雾霾图像和清晰图像对的依赖。无监督学习的方法带来了新的解决思路。报告对有代表性的深度学习图像去雾算法从监督学习和无监督学习的角度进行分类，归纳了论文中常用的数据集、评价指标，概括分析了有影响力的去雾模型的核心思想，总结了各算法的优缺点和适用场景，并进行实验分析与比较。针对目前工作存在的不足，探索下一步研究的方向。

报告题目二：融合音字特征转换的非自回归Transformer中文语音识别算法研究

报告人：滕思航

报告简介：报告首先介绍基于非自回归Transformer的端到端自动语音识别模型的相关背景及其与自回归Transformer和传统ASR模型之间的比较，讨论自回归的解码方式和独立性假设对语音识别结果的准确性产生的影响。为提升非自回归模型的识别准确度，报告将详细介绍一种融合音字特征转换的非自回归Transformer中文语音识别算法，其中，重点介绍音-字特征转换，通过在主要包含读音信息的decoder输出表示中融合上下文信息，产生的新表征将包含更多字符信息，从而改善非自回归Transformer同音不同字的识别错误问题。报告最后展示了在中文语音数据集AISHEEL1上的实验结果，可以表明基于深度双向Transformer的音字特征转换模型具有更强的特征抽取能力，并在速度与精度上均实现较好的水平，在众多主流中文语音识别算法中展现出较强的竞争力。

场次十一、

时间：2022年7月4日（星期一）8:00-12:00

地点：beat365601教室

报告题目一：OCR技术导论

报告人：冯笑如

报告简介：首先简要介绍了OCR技术的背景，包括应用场景和技术挑战。虽然OCR是一个相对具体的任务，但涉及了多方面的技术，包括文本检测、文本识别、端到端文本识别、文档分析等等。学术上关于OCR各项相关技术的研究层出不穷，报告将简要介绍OCR任务中的几种关键技术的相关工作。最后，虽然学术上关于OCR技术的研究很多，OCR技术的商业化应用相比于其他AI技术也已经相对成熟，但在实际的产业应用中，还是存在一些难点与挑战，报告也将从技术和产业实践两个角度进行简要分析。

报告题目二：OBL在灰狼算法中的应用

报告人：郭世谦

报告简介：反向相对基学习OBL（Opposition Based Learning），是一种在考虑候选解决方案的同时，也考虑相反的解决方案，实验证明，在没有先验知识优化的条件下，反向解比随机解能达到全局最优的概率更高。将OBL引入灰狼算法中，能极大改善灰狼算法的效率。

报告题目三：基于NLP的水利舆情研究

报告人：杨林达

报告简介：随着互联网的发展，人们能够越来越方便的在网络上发表和水利有关的新闻和言论，但往往有些新闻或者言论是虚假的，甚至会给社会带来负面影响。对此，可以利用 NLP 技术中的情感分析和关键词提取监测负面新闻的传播来维护社会稳定。对于NLP中BERT 处理长文本直接截断丢失文本信息和TextRank 算法不具针对性两个方面问题，提出一种的多特征融合的改进 TextRank模型。

报告题目四：TF-IDF模型及其用于文档检索的变体的分析

报告人：周聪

报告简介：信息检索系统是能够存储、检索和维护信息的系统。在这种情况下，信息可以由文本(包括数字和日期数据)、图像、音频、视频和其他多媒体对象组成。TF-IDF权重是一种统计度量，用于评估一个词对集合或语料库中的一个文档的重要性。对于语料库文档词和查询词，有多种加权模型。报告对向量空间模型在使用新数据集时的检索效果进行分析和评估。

报告题目五:云存储环境下的密文检索研究发展

报告人: 赵统

报告简介:基于当下数据量不断增长，导致数据的存储模式由本地转向云端从而面对更多安全问题及用户数据的隐私隐患的情况下，对云存储环境下的密文检索应用场景进行简单的介绍，细分检索方法的差异，对经典的密文检索方法进行总结，最后对后续发展趋势进行简要的分析。

场次十二、

时间：2022年7月5日（星期二）14:30-17:30

地点：beat365807B教室

报告题目一：增强现实中的多设备交互

报告人：郑昱霖

报告简介：首先介绍相关背景和课题来源。传统的交互方式并不能很好的适应增强现实的需要，在多设备协同可以有效的增强AR设备的交互性。基于多设备与AR头盔产生的新型交互方式能在一定程度上优化交互性。报告详细介绍了一些基于多设备交互的改进的交互方式，通过这些新方式能有效提升用户友好性与交互性，并且一定程度上提升人机交互的效率。

报告题目二：增强现实中的AR跑步伴侣研究

报告人：张友鹏

报告简介：喜欢跑步的人群总是有一个现实的痛点，就是当他们跑步跑到筋疲力尽，但是还没有完成任务时，需要一个人来在前面带跑；或者想以一定的配速来跑完全程。增强现实眼镜在一定程度上可以解决这个问题。我们提出了runner accompany 的概念，用户可以根据自己的喜好，选择不同的avater，比如人物、自然界的动物或者自己的宠物，然后根据上次的运动表现来设置当前的运动速度。经研究表明，runner accompany可以有效提升跑步者的运动表现，是增强现实有效的有前景的应用之一。

报告题目三：基于“延伸棒”的VR运动反馈问题研究

报告人：白化龙

报告简介：随着虚拟现实技术的高速发展，虚拟现实在各行各业的应用范围也更加广泛，然而，虚拟现实与真实物理世界的区别在于真实物理世界可以真实性的与实际存在的物体产生运动学交互，虚拟现实则是通过营造虚拟的三维物体给用户营造一种虚假的“真实感”，提高用户在虚拟现实世界中的“沉浸感”是虚拟现实人机交互的一个重要的课题，目前很多研究的开展基于使用真实物体比如毛刷，电机等工具给用户营造抚摸不同粗糙程度虚拟物体的触感和模拟虚拟物体物理阻碍的方式提升用户的体验，然而，这些方式依旧存在着装配不易，使用不便的问题。本次报告提出，在虚拟世界中通过在虚拟手增加“延伸棒”的方式，给用户营造真实运动反馈的方式，提升用户体验，并对后续其他可行性进行展望。

报告题目四：基于“安全墙”的交互拓展研究

报告人：苏建春

报告简介：安全墙是VR人机交互中的安全保障，保障用户在VR世界里可以安全的进行游戏。本项目基于安全墙进行交互拓展，在墙上实现更多的交互功能给用户添加更多的交互方式。现阶段虚拟现实的交互模态分为手柄、裸手交互、脑机接口、眼动追踪、语音交互、各类特定传感器等。墙的交互可以打破空间上的显示，是安全墙除了保障安全外具有更多的可能性。报告提出基于“安全墙”的交互拓展几种方向，分别是与其他空间、与真实世界、与自身世界的交互，并探讨目前阶段的墙的应用。

报告题目五：AR用户与VR用户之间的交互研究

报告人：覃浩钊

报告简介：虚拟现实给VR用户带来沉浸式体验。但其他用户很难去理解VR用户所处的环境和情景。我们可以通过其它设备实现AR效果，来观察VR用户里面的场景。当VR用户在虚拟世界中，可以把虚拟世界中的物体分享给AR用户，让AR用户可以看到虚拟世界物体以达到理解VR用户所处的情景。再通过可视化系统可以对虚拟世界物体进行操作，达到AR用户与VR用户之间的交互。

报告题目六：Hololens空间感知系统

报告人：覃业畅

报告简介：Hololens混合现实眼镜的虚实融合效果需要虚拟环境和现实环境的精确对齐，并且能互相作用。Hololens 2 的空间感知功能可以实时对周围的物理环境进行检测。但是其感知模块存在着各种限制，报告详细介绍了Hololens 2空间感知模块的应用与限制，通过各种方式调整此系统，最终达到性能与效果的平衡。

场次十二、

时间：2022年7月5日（星期二）15:00-17:00

地点：国际学院208

报告题目一：基于Q-Managed的多目标强化学习算法

报告人：唐岳鹏

报告简介：多目标强化学习(MORL)涉及使用强化学习技术来解决具有多个目标的问题，无论这些问题是否相互冲突。在处理这类问题的主要技术中，主要会受到帕累托前沿的形状、计算成本的限制。在这项工作中，提出了一种新的基于单策略方法的迭代算法，称为Q-Managed算法。该算法的实验使用了最传统的具有不同形状的帕累托前沿的MORL基准，成功地为所有这些基准找到了所有的最优策略，比文献中的所有单策略算法都要好，并且在策略质量方面与最好的匹配，在计算成本问题上可能更好。

报告题目二：基于Bert模型的研究

报告人：江俊聪

报告简介：介绍深度学习当中较为火热的NLP方向的预训练模型Bert模型的来源及其概念，介绍其前身的transformer模型。将其运用于文本分类的实际问题，并展望该模型进一步的改进以及优化。

报告题目三：关于BERT预训练模型的研究

报告人：魏丹阳

报告简介：BERT全称为 Bidirectional Encoder Representation from Transformers（来自 Transformers 的双向编码器表示），是谷歌2018年发表的论文中1，提出的一个面向自然语言处理任务的无监督预训练语言模型。其意义在于：大量无标记数据集中训练得到的深度模型，可以显著提高各项自然语言处理任务的准确率。BERT采用Transformer的编码器（Encoder）结构作为特征提取器，并使用与之配套的MLM训练方法，实现输入序列文本的双向编码；与只使用前序文本信息提取语义的单向编码器（如GPT等）相比，BERT具有更强的语义信息提取能力。

场次十三、

时间：2022年7月7日（星期四）15:00-17:00

地点：国际学院208

报告题目一：基于Softmax的多目标强化学习算法

报告人：唐岳鹏

报告简介：尽管近年来强化学习在多目标问题中的应用越来越引起人们的兴趣，但在多目标背景下探索策略的适用性和有效性的研究却很少。该论文考虑了单目标强化学习文献中几种广泛使用的探索方法，并研究了它们与多目标Q学习的结合。特别是，本文提出了两种新的方法，将Softmax算子扩展到与向量值奖励一起工作。这项算法的效果是在一组基准环境中进行评估的。结果表明，在所考虑的技术中，新的Softmax-epsilon勘探与乐观的初始化相结合提供了勘探和开采之间最有效的权衡。

报告题目二：基于预训练模型的研究

报告人：江俊聪

报告简介：介绍自然语言处理当中较为热门的预训练模型，包括transformer模型、Bert模型以及ERNIE模型，将其运用于文本分类方向，提出了一种改进的文本分类的模型，并对该模型的下一步发展进行展望。

报告题目三：关于prompt范式的研究

报告人：魏丹阳

报告简介：近几年来，有关预训练语言模型（PLM）的研究比比皆是，自然语言处理（NLP）也借着这股春风获得了长足发展。尤其是在2017-2019年间，研究者们的重心逐渐从传统task-specific的有监督模式转移到预训练上。基于预训练语言模型的研究思路通常是“pre-train, fine-tune”，即将PLM应用到下游任务上，在预训练阶段和微调阶段根据下游任务设计训练对象并对PLM本体进行调整。

场次十四、

时间：2022年7月4日（星期1）8:00

地点：beat365516教室

报告题目一：行为识别技术研究

报告人：蒋家基

报告简介：报告主要分为穿着识别、行为识别、步态识别三大部分进行演讲。对于特定穿着识别采用YOLOX算法对采集到的数据集进行训练和验证。行为识别部分采用CNN+LSTM算法进行，长短时记忆网络时是针对这一问题的具体解决方案。在步态识别方面，由于同一个样本在不同时间段步态未必一致，要达到较高识别水平，需要采集大量样本进行训练。采用GaitPart算法对现有开源数据集OU-ISIR MVLP进行训练测试，并探讨对模型进行剪枝处理，合适做轻量化和工业化部署。

欢迎广大师生踊跃参加！

上一条： beat365信息技术研究生论坛(二十五) 下一条： beat365信息技术研究生论坛（二十三）