刊文精选

教育教学论文:深度学习课程研究性实验教学设计

来源:教育教学论坛 2021/9/14 16:45:59

李艳凤 陈后金

[摘 要] 深度学习作为机器学习的一个新分支,在学术界和工业界受到了廣泛的关注。深度学习是一门理论与实践紧密结合的课程,为增强学生利用深度学习理论和方法解决工程实际问题的能力,探索与实践了研究性实验教学。以“基于Faster R-CNN的乳腺X线图像肿块检测”内容为例,基于前沿的、有实际价值的科研项目,按照高阶性和创新性的目标设计实验内容。通过研究性实验教学,加深了学生对课程相关理论的理解与应用,增强了学生的高阶思维能力和创新能力。

[关键词] 深度学习;目标检测;研究性实验教学

[基金项目] 2020年度教育部新工科研究与实践项目“面向新工科的信号与信息系统系列课程改革”(E-DZYQ20201402);2020年度北京交通大学研究生优质核心课程及教育教学改革项目“‘深度学习课程建设”(134793522);2019年度北京交通大学教改项目“模式识别与机器学习慕课建设与应用”(356369535)

[作者简介] 李艳凤(1988—),女,河北廊坊人,博士,北京交通大学电子信息工程学院副教授,主要从事信号与信息处理及模式识别研究。

[中图分类号] G420   [文献标识码] A   [文章编号] 1674-9324(2021)19-0137-04      [收稿日期] 2020-12-17

为主动应对、适应并引领新一轮科技革命和产业革命,国家提出了以信息化和智能化为主要特征的新工科战略。在新一代人工智能阶段,国家高度重视发展人工智能。在此背景下,社会对电子信息类人才的需求也发生了改变[1],社会需要具有深厚理论基础、多学科综合能力及创新能力的优秀人才。深度学习作为机器学习的一个新分支,在学术界和工业界受到了广泛的关注,其在信息处理、智能控制及智能通信等领域具有良好的应用前景,掌握深度学习新理论和新技术有利于电子信息类学生紧跟时代发展。

“深度学习”是一门理论与实践紧密结合的课程。以验证性内容为主的实验,导致学生的实践能力普遍偏低,难以适应当今社会发展的形势[2]。为增强学生理论联系实际、解决复杂工程问题的能力,培养学生的创新意识,基于实际工程问题的研究性实验教学尤为重要。研究性实验教学是一种激发自主学习意识、锻炼解决问题能力、培养科研创新思维的教学模式[3],不仅要求学生加深对课程相关理论的理解,还要求学生加强对相关理论的实际应用[4],使学生由被动接受知识转变为主动和互动获取知识,由侧重理解问题转换为侧重发现问题。据此在“深度学习”课程中,探索并实践了面向工程实际问题的研究性实验教学,以“基于Faster R-CNN的乳腺X线图像肿块检测”研究性实验为例,给出具体的实验教学设计与实施过程。

一、研究性实验工程背景

研究性实验的工程背景体现了课程内容在实际工程中的应用,工程背景可以取材于前沿的、有实际价值的科研项目,这样不仅能够激发学生的学习兴趣,而且能够指导学生解决现有的科学问题[5]。本实验的工程背景取材于课程组负责的国家自然科学基金项目,在该项目中,需要研究乳腺X线图像中的肿块检测,以减轻医师的工作强度,提高乳腺癌检查的准确性。该内容正是目标检测内容在智能医疗领域的典型应用,因此以该项目提炼本次研究性实验的工程背景,从基于人工智能技术的乳腺X线图像肿块检测意义及基于深度学习的目标检测网络两个方面进行介绍。

(一)基于人工智能技术的乳腺X线图像肿块检测意义

乳腺癌是女性最常见的疾病,在我国每年新诊断的癌症中,乳腺癌的发病率占12%。早期的乳腺肿块筛查是降低乳腺癌死亡率和提高治愈率的有效方式。在众多乳腺摄影技术中,乳腺钼靶X线摄影术是目前最有效的肿块筛查手段之一。每年进行乳腺X线摄影筛查产生大量的乳腺X线图像,由于乳腺X线图像结构复杂,肿块的边界、大小、纹理和形状差异较大,且正常的乳腺组织与肿块组织没有明确的界限,因此正确地检测乳腺图像中的肿块区域相对困难。考虑到视觉疲劳和经验等相关因素,放射性医师单独阅片对乳腺癌检查的敏感度为84%,特异性为91%。为了减轻医师的工作强度,同时提高乳腺癌检查的准确性,计算机辅助诊断(Computer Aided Diagnosis,CAD)系统逐渐被研究用于乳腺癌检测中。相比于传统机器学习方法,深度学习方法在目标检测、语义分割和物体分类任务中表现出更大的优势,因此将深度学习方法应用于乳腺X线图像肿块检测成为目前的研究热点。

(二)基于深度学习的目标检测网络

Faster R-CNN[6]作为一种主流的二阶段检测网络,其在目标检测中具有良好的性能。该网络主要由区域建议网络(Region Proposal Network, RPN)和Fast R-CNN检测器构成。区域建议网络用于生成目标候选区域,Fast R-CNN检测器对RPN的输出结果做更加精细的处理,对目标候选区域进行分类和回归位置,提高检测精度。

二、研究性实验内容

实验内容是研究性实验教学的具体实施部分,需要具有一定的高阶性和创新性。为了达到高阶性的要求,实验内容设计应关注课程相关知识的理解及将其用于解决工程问题的能力两个目标。因此,“基于Faster R-CNN的乳腺X线图像肿块检测”实验内容的设计目标包括:(1)强化目标检测网络用于不同目标检测任务的具体设置;(2)掌握不同特征提取网络的选取方法;(3)培养学生将理论分析与实际应用相结合的素质,提高学生的工程实践能力。高阶性的实验内容包括:数据扩增、特征提取网络选择及预选框优化。在创新性实验内容设置上,对学生应用Faster R-CNN的能力提出更高的要求。在实验内容设计上,逐步加大实验内容的难度,学生需要开展自主性学习,通过文献查阅、小组讨论,对Faster R-CNN进行改进。创新性实验的具体内容包括:去除RPN网络、去除目标分类和精细位置回归、级联多次位置回归。

(一)实验数据与评价指标

本实验为学生提供INbreast数据库的80张肿块图像、DDSM数据库的200张肿块图像、BCPKUPH数据库的120张肿块图像,以及80张正常图像(不包含肿块)构建的混合数据库。为解决图像尺寸较大带来的内存空间不足的问题,将所有输入图像按照列缩放到600像素的比例对行和列统一缩放。评价肿块检测性能采用FROC(Free Receiver Operating Characteristic)曲线,该曲线纵坐标为真阳性率(True Positive Rate,TPR),横坐标为每张图像平均假阳性数量(False Positive Per Image,FPs/I)。

(二)高阶性实验内容

1.数据扩增。相比于自然图像,医学图像的数据量较小,而深度学习网络一般具有较多的网络参数量,因此训练过程一般要求较大的数据量。为充分利用有限的数据训练网络模型,可采用对图像进行水平翻转等方法实现训练数据的扩增。学生可采用课程中介绍的随机翻转、随机剪裁等方式实现数据扩增,也可通过文献调研,采用其他的数据扩增方法。分别以原始数据集及扩增后数据集训练检测网络,比较未扩增与扩增后、不同扩增方法下网络的肿块检测性能,得出对于小批量数据集,数据扩增具有一定的优势,以及对于乳腺X线图像较为合适的数据扩增方法。

2.特征提取网络选择。Faster R-CNN网络主要包括特征提取网络、区域建议网络(RPN)及ROI(Region Of Interest)特征处理三个过程,如图1所示。Faster R-CNN中的特征提取网络并不唯一,多种卷积神经网络(Convolutional Neural Network,CNN)均可作为特征提取网络。学生可选择课程中讲解的VGG16、ResNet等网络,比较不同网络下的肿块检测性能,理解特征提取网络对于肿块检测性能的影响。

具体地,由于残差网络(Residual Network,ResNet)[7]采用卷积层与恒等映射(identity)之和的结构作为网络的基本结构,如图2所示,网络的训练误差不会随着网络层数增加而增加,從而解决了网络深度变深带来的性能退化问题,因此,其可以从显著增加的深度中获得更加准确的特征信息。残差网络包括多种网络,如表1所示。学生可进一步分析在小批量数据集下,不同残差网络的性能差异。

3.预选框优化。RPN是一个端对端的网络,输入任意大小乳腺图像,经过特征提取生成特征图后,输出可疑区域的位置偏移量和包含肿块的概率。对于特征图的每个点,RPN会产生一组不同长宽比的预选框,该预选框的尺度对于肿块检测性能具有一定的影响。通常来说,其预选框越接近目标的真实尺寸,其目标检测性能越好。学生可通过统计乳腺图像肿块尺寸(如图3所示),对预选框的尺寸进行优化,并与Faster R-CNN设置的默认预选框尺寸进行比较,理解预选框尺寸对于肿块检测性能的影响。

(三)创新性实验内容

通过完成高阶性实验,学生对于Faster R-CNN解决具体工程问题有了较为深入的理解。在此基础上,逐步加大实验内容的难度,从而让学生充分发挥自学能力和创新精神。

1.去除RPN网络。在Faster R-CNN中,第一阶段的RPN网络基于预选框生成候选框位置及目标分数,第二阶段实现目标分类和精细位置回归。由于第一阶段和第二阶段均计算了目标的位置回归损失,学生思考是否可以去除RPN网络,将预选框作为候选框,直接对其进行目标分类和位置回归。学生对Faster R-CNN网络进行修改,完成方案设计,得出有效结论。

2.去除目标分类和精细位置回归。Faster R-CNN是一种多目标检测方法,而乳腺X线图像肿块检测是单目标检测任务。对于单目标检测任务,RPN输出的目标置信度即可作为该区域属于肿块的概率。学生分析是否可以只保留RPN网络,去除后面的目标分类和精细位置回归。学生对Faster R-CNN网络进行修改,完成方案设计,得出有效结论。

3.级联多次位置回归。Faster R-CNN是一种二阶段检测网络,第一阶段的RPN网络和第二阶段的目标分类网络同时进行位置回归任务。学生分析是否可以再添加多级位置回归网络,以进一步提升位置回归的精度,多级位置回归网络带来的优点和不足分别是什么。学生对Faster R-CNN网络进行修改,完成方案设计,得出有效结论。

三、结语

本文以“基于Faster R-CNN的乳腺X线图像肿块检测”为例,探索和实践了深度学习课程的研究性实验教学。实验内容取材于前沿的、有实际价值的科研项目,能够激发学生的学习兴趣,同时可指导学生解决现有的科学问题。遵循从简单到复杂、从知识理解到创新应用的原则,进行高阶性和创新性的实验内容设置。通过该研究性实验教学,增加了学生理论联系实际、研究解决复杂工程问题的能力,培养了学生的创新意识。

参考文献

[1]张干清,郭磊,向阳辉.新工科双创人才培养的实践教学范式[J].高教探索,2018(8):55-60.

[2]武晔,万永革,武巴特尔,等.数字信号处理课程“地震数据重采样”综合性实验设计[J].实验室研究与探索,2018,37(2):178-182+192.

[3]纪光欣,鲁彦平.基于“金课”导向的研究性教学模式探索[J].教育评论,2019(9):147-151.

[4]崔学荣,曹爱请,李娟,等.研究性教学模式在实验教学方法改革中的应用[J].实验技术与管理,2016, 33(1):176-178.

[5]杨永红,刘细梅,黄兰,等.面向工程教育的道路勘测设计课程研究性教学设计[J].实验技术与管理, 2018,35(7):206-208.

[6]Ren S., He K., Girshick R., et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J].IEEE Trans Pattern Anal Mach Intell, 2017,39(6):1137-1149.

[7]He K., Zhang X., Ren S., et al.Deep Residual Learning for Image Recognition[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,NV:IEEEPress,2016:770-778.

Research-oriented Experimental Teaching Design in the Course of Deep Learning

LI Yan-feng, CHEN Hou-jin

(School of Electronics and Information Engineering, Beijing Jiaotong University, Beijing 100044, China)

Abstract: As a new branch of machine learning, Deep Learning has attracted extensive attention in academia and industry. Deep Learning is a course, which closely combines theory with practice. In order to enhance students ability to use theories and methods of this course to solve practical engineering problems, the research-oriented experimental teaching is explored and practiced. Taking the content of “detection of breast X-ray image mass based on Faster R-CNN” as an example, and based on the cutting-edge and practical scientific research projects, the experimental teaching content is designed according to the high-order and innovative objectives. Through research-oriented experimental teaching, students understanding and application of the course-related theories are deepened and students high-level thinking ability and innovation ability are enhanced.

Key words: Deep Learning; object detection; research-oriented experimental teaching


本文版权归教育教学论坛杂志社及本文作者所有,未经同意,不得转载! ——《教育教学论坛》查稿电话:0311-85178286