倪劼, 叶江松, 谢恩泽
图书馆论坛. 2024, 44(6): 110-118.
开展馆藏报纸图像内容分割研究,能提升文字识别准确率,对促进机器识别取代人工操作、提高图书馆数字化工作效率具有重要意义。文章根据报纸图像呈现的特征,提出一种基于改进Mask R-CNN的算法,实现报纸图像内容分割。首先,通过优化锚框比例和损失函数,对原始Mask R-CNN算法进行改进。其次,采用数据增强、调整训练参数开展样本训练。最后,通过实验的方式对改进后的Mask R-CNN算法训练模型和原始算法训练模型进行比较,并采用AP_bbox和AP_segm评价指标对实验结果进行评估,改进后的算法训练模型AP_bbox为0.935,AP_segm为0.943,均超过原始算法训练模型。实验结果表明,改进后的Mask R-CNN算法能够实现报纸图像内容有效检测与分割。