基于PDF图纸文件的智能审查技术路径研究.pdf
《基于PDF图纸文件的智能审查技术路径研究.pdf》由会员分享,可在线阅读,更多相关《基于PDF图纸文件的智能审查技术路径研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第1期(总第232期)2024 年 2 月CHINA MUNICIPAL ENGINEERINGN o.1 (S e r i a l N o.2 3 2)F e d.2 0 2 4116基于 P D F图纸文件的智能审查技术路径研究张 晓 松1,杨 海 涛1,郦 振 中1,倪 奕1,李 一 帆2,王 剑11.上海市城市建设设计研究总院(集团)有限公司,上海 200125;2.上海品览数据科技有限公司,上海 200040摘要:以明挖隧道工程图纸为例,研究针对 PDF 格式图纸进行智能审查的技术路径。基于当前 CAD 文件的 AI 审图的技术基础,提出 2 种智能审查的技术路径,一为基于 PDF
2、转换为 CAD 图纸审查,二为直接基于 PDF 图纸审查。解析 PDF 图纸的各类图元信息特征,对 2 种技术路径进行可行性和有效性研究,最终选择后者作为实施路径,搭建明挖隧道智能审查平台,并进行技术验证。关键词:工程设计;图纸;CAD;PDF;智能审图中图分类号:TP391.72 文献标志码:A 文章编号:1004-4655(2024)01-0116-05收稿日期:2023-10-08第一作者简介:张晓松(1975),男,教授级高级工程师,本科,主要从事桥梁设计工作。DOI:10.3969/j.issn.1004-4655.2024.01.026在工程设计领域,BIM 审查与 CAD 审查已
3、经出现成熟完整的流程和应用供应商,例如 PKPM、万翼、广联达等,但针对市政工程领域 PDF 格式图纸的审查方案依旧缺失。本次研究面向 PDF 格式图纸的审查问题,以明挖隧道工程图纸为例,对智能审查技术路径进行探索和验证。1 研究背景在市政工程领域,出于对项目保密性、技术保护性的考虑,报审文件以 PDF 格式为主。如何应对 PDF 图纸的实现智能识别审查,是技术解决方法的关键。具体功能包括在线看图、人工审图、文本检索、规范一致性审查、底板跨中配筋一致性审查、暗埋段一致性审查、停车视距审查等 8 条涉及不同专业的审查规则。2 PDF 图纸特征2.1 文件来源PDF 格式的图纸主要有 2 种形式,
4、分别是具体的工程图纸和项目配套的计算书。图纸格式的来源分 2 类,一类由扫描获得,一类通过 CAD 或 Office导出。本次研究范围是通过 CAD 导出且具有图层信息的 PDF 图纸,或 Office 导出的 PDF 计算书。2.2 图纸特征针对 CAD 导出的 PDF 图纸,从文字信息、图像信息、以及标注信息 3 个方面具体说明文件特征,作为研究识别审核的技术手段的依据1。1)文字信息。工程设计图纸中包含大量文本信息对图像进行说明,识别文字是基础信息提取的重点审查内容。在 CAD 图纸中,有 2 种字体样式,TrueType 字体与 SHX 字体2。转化为 PDF 图纸后,TrueType
5、 字体被转换为可直接编辑的 text 文本3。但是,由于 PDF 格式图纸中的“文字”并不全是以文本形式存储的,SHX 字体在导出为 PDF 后,变成由线条拼凑的文字,见图 1、图 2。对于这类文本,需要先进行识别,才能用于后续的规则检查。图 1 TrueType 字体导出为 PDF 后仍为可编辑的 text 文本图 2 SHX 字体导出后为 PDF 后变成线条拼凑的文字1172024 年第 1 期张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究2)图像信息。在 CAD 图纸(DWG 格式)中,几何图形信息表达为完整的多段线条,导出 PDF后,原有的几何
6、图形信息失真。在 CAD 图纸中,虚线为一个线条整体,导出为 PDF 后整体性缺失,变成多个不连续的微小线段。具有一定宽度的线段会被转换为由三角形拼合的矩形,点和圆形则被转换为由三角形绕顶点旋转而成的多边形。综上所述,CAD 文件在导出转化的过程中,几何图形原有的信息整体性被破坏,出现破碎化与信息失真。几何图元的表现形式见表 14。表 1 2 种文件格式下几何图元的表现形式图元类型DWGPDF直线Linestart point+line+end signal圆Circlestart point+curve+end signal圆弧Arc,EllipseArc椭圆Ellipse多线段Polyli
7、nestart point+curve/line+end signal复杂曲线Spine3)标注信息。图纸中的标注信息是文字与图像的合并表达5,转化为 PDF 图纸以后,原本整体的标注信息被打散,根据上述图元特性,被转化为不整体线段与破碎的文字笔画线段组合,失去原有标注引线与文本信息的关联性。因此,要重现标注信息,关键在于对不同类型线段信息的组合与还原。2.3 Office 导出项目计算书特征项目的计算书内容涵盖大量的具体参数信息,是进行审查比对的重点。在计算书中,大部分的工程信息以图表的形式呈现,因而对表格内信息进行识别和归纳处理是计算书审查的重点内容。Office 导出的计算书(PDF 格
8、式)中的文字是可编辑的 text 文本。但是,表格的层级特征,导致信息并非直接一一对应,而是包含大量多对一或一对多的排列情况。所以,表格信息需要进行不同归并处理。由于表格的层级不同,需要对表内信息合并归纳,这是表格在图纸审查问题上的特殊之处。3 技术路径的设计基于 PDF 文件的审图系统,需要综合若干技术才能实现 AI 智能审图,主要包括 PDF 矢量化、OCR(Optical Character Recognition)识别、图形结构化、AI 审查等。介绍 2 种应对 PDF 图纸审查的技术解决手段:一是将 PDF 图纸转换为 CAD 格式接入既有的审查体系;二是直接面向 PDF 图纸进行解
9、析审查。3.1 既有 CAD 图纸的 AI 审图技术路径AI 审图的基础,首先是对 CAD 导出的 DWG图纸做图层解析,由于工程图纸在绘制过程中具有图层属性,绘制不同的对象和构件需建立独立图层,这为构件的识别和区分带来便利。进行图层筛选,选出需要识别的图层,对各个图层独立打印,生成单图层元素的 PNG 图片,基于 PNG 图面进行 CV(Computer Vision)识别,进行构件识别。依据构件的识别生成围合空间的判定识别,得到从2D 图纸转化的空间模型信息6。这套基础技术流程适用于明挖隧道项目的审查要求,审查中,对于不同对象和构件,例如钢筋、混凝土墙体的识别,可以有效进行待审查对象的识别
10、查找,见图 3。图元 CAD 图层图元 CAD 坐标其他解析信息图元推荐图层图元 PNG 坐标其他转换信息图纸 PNG 图片构件位置信息构件类别类别构件图层推荐逻辑构件图层逻置图元坐标转换构件合并推荐图层打印构件小图获取CNN 模型推理空间轮廓空间 BBOX空间名称借助构件等的空间分割后处理空间轮廓空间 BBOX空间名称基于空间和构建的审查土建连线搜索空间图像处理空间名称匹配借助图层、空间、构件尺寸等的构件分类后处理图 3 AI 审查技术流程1182024 年第 1 期张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究3.2 基于既有 CAD 审查的技术改
11、造方案尝试将 PDF 文件转换回 DWG 文件,若能还原导出前的文件图元信息,即可直接接入已有的审查系统。对 PDF 转换为 CAD 图纸的方式方法的进行调查研究,并分析其可行性。1)现有的 PDF 转换还原为 CAD 的技术手段主要有:(1)通过开源 pdf2dxf 对文件进行转换;(2)通过第三方 ODA 对文件进行转换。流程见图 4。根据审查规则整理相应的 PDF 图纸进行测试,得到关于图层、文本、图元还原情况的准确率,见表 2。从中可知,虽然将 PDF 转换为 CAD 文件后进行审查可以更好的利用现有审图体系,但是其图层、图元、文本还原准确率仍有一些缺漏,考虑直接基于PDF 图纸进行审
12、查的可能性。加载 PDFDXFCADJSONPNGOCR开源:第三方:华为云、百度云、阿里云文本图元坐标坐标返回识别文本匹配审查提取图元RealdwgPDF 转 DXF开源:pdf2dxf(Github)第三方:ODA(收费)图 4 PDF 转 CAD 智能审查流程表 2 PDF 转 CAD 转化效果表编号使用服务效果PDF 转DXFOCR图层还原准确率文本还原准确率图元还原误差1ODA华为云(表格)91.9%差0.25%2ODA华为云(文本)91.9%80%95%0.25%3开源pdf2dxf华为云(文本)低极大4ODA开源 OCR91.9%文本识出率约为50%,对于已识出文本,识别准确率在
13、30%75%0.25%2)转换中信息损失的主要原因在前文中已论述,由 PDF 转回的 CAD 文件,文字变成了线段与图形的组合,而原本有粗细变化的图元线条和填充图形,转换后变成三角形拼合的图样。造成由 PDF转回的 CAD 文件,接入既有 CAD 审查的技术,识别准确率下降,见图 5 图 7。图 5 PDF 转回后线形样式转换前转换前转换后转换后80080010181018800800转换为三角形拼合图图 6 PDF 转回后圆点图元样式转换前转换后转换为填充图形图 7 PDF 转回后文本样式3.3 直接基于 PDF 文件的智能审图考虑直接基于 PDF 做智能审图。从 PDF 格式的文档中提取图
14、层、几何图形、文本信息等。通过第三方 SDK(软件开发工具包)解析,直接得到满足审查流程 JSON 格式文件。基于 Google 开源的 Pdfium 库,读取 PDF 内的信息,并以 JSON文本形式保存,从而直接进行审查。具体流程见图 8。采用第三方开源 Java 库 PDFBox 解析 PDF文件。PDF 解析的结果保存为 CADJSON 格式,以便对接与已有的审查流程。CADJSON 转换为云设计模型,实现后续的在线浏览和编辑。解析过程中,可以直接对图层、TrueType 文本、几何图元、图片做处理,SHX 文本和表格需做特殊处理。从 JSON 文 件 生 成 OCR 识 别 所 需
15、的 图 片。OCR 识别产生的结果包括:文本信息和文本所在像素区域。基于像素区域,后续可以在矢量图纸中还原文字的坐标位置。1192024 年第 1 期加载 PDF遍历对象转换内存对象否否SHX 匹配是是是无匹配几何归到图签分组转成 SHX 文本生成 JSON保存文件图签分组是否为标注是否匹配到是否为图片是否为图片图 8 直接基于 PDF 的审图流程源 PDF 文件经过矢量化和 OCR 识别处理后的数据需整合优化,即把 OCR 识别后的文本信息与矢量数据进行匹配,建立文字与线条信息的联系。此步骤依赖多个空间矩阵变换。在矢量 JSON 文件中,图元所在的坐标系(矢量空间)见图 9。获得图纸在世界坐
16、标系的尺寸:长度(L)和宽度(W)。转换前转换后图 9 转换前、后图纸的坐标变换3.4 2 种技术路径对比基于 PDF 转换为 CAD 图纸审查,依靠现有技术,在转换的过程中信息缺失、损耗的比例高。此外,由于来回转换格式的步骤增加,进一步增加损耗,导致审查的准确率降低。直接基于 PDF 图纸审查,就调研情况来看,对 PDF 直接解析的技术相对成熟稳定。同时,直接审查的减少了整体流程,技术开发更加直接便捷。基于此,最终采用直接基于 PDF 图纸审查的技术路径。4 技术验证结果以明挖隧道工程图纸为例,重点考察文本审查、配筋一致性审查规则,对直接基于 PDF 图纸审查的技术路径做技术验证。4.1 文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PDF 图纸 文件 智能 审查 技术 路径 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。