初入江湖
0
PDF分两种,一种可复制,可直接通过工具坐标提取一种不可复制,需要通过OCR识别图片然后再转成PDF,转成PDF分为两种,一种为保持原有样式需要生成双层PDF,当然也可以直接生成pdf,但是会和原格式有出入(线框、字号大小颜色等)工具界面示意:
可以单独解析图片:
其他功能可自行尝试也可按照下放代码自己编译使用以下开源库,遵循MIT协议PdfiumViewer PDF预览及可编辑PDF的提取PDFsharp 生成PDFPaddleSharp 对图片OCR识别欢迎Start、PR
举报
发表回复
请点击举报理由
广告垃圾 违规内容 恶意灌水 重复发帖 其他
还可输入 200 个字符 确定
确定
小黑屋|大神论坛 ( 粤ICP备2021000060号 )
Powered by 大神论坛 © 2021 ~