关键信息
- 分类
- 文档与 PDF
- 输入类型
- file, select, number, text
- 输出类型
- file
- 样本覆盖
- 4
- 支持 API
- Yes
概览
PDF去歪斜工具是一款纯浏览器端运行的实用工具,能够自动检测并校正PDF页面(尤其是扫描件图片页)的倾斜角度。它采用智能的自适应处理机制,在校正扫描图片页的同时,默认原样保留文字页的矢量格式与可搜索性,无需安装任何插件或上传服务器,即可快速让您的PDF文档恢复整齐排版。
适用场景
- •扫描纸质文档或合同并转换为PDF后,发现页面存在轻微倾斜,影响阅读和打印。
- •整理包含混合内容的PDF文档,希望仅校正扫描图片页,同时保留原生文字页的可搜索性。
- •需要对特定页码范围的PDF页面进行精确的角度调整,以统一文档的排版方向。
工作原理
- •用户上传PDF文件,并选择自动检测或手动输入校正角度。
- •系统自动识别页面类型:对于图片页,使用pdf.js进行栅格化并通过水平投影方差算法检测并校正歪斜;对于文字页和空白页,默认原样保留以维护矢量文字的可搜索性。
- •根据设定的阈值或手动角度旋转页面图像,重新组装并输出校正后的PDF文件。
使用场景
用户案例
1. 自动校正倾斜的合同扫描件
律师助理- 背景原因
- 需要整理一份由客户发送的合同扫描件PDF,由于扫描时纸张放置不正,多处页面存在轻微倾斜,影响阅读和打印。
- 解决问题
- 快速校正所有倾斜页面,同时不影响原本就是电子文字的封面和附录页。
- 如何使用
- 上传合同PDF文件,选择“自动检测歪斜”模式,保持“栅格化文字页”为“否”,点击开始处理。
- 示例配置
-
mode: auto, threshold: 0.5, rasterizeText: false - 效果
- 扫描倾斜的合同页面被自动扶正,而原本的电子文字页完好无损,保留了可搜索性。
2. 指定页面手动微调
数字化专员- 背景原因
- 在处理一份历史档案PDF时,发现第1至第3页由于装订原因统一向顺时针方向倾斜了大约3度。
- 解决问题
- 仅对前3页进行精确的3度逆时针校正,其余页面保持原样。
- 如何使用
- 上传PDF文件,将模式切换为“手动角度”,输入手动角度为“3”(正值校正顺时针倾斜),在页面范围中输入“1-3”,然后运行。
- 示例配置
-
mode: manual, manualAngle: 3, pageRange: 1-3 - 效果
- 仅第1至3页被精确校正了3度,其他页面未受任何影响。
用 Samples 测试
pdf, image, text相关专题
常见问题
为什么处理后有些页面的文字无法选中了?
默认情况下文字页不会被栅格化。如果您开启了“栅格化文字页”选项,文字页会被转化为图片进行去歪斜,从而导致文字无法被选中。
自动检测歪斜的范围是多少?
自动模式支持检测并校正正负15度范围内的倾斜,分辨率为0.5度。
什么是自动检测阈值?
它是触发校正的最小倾斜角度。例如设为0.5度,只有当页面倾斜大于0.5度时才会进行校正,避免微小误差导致不必要的重绘。
这个工具会把我的PDF文件上传到服务器吗?
不会。本工具使用纯JavaScript在您的浏览器本地完成所有处理,文件不会上传到任何服务器,确保隐私安全。
如果整页旋转了90度或180度,可以使用这个工具吗?
不建议。本工具主要用于校正微小的倾斜(±15°内)。对于90/180/270度的整页旋转,请使用专门的PDF旋转工具。