文章

PDF复制乱码

最后修改时间：2026/4/9 16:17:12

在CTEX2.9.2中，中文编译后的pdf文件能够正常显示汉字，但是复制得到的是乱码。这个在新版本中作为BUG被修复了。但是这个功能一定程度上能够防止文档被复制。

可以通过下面的代码来实现类似效果。

import pikepdf
import sys

def main(filename):
    pdf = pikepdf.Pdf.open(filename)
    for page in pdf.pages:
        print(f'处理页面：{page.index+1}')
        if '/Resources' in page and '/Font' in page['/Resources']:
            fonts = page['/Resources']['/Font']
            for font_key in fonts:
                font = fonts[font_key]
                if '/ToUnicode' in font: del font['/ToUnicode']
                #if '/Encoding' in font: del font['/Encoding']
    pdf.save(filename.replace('.pdf', '_protected.pdf'))

if __name__ == '__main__':
    if len(sys.argv) < 2:
        print('请拖入 PDF 文件')
        input('按回车退出...')

    for input_pdf in sys.argv[1:]: 
        print(f'处理文件：{input_pdf}')
        main(input_pdf)
        print(f'完成：{input_pdf}')
    input('全部任务完成，按回车退出...')

经过测试，大部分PDF都有效果，包括Word或者PPT转的PDF。少数XeLaTex编译的无效。当然ORC或者VL是防不了的。

文章列表

¤ PDF复制乱码 2026/4/9
¤ IIS初始配置需要记住的内容 2024/11/15
¤ python环境下onnx文件快速布局CUDA与DML 2024/7/19
¤ 使用smtplib发送邮件（不依赖于第三方邮件服务商） 2024/7/8
¤ WSL一些记录的点。 2024/7/8
¤ 一个配置的暂存 2024/4/30
¤ 公开履历 2022/11/17
¤ 使用多线程解决tkinter运行耗时函数时假死冻结问题 2021/8/4
¤ Python一些意外有用的包 2020/11/27
¤ 使用VS2017不安装SSMS在IIS下配置SQL SERVER 2017 2019/9/22
¤ 对焦虑症患者的恶意 2018/8/20