大家好,我是东哥,你身边放心的香港保险顾问。
东哥做香港保险,入职的是香港的保险公司。
公司内部的各种文件,都是繁体。
尤其喜欢用PDF格式。
内容吧,咱没有办法。
编辑PDF文件太费事儿了。
以前东哥的做法,是把它用简体打字重命名一遍。
后来觉得太繁琐了。
版本一直在变,公司每更新一次,我就得重新操作一次。
尝试用过Word的繁体转简体,也挺麻烦。
光想想启动个Word这种庞然巨物来处理这么简单个事儿,就觉得心累。
有没有更方便一些的办法?
1
有。
人生苦短,我用Python。
东哥必须得用考虑用Python自动化这个过程啊。
繁体中文转简体中文,市面上最流行的解决方案,是OpenCC。
什么是OpenCC?
OpenCC是一个开源的繁简转换项目。
它支持多种转换方式,包括简体到繁体、繁体到简体、新式繁体到旧式繁体、旧式繁体到新式繁体之类。
东哥用的,自然是繁体转简体。
OpenCC的Python实现,有两个比较流行的库。
一个是它自己官方推出的,名字就叫OpenCC。
另一个是它的纯Python实现,名字叫opencc-python-reimplemented。
OpenCC: https://pypi.org/project/OpenCC/
opencc-python-reimplemented: https://pypi.org/project/opencc-python-reimplemented/
两者有什么主要区别?
OpenCC的Python版本,底层仍然是C++。
在性能上,完胜后者。
但安装配置比较复杂。
用pip安装后,还需要再安装 C++ 编译工具链。
Oh,C++,非专业人士的噩梦啊。
灭绝师太级别的家伙,东哥可不想碰她。
哪怕是一根手指。
opencc-python-reimplemented是它的纯Python实现。
用pip安装后,就可以直接调用。
不用再做其他复杂的配置。
就很方便。
像许红豆一样亲切。
现在再需要重命名的时候,东哥只需要运行一下已经编号的脚本。
def rename2sim(ipath:str=dt.get_clipboard())->str:
''' rename file from traditional Chinese to Simplified Chinese. '''
folder, fname, ext = dt.splitpath(ipath)
fname = tra2sim(fname)
npath = os.path.join(folder, fname+ext)
os.rename(ipath, npath)所有繁体,洗净一身铅华。
人生苦短,我用Python。
对酒当歌,我用Python。
这是属于东哥的浪漫。
爱生活,爱拉芳,Python天天见。
能看懂这个梗的,是不是都有点年纪了
关注东哥,保护中产财富,一起慢慢变富。
东哥目前提供如下服务,有需要的朋友欢迎微信来撩。
,大家一起讨论读书、成长及赚钱;
,分享一些专业金融知识及硬核资讯;
热门跟贴