大家好,我是东哥,你身边放心的香港保险顾问。

东哥做香港保险,入职的是香港的保险公司。

公司内部的各种文件,都是繁体。

尤其喜欢用PDF格式。

内容吧,咱没有办法。

编辑PDF文件太费事儿了。

但特么文件名常常也是用的繁体,就很囧。

以前东哥的做法,是把它用简体打字重命名一遍。

后来觉得太繁琐了。

版本一直在变,公司每更新一次,我就得重新操作一次。

尝试用过Word的繁体转简体,也挺麻烦。

光想想启动个Word这种庞然巨物来处理这么简单个事儿,就觉得心累。

有没有更方便一些的办法?

1

有。

人生苦短,我用Python。

东哥必须得用考虑用Python自动化这个过程啊。

繁体中文转简体中文,市面上最流行的解决方案,是OpenCC。

什么是OpenCC?

OpenCC是一个开源的繁简转换项目。

它支持多种转换方式,包括简体到繁体、繁体到简体、新式繁体到旧式繁体、旧式繁体到新式繁体之类。

东哥用的,自然是繁体转简体。

OpenCC的Python实现,有两个比较流行的库。

一个是它自己官方推出的,名字就叫OpenCC。

另一个是它的纯Python实现,名字叫opencc-python-reimplemented。

  • OpenCC: https://pypi.org/project/OpenCC/

  • opencc-python-reimplemented: https://pypi.org/project/opencc-python-reimplemented/

两者有什么主要区别?

OpenCC的Python版本,底层仍然是C++。

在性能上,完胜后者。

但安装配置比较复杂。

用pip安装后,还需要再安装 C++ 编译工具链。

Oh,C++,非专业人士的噩梦啊。

灭绝师太级别的家伙,东哥可不想碰她。

哪怕是一根手指。

opencc-python-reimplemented是它的纯Python实现。

用pip安装后,就可以直接调用。

不用再做其他复杂的配置。

就很方便。

像许红豆一样亲切。

现在再需要重命名的时候,东哥只需要运行一下已经编号的脚本。

def rename2sim(ipath:str=dt.get_clipboard())->str:
    '''     rename file from traditional Chinese to Simplified Chinese.     '''
    folder, fname, ext = dt.splitpath(ipath)
    fname = tra2sim(fname)
    npath = os.path.join(folder, fname+ext)
    os.rename(ipath, npath)

所有繁体,洗净一身铅华。

人生苦短,我用Python。

对酒当歌,我用Python。

这是属于东哥的浪漫。

爱生活,爱拉芳,Python天天见。

能看懂这个梗的,是不是都有点年纪了

关注东哥,保护中产财富,一起慢慢变富。

东哥目前提供如下服务,有需要的朋友欢迎微信来撩。

  • ,大家一起讨论读书、成长及赚钱;

  • ,分享一些专业金融知识及硬核资讯;