从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统

大家好,我是星哥。公司的项目文档存了一堆 PDF,想找某份去年的供应商协议,搜半天都没结果 ——“纸质乱、电子散”,简直是当代人的文档管理痛点。

今天就给大家推荐一款能彻底解决这个问题的开源工具 ——paperless-ngx,它能把你的纸质文档 “变” 成可搜索的线上档案,从此告别 “翻箱倒柜找文件” 的麻烦,还能自己掌控数据安全,关键是完全免费!

paperless-ngx 是什么?

首先得明确一点,paperless-ngx 不是凭空冒出来的 “新工具”—— 它是经典项目 Paperless、Paperless-ng 的官方继任者。原来的项目因为维护精力问题逐渐停滞,现在由一个团队接手迭代,不仅延续了核心功能,还修复了不少旧问题、加了新特性,稳定性和实用性都更上一层。

paperless-ngx正是为了解决这个痛点而生的:

  • 扫描归档:将纸质文件数字化,统一存储。

  • 全文检索:内置 OCR(光学字符识别),支持快速搜索。

  • 标签与分类:灵活的标签体系,让文件管理更直观。

  • 多语言支持:社区驱动,持续更新,国际化完善。

一句话总结:它就是你的私人文档 Google

开源地址:https://github.com/paperless-ngx/paperless-ngx

安装部署 环境要求
打开网易新闻 查看精彩图片
安装部署 环境要求

Linux 系统或者支持Docker和Docker Compose的环境。

1.使用docker安装

1.新建一个网络
docker network create paperless-net


2.生成一个redis
docker run -d --name redis --network paperless-net redis:7
3.镜像安装
docker run -d --name paperless-ng \
-e PUID=1000 -e PGID=1000 \
-e TZ=Asia/Shanghai \
-e PAPERLESS_OCR_LANGUAGES=eng+deu \
--network paperless-net \
-e PAPERLESS_REDIS=redis://redis:6379 \
-p 8000:8000 \
-v /data/docker/paperless/data:/data \
-v /data/docker/paperless/media:/media \
ghcr.io/paperless-ngx/paperless-ngx:latest
2. Docker Compose(不建议)

网络环境的问题下载很慢

如果你是 Linux 系统(或 Docker 环境已装好的 Windows/macOS),直接在终端执行这条命令:

Docker Compose

不要用root来运行


bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"

使用

[root@node3 ~]# bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 12089 100 12089 0 0 22681 0 --:--:-- --:--:-- --:--:-- 22681
Do not run this script as root.
[root@node3 ~]# su -l www
[www@node3 ~]$ bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 12089 100 12089 0 0 9749 0 0:00:01 0:00:01 --:--:-- 9749

WARN: It look like the current user does not have Docker permissions.
WARN: Use 'sudo usermod -aG docker www' to assign Docker permissions to the user (may require restarting the shell).

#############################################
### paperless-ngx docker installation ###
#############################################

This script will download, configure and start paperless-ngx.

1. Application configuration
============================

The URL paperless will be available at. This is required if the
installation will be accessible via the web, otherwise can be left blank.
Example: https://paperless.example.com

最后卡在这一步了

https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/docker/compose/docker-compose.postgres.yml
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.109.133, 185.199.108.133, 185.199.111.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.109.133|:443... connected.
HTTP request sent, awaiting response...
打开网易新闻 查看精彩图片
使用paperless-ngx
打开网易新闻 查看精彩图片
向导
打开网易新闻 查看精彩图片
上传文件文档页面
打开网易新闻 查看精彩图片
文档预览
打开网易新闻 查看精彩图片
核心特性亮点

功能

OCR 识别

自动识别扫描件文字,支持多语言。

全文搜索

输入关键词即可秒级定位文档。

标签/元数据

自定义标签、日期、类型,轻松分类。

Web 界面

基于 Django + Angular,操作直观。

Docker 部署

一行命令即可快速启动。

社区活跃

3w+ Star,持续迭代,生态丰富。

适用场景

  • 个人用户:账单、合同、证件扫描件集中管理。

  • 小型团队:共享文档库,支持权限管理。

  • 企业内部:搭建私有化文档归档系统,避免敏感信息外泄。

⚠️注意:官方建议不要在不可信的公网主机上直接运行,因为默认存储未加密。最佳实践是自建本地服务器 + 定期备份

总结

如果你正被纸质文件和扫描件困扰,paperless-ngx是一个值得尝试的开源解决方案。它不仅能帮你实现“无纸化”,更能让文档管理进入可搜索、可分类、可扩展的新时代。