DocAI
DocAI - это система для обработки документов с использованием OCR и ИИ-классификации. Система позволяет автоматически распознавать текст из PDF-документов, классифицировать их по типам и извлекать структурированные данные.
Возможности
- OCR обработка - распознавание текста из PDF-документов
- ИИ классификация - автоматическое определение типа документа (Invoice, Contract и т.д.)
- Извлечение данных - структурированное извлечение полей из документов
- REST API - полноценный API для интеграции
- Асинхронная обработка - фоновая обработка через Celery
Архитектура
Технологии
| Компонент | Технология |
|---|---|
| Backend | Django 5.1, Django REST Framework |
| Frontend | Next.js 15, React 19 |
| База данных | PostgreSQL |
| Очередь задач | Celery + Redis |
| ИИ Агенты | Dify, n8n |
| Аутентификация | JWT (SimpleJWT + NextAuth) |
Быстрый старт
# Клонировать репозиторий
git clone <repository-url>
cd docai
# Настроить окружение
cp .env.backend.template .env.backend
cp .env.frontend.template .env.frontend
# Запустить через Docker
docker compose up
После запуска:
- Frontend: http://localhost:3000
- API: http://localhost:8000
- Swagger: http://localhost:8000/api/schema/swagger-ui/
- Admin: http://localhost:8000/admin/