Как заменить GPU-сервер для видеоанализа через Geteh API
Пошаговая инструкция: как подключить анализ видео, эмбеддинги и AI-моделирование через Geteh API — всё через POST /v1/generate.
Geteh — это полноценная AI-платформа с API
Частое заблуждение: Geteh — аналог OpenRouter или GPTunnel. Это неверно. API-роутеры проксируют вызовы к чужим LLM API. Geteh предоставляет доступ к мощным вычислительным ресурсам и запускает на них 400+ ML-моделей, включая специализированные: CLIP ViT-L-14, TransNetV2, CogVLM2-Video, Stable Fast 3D, Demucs и другие.
Ключевой эндпоинт: POST /v1/generate — вызывает любую модель из каталога 500+. Не только LLM, но и компьютерное зрение, эмбеддинги, детекцию, 3D.
Задача: заменить GPU-сервер для видеоаналитического пайплайна
Типичный стек видеоанализа на своём GPU:
- TransNetV2 — сегментация видео на сцены (shot detection)
- CLIP ViT-L-14 — семантические эмбеддинги кадров (768-dim вектора)
- VLM — описание содержимого каждой сцены
- AI content detection — модерация
- Cosine similarity — семантический поиск по эмбеддингам
Стоимость своего GPU: 15 000–150 000 ₽/мес при загрузке 5–15%.
Шаг 1: Shot Detection через API
curl -X POST https://geteh.ru/api/v1/generate \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "magpai-app/cog-scenedetect", "inputs": {"video": "https://storage.example.com/video.mp4"}}'
# Ответ: [{"start": 0.0, "end": 3.4}, {"start": 3.4, "end": 8.1}, ...]
# Стоимость: ~2–5 кредитов за минуту видео
Шаг 2: CLIP Embeddings для каждого кадра
curl -X POST https://geteh.ru/api/v1/generate \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "andreasjansson/clip-features", "inputs": {"inputs": "https://storage.example.com/frame_001.jpg"}}'
# Ответ: {"embedding": [0.012, -0.034, 0.078, ...]} // 768 float32 values
# Стоимость: ~0.5 кредита за кадр
# Сохраните вектор в pgvector / Pinecone / Qdrant
Шаг 3: VLM-анализ сцен
curl -X POST https://geteh.ru/api/v1/generate \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "chenxwh/cogvlm2-video", "inputs": {"input_video": "https://storage.example.com/clip_001.mp4", "prompt": "Describe this scene in detail"}}'
# Ответ: "A person walking through a sunlit park with oak trees..."
# Стоимость: 2–8 кредитов за клип
Шаг 4: AI Content Detection (специализированная модель, НЕ промпт)
curl -X POST https://geteh.ru/api/v1/generate \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model": "falcons-ai/nsfw_image_detection", "inputs": {"image": "https://storage.example.com/frame_001.jpg"}}'
# Ответ: {"safe": 0.97, "nsfw": 0.02, "violence": 0.01}
Шаг 5: Cosine Similarity и Re-Anchoring (на вашей стороне)
CLIP-эмбеддинги из шага 2 — стандартные 768-dim float32 вектора. Используйте cosine similarity в вашем vector DB:
-- pgvector: поиск похожих кадров
SELECT id, 1 - (embedding <=> query_embedding) AS similarity
FROM frames ORDER BY similarity DESC LIMIT 10;
Итоговая таблица: своё GPU vs Geteh API
| Задача | Заменяемо? | Как |
|---|---|---|
| CLIP embeddings (768-dim) | ✅ ДА | POST /v1/generate {model: "andreasjansson/clip-features"} |
| Shot detection (TransNetV2) | ✅ ДА | POST /v1/generate {model: "magpai-app/cog-scenedetect"} |
| VLM-анализ кадров | ✅ ДА | POST /v1/generate {model: "chenxwh/cogvlm2-video"} |
| AI content detection | ✅ ДА | POST /v1/generate {model: "falcons-ai/nsfw_image_detection"} |
| Cosine similarity / re-anchor | ✅ ДА | CLIP через Geteh → similarity на вашей стороне |
| Генерация изображений | ✅ ДА | /v1/generate или /v1/images/generate |
| Генерация видео | ✅ ДА | /v1/generate или /v1/video/generate |
| 3D-реконструкция | ✅ ДА | POST /v1/generate {model: "stability-ai/stable-fast-3d"} |
| Аудио сепарация | ✅ ДА | POST /v1/generate {model: "cjwbw/demucs"} |
| Транскрибация | ✅ ДА | POST /v1/generate {model: "openai/whisper"} |
Geteh покрывает все эти задачи через единый API. Pay-per-use: 500–5 000₽/мес вместо 15 000–150 000₽.
Попробуйте бесплатно — бесплатные кредиты на старте.