Облачные API Cognitive Services
Cognitive Services (термин Microsoft) обобщает готовые модели в облаке: вы отправляете изображение, аудио или текст по HTTPS и получаете JSON с результатом — без обучения своей нейросети и без GPU в своём ЦОД. Аналоги у Amazon (Rekognition, Transcribe, Comprehend), Google (Cloud Vision, Speech-to-Text, Natural Language API). Принципы интеграции те же, что у REST API.
Когда нужна полная кастомизация — см. Scikit-learn, Keras и распознавание своими моделями.
Зачем облачный API
| Плюс | Минус |
|---|---|
| MVP за часы | Зависимость от провайдера и региона |
| Масштаб без своего MLOps | Стоимость при миллионах вызовов |
| Обновление модели на стороне вендора | Данные уходят в облако (комплаенс) |
| SDK на Python, C#, Java, REST | Лимиты квот и rate limit |
Типичные сценарии: модерация контента, OCR счетов, субтитры к видео, теги на фото в каталоге, чат-бот с Azure OpenAI / Bedrock поверх тех же учётных записей.
Карта сервисов по задачам
| Задача | Microsoft Azure | Amazon Web Services | Google Cloud |
|---|---|---|---|
| Анализ изображения | Azure AI Vision | Rekognition | Cloud Vision API |
| Лица | Vision (Face) | Rekognition Faces | Vision (face detection) |
| OCR / документы | Document Intelligence | Textract | Document AI |
| Речь → текст | Speech to Text | Transcribe | Speech-to-Text |
| Текст → речь | Speech (TTS) | Polly | Text-to-Speech |
| Язык, NER, тон | Language service | Comprehend | Natural Language API |
| Перевод | Translator | Translate | Cloud Translation |
| LLM / чат | Azure OpenAI Service | Bedrock | Vertex AI (Gemini) |
Названия продуктов меняются (ранее «Cognitive Services» часто объединяют в Azure AI services); в документации провайдера смотрите актуальный endpoint и версию API.
Общая схема вызова
- Создать ресурс в портале (Azure, AWS, GCP).
- Получить ключ и endpoint (или IAM-роль для AWS).
- Вызывать REST или официальный SDK.
- Логировать
request-id, обрабатывать 429 (throttling) и 5xx с retry.
Секреты — в переменных окружения или Key Vault, не в репозитории.
Пример — Azure AI Vision (анализ изображения)
# pip install azure-ai-vision-imageanalysis
import os
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential
endpoint = os.environ["VISION_ENDPOINT"]
key = os.environ["VISION_KEY"]
client = ImageAnalysisClient(
endpoint=endpoint,
credential=AzureKeyCredential(key),
)
with open("photo.jpg", "rb") as f:
result = client.analyze(
image_data=f.read(),
visual_features=[
VisualFeatures.CAPTION,
VisualFeatures.TAGS,
VisualFeatures.OBJECTS,
],
language="en",
)
if result.caption:
print(result.caption.text)
for tag in (result.tags.list if result.tags else []):
print(tag.name, tag.confidence)
Ответ может включать подпись кадра, теги, рамки объектов — пересекается с задачами из Распознавание лиц, объектов и текста.
Пример — AWS Rekognition (детекция лиц)
import boto3
client = boto3.client("rekognition", region_name="eu-central-1")
with open("photo.jpg", "rb") as f:
response = client.detect_faces(Image={"Bytes": f.read()}, Attributes=["DEFAULT"])
for face in response["FaceDetails"]:
box = face["BoundingBox"]
print(box["Width"], box["Height"], face["Confidence"])
Для сравнения лиц — CompareFaces; для коллекций — IndexFaces + SearchFacesByImage.
Пример — Google Cloud Vision (OCR)
from google.cloud import vision
client = vision.ImageAnnotatorClient()
with open("scan.png", "rb") as f:
image = vision.Image(content=f.read())
response = client.text_detection(image=image)
for text in response.text_annotations:
print(text.description)
break
Аутентификация — сервисный аккаунт JSON или Workload Identity в GKE.
LLM поверх того же облака
Чат и генерация текста часто идут отдельным продуктом:
- Azure OpenAI — GPT-модели с enterprise SLA;
- Amazon Bedrock — Claude, Llama и др.;
- Vertex AI — Gemini.
Архитектура агентов и RAG — Семь слоёв LLM-стека, агенты ИИ. Cognitive API для зрения/речи можно комбинировать с LLM: OCR → текст → промпт в GPT.
Безопасность и эксплуатация
- PII на изображениях и в транскриптах — минимизировать хранение, шифрование, договор DPA с провайдером.
- Регион данных (EU, РФ) — выбирать endpoint в нужной юрисдикции.
- Квоты — мониторинг в портале, алерты на 429.
- Версионирование API — фиксировать версию в URL, тестировать при обновлении вендора.
Корпоративный контекст Microsoft — как IT видят облака; DevOps и CI для ML — MLOps в DevOps.
Когда уходить с API на свою модель
Облако перестаёт быть выгодным, если:
- стабильно > миллионов вызовов в месяц при предсказуемой нагрузке;
- нужен офлайн или закрытый контур без egress;
- домен сильно отличается от публичных моделей (узкая медицинская визуализация, редкий язык).
Тогда — transfer learning, деплой ONNX/TFLite, собственный endpoint за API Gateway.
См. также
Другие статьи этого же раздела в боковом меню (как на странице "О разделе"). Результатом аналитической работы становится техническое задание или архитектурное решение, которое служит основой для дальнейшей разработки. Развертывание собственной модели искусственного интеллекта — это комплексный процесс, охватывающий подготовку модели, выбор инфраструктуры, настройку API, обеспечение масштабируемости и мониторинга. Интеграция модели в код требует проектирования надёжного клиентского слоя, обработки граничных случаев и соответствия архитектурным требованиям приложения. Если используется только CPU, вся модель загружается в оперативную память. При использовании GPU часть весов может храниться в видеопамяти. Интеграция искусственного интеллекта — это процесс внедрения технологий машинного обучения, нейронных сетей или больших языковых моделей (LLM) в структуру веб-сайтов и веб-приложений для. Сборка логики и интерфейса через AI-конструкторы, no-code/low-code и агентов — границы, стек и путь до деплоя на сервер. Каркас из семи уровней — от источников данных до прикладных продуктов — для проектирования, разработки и масштабирования систем на больших языковых моделях. Краткие итоги раздела "Разработка ИИ" — данные, обучение, инференс, деплой и семь слоёв LLM-стека. Чек-лист раздела «Разработка ИИ» — вопросы для самопроверки.Основы разработки ИИ-решений
Развёртывание и обслуживание ИИ-моделей
Интеграция ИИ-моделей в приложения на Python
Работа с ИИ-моделями
Интеграция ИИ в веб-приложения
Цифровые инструменты без ручного кодинга
Семь слоёв LLM-стека
Разработка ИИ — итоги
Разработка ИИ — чек-лист