AI & Machine Learning
カテゴリ概要
Azure の AI・機械学習サービスは、事前学習済みモデルを API として利用する「Azure AI Services」と、カスタムモデルの開発・運用を行う「Azure Machine Learning」の 2 層構造で提供されている。AWS では Rekognition、Comprehend、Transcribe 等が個別サービスとして存在するのに対し、Azure では「AI Services」ブランドの下に統合されている点が大きな違い。また、Azure OpenAI Service により OpenAI の最新モデルをエンタープライズ品質の SLA で利用できる点は、Azure 固有の強みである。
サービスマッピング一覧
| 機能 | AWS サービス | Azure サービス | 主な違い |
|---|---|---|---|
| LLM / 基盤モデル API | Amazon Bedrock | Azure OpenAI Service | Bedrock はマルチモデル、Azure OpenAI は OpenAI モデル専用 |
| ML プラットフォーム | SageMaker | Azure Machine Learning | Azure ML は MLflow ネイティブ統合が特徴 |
| 画像認識・分析 | Rekognition | Azure AI Vision | 類似機能。Azure は OCR も統合 |
| 音声認識 | Transcribe | Azure AI Speech(認識) | Azure は音声認識と合成を 1 サービスで提供 |
| 音声合成 | Polly | Azure AI Speech(合成) | 同上 |
| 自然言語処理 | Comprehend | Azure AI Language | 感情分析、エンティティ抽出、要約等 |
| 翻訳 | Translate | Azure AI Translator | 概念はほぼ同一 |
| チャットボット | Amazon Lex | Azure AI Bot Service | Bot Service は Bot Framework SDK と統合 |
| ドキュメント解析 | Textract | Azure AI Document Intelligence | 旧 Form Recognizer。構造化データ抽出 |
| 検索 + セマンティック | OpenSearch + Kendra | Azure AI Search | AI Search はベクトル検索 + セマンティックランキングを統合 |
主要サービス詳細
Azure OpenAI Service(AWS: Amazon Bedrock)
OpenAI のモデル(GPT-4、GPT-4o、o1 等)を Azure のインフラ上で利用できるフルマネージドサービス。
AWS エンジニアが知っておくべき違い:
- Bedrock は Claude(Anthropic)、Llama(Meta)、Mistral 等のマルチモデルプラットフォームだが、Azure OpenAI Service は OpenAI のモデルに特化している。OpenAI のモデルを Azure の SLA・コンプライアンス・ネットワークセキュリティ基盤上で利用できる唯一のサービスである
- Azure のプライベートエンドポイント、マネージド ID、VNet 統合により、エンタープライズ要件(データ主権、ネットワーク分離等)を満たしやすい
- Bedrock のナレッジベースに相当する機能として「Azure OpenAI on your data」があり、Azure AI Search や Blob Storage のデータを直接参照した RAG を構築できる
- プロビジョンドスループット(PTU)によるキャパシティ予約が可能で、レイテンシの安定性を確保できる
- コンテンツフィルタリングがデフォルトで有効になっており、エンタープライズ利用に適した安全性が組み込まれている
Azure Machine Learning(AWS: SageMaker)
機械学習モデルの開発、トレーニング、デプロイ、運用を行うエンドツーエンドの ML プラットフォーム。
AWS エンジニアが知っておくべき違い:
- SageMaker と機能的にほぼ同等(ノートブック、トレーニング、エンドポイント、パイプライン、モデルレジストリ)だが、MLflow とのネイティブ統合が Azure ML の大きな特徴。実験追跡やモデル管理を MLflow API で行える
- SageMaker Studio に相当する統合開発環境として Azure ML Studio が提供される
- マネージドエンドポイント(SageMaker エンドポイントに相当)でモデルをリアルタイム推論またはバッチ推論としてデプロイできる
- Azure ML パイプラインは SageMaker Pipelines に相当し、ML ワークフローの自動化を実現する
- Responsible AI ダッシュボードにより、モデルの公平性・解釈可能性・エラー分析を統合的に管理できる
Azure AI Vision(AWS: Rekognition)
画像・動画から情報を抽出する事前学習済みの画像認識サービス。
AWS エンジニアが知っておくべき違い:
- Rekognition と同様に物体検出、顔分析、シーン認識を提供するが、Azure AI Vision は OCR(光学文字認識)機能も統合されている(AWS では Textract が OCR を担当)
- カスタムビジョンモデルのトレーニングが可能で、少量のデータからドメイン固有の画像分類・物体検出モデルを構築できる(Rekognition Custom Labels に相当)
- Image Analysis 4.0 ではマルチモーダルモデル(Florence)を活用し、画像の自然言語によるキャプション生成やゼロショット分類が可能
- 空間分析(Spatial Analysis)機能で、動画内の人物の動線分析やゾーン滞在時間の計測ができる
Azure AI Speech(AWS: Transcribe + Polly)
音声認識(Speech-to-Text)と音声合成(Text-to-Speech)を 1 つのサービスで提供する。
AWS エンジニアが知っておくべき違い:
- AWS では Transcribe(音声認識)と Polly(音声合成)が別サービスだが、Azure では AI Speech として 1 サービスに統合されている
- リアルタイム音声認識、バッチ文字起こし、音声合成、音声翻訳、話者認識を同一サービス内で利用できる
- カスタムニューラル音声(Custom Neural Voice)により、ブランド固有の音声モデルを作成できる
- 発音評価(Pronunciation Assessment)機能があり、語学学習アプリケーション等に活用できる
- Speech Studio という GUI ベースのツールで、コードを書かずに音声機能のテストやカスタマイズができる
Azure AI Language(AWS: Comprehend)
テキストデータに対する自然言語処理(NLP)機能を提供するサービス。
AWS エンジニアが知っておくべき違い:
- Comprehend と同様に感情分析、エンティティ認識、キーフレーズ抽出を提供するが、Azure AI Language はこれらに加えて要約、質問応答、会話分析も統合している
- カスタムテキスト分類やカスタムエンティティ認識のトレーニングが可能(Comprehend Custom に相当)
- Conversational Language Understanding(CLU)は、旧 LUIS の後継で、会話における意図認識とエンティティ抽出を行う
- Orchestration Workflow により、CLU、質問応答、カスタム分類を 1 つのフローとして組み合わせられる
Azure AI Translator(AWS: Translate)
テキスト・ドキュメントの多言語翻訳を行うサービス。
AWS エンジニアが知っておくべき違い:
- AWS Translate と機能的にほぼ同等だが、Azure AI Translator はドキュメント翻訳(PDF、Word、HTML 等のファイル単位の翻訳)をネイティブにサポートしている
- カスタムトランスレーター(Custom Translator)により、業界固有の用語や文体を学習させた翻訳モデルを構築できる
- 翻訳メモリや用語集の登録が可能で、一貫性のある翻訳品質を維持できる
Azure AI Bot Service(AWS: Amazon Lex)
チャットボットの構築・管理・デプロイを行うサービス。
AWS エンジニアが知っておくべき違い:
- Lex が音声・テキストの会話インターフェース構築に特化しているのに対し、Bot Service は Bot Framework SDK と統合され、より柔軟なカスタムボット開発が可能
- Teams、Slack、Web Chat、LINE 等のマルチチャネルへのデプロイを標準でサポートしている
- Azure OpenAI Service と組み合わせることで、LLM ベースの高度な対話ボットを構築できる
- Power Virtual Agents(現 Copilot Studio)というローコードのボット構築ツールとも連携する
Azure AI Document Intelligence(AWS: Textract)
ドキュメントから構造化データを抽出するサービス。旧名称は Form Recognizer。
AWS エンジニアが知っておくべき違い:
- Textract と同様に、PDF・画像からテキスト、テーブル、キー・バリューペアを抽出するが、Azure AI Document Intelligence は**事前構築済みモデル(請求書、領収書、名刺、W-2 等)**のバリエーションが豊富
- カスタムモデルのトレーニングにより、業界固有のフォーマットに対応したデータ抽出モデルを構築できる
- ドキュメント分類機能があり、複数種類のドキュメントが混在する入力を自動的に分類してから適切なモデルで処理できる
- Document Intelligence Studio という GUI ツールでモデルのテスト・ラベリング・トレーニングが可能
Azure AI Search(AWS: OpenSearch + Kendra)
フルテキスト検索、ベクトル検索、セマンティックランキングを統合した検索サービス。旧名称は Azure Cognitive Search。
AWS エンジニアが知っておくべき違い:
- OpenSearch がオープンソースベースの検索・分析エンジンであるのに対し、AI Search は ベクトル検索 + セマンティックランキング + AI エンリッチメントを統合したクラウドネイティブの検索プラットフォーム
- RAG(Retrieval-Augmented Generation)パターンの構築に広く使われており、Azure OpenAI Service との統合が特にスムーズ
- AI エンリッチメントパイプラインにより、インデックス作成時に AI Services(OCR、エンティティ抽出、翻訳等)を自動適用してドキュメントを拡張できる
- Kendra のセマンティック検索機能と OpenSearch のフルテキスト検索機能を 1 つのサービスで提供するイメージ
- ハイブリッド検索(キーワード検索 + ベクトル検索の組み合わせ)をネイティブにサポートしている
AWS との主要な違い
AI Services の統合ブランド vs 個別サービス
AWS では画像認識(Rekognition)、音声認識(Transcribe)、音声合成(Polly)、自然言語処理(Comprehend)、翻訳(Translate)、ドキュメント解析(Textract)がそれぞれ独立したサービスとして提供されている。Azure ではこれらが「Azure AI Services」(旧 Cognitive Services)というブランドの下に統合されており、1 つの Azure AI Services リソースから複数の機能にアクセスできるマルチサービスリソースも利用可能。課金やアクセスキーの管理がシンプルになる一方、個々のサービスの独立性は AWS のほうが明確。
LLM 提供モデルの違い
Azure OpenAI Service は OpenAI のモデル(GPT-4、GPT-4o、o1 等)に特化しており、OpenAI との独占パートナーシップに基づいている。一方、Amazon Bedrock は Claude(Anthropic)、Llama(Meta)、Mistral、Titan(Amazon)等のマルチモデルプラットフォームを志向している。組織のモデル選定方針に応じて、OpenAI モデルに集中するなら Azure、複数モデルを比較・切り替えたいなら AWS という選択になる。
RAG アーキテクチャの構築容易性
Azure では「Azure OpenAI Service + AI Search + Blob Storage」の組み合わせで RAG パターンを構築するのが標準的なアプローチとなっている。AI Search のベクトル検索 + セマンティックランキング、Azure OpenAI の「on your data」機能、AI Search のインデクサーによる自動インデックス更新が連携し、比較的少ない開発工数で RAG を構築できる。AWS では Bedrock Knowledge Bases + OpenSearch Serverless が近い構成だが、Azure のほうがコンポーネント間の統合が密で、初期構築は容易な傾向がある。
ML プラットフォームにおける MLflow の位置づけ
Azure Machine Learning は MLflow をネイティブにサポートしており、実験追跡、モデルレジストリ、デプロイメントを MLflow API で行える。SageMaker も MLflow をサポートしているが、Azure ML のほうが統合の深さが上回る。既に MLflow を使っているチームが Azure に移行する場合、既存のコードやワークフローの移行が比較的スムーズに行える。
サービス選定の指針
| ユースケース | AWS での選択肢 | Azure での選択肢 |
|---|---|---|
| LLM(GPT-4 系)の API 利用 | Bedrock(マルチモデル) | Azure OpenAI Service |
| RAG パターンの構築 | Bedrock Knowledge Bases + OpenSearch | Azure OpenAI + AI Search |
| カスタム ML モデルの開発・運用 | SageMaker | Azure Machine Learning |
| 画像認識・物体検出 | Rekognition | Azure AI Vision |
| 音声認識(Speech-to-Text) | Transcribe | Azure AI Speech |
| 音声合成(Text-to-Speech) | Polly | Azure AI Speech |
| テキスト感情分析・エンティティ抽出 | Comprehend | Azure AI Language |
| ドキュメントからのデータ抽出 | Textract | Azure AI Document Intelligence |
| 多言語翻訳 | Translate | Azure AI Translator |
| チャットボット構築 | Lex | Azure AI Bot Service |
| セマンティック検索・ベクトル検索 | OpenSearch + Kendra | Azure AI Search |