コース: Microsoft Azure AIの基礎知識:Azureでのワークロードと機械学習

コンピュータービジョンの概要

コース: Microsoft Azure AIの基礎知識:Azureでのワークロードと機械学習

コンピュータービジョンの概要

コンピュータービジョンは、 カメラ、動画、画像などの 視覚データを理解できる AI の分野です。 コンピュータービジョンの 代表的なタスクには、 画像分類があります。 これは、画像を内容に基づいて 分類するものです。 例えば、交通システムでは、 タクシー、バス、自転車などの 車両を識別するために活用されています。 画像分析では、さらに進化し、 説明文を生成したり、 情報を抽出したりします。 この技術は、 視覚障害者向けのアプリで役立ち、 写真の説明を通じて、 周囲の状況を理解する手助けをしています。 オブジェクト検出は、 境界ボックスを使用して、 画像内の物体を 識別および位置を特定する技術です。 例えば交通システムでは、 異なる車両タイプを検出したり、 工場では、プロダクションライン上の 欠陥を発見することが可能です。 顔検出と顔認識は、 人の顔を特定し、分析した上で、 データベースと照合する技術です。 これより、 建物のアクセス制御を目的とした セキュリティシステムや、 金融分野でのセーフ ID による 身元確認などに利用されています。 光学文字認識 OCR は、 画像から文字を抽出し、 請求書やフォームなどの スキャンされたドキュメントから、 データ入力を自動化する技術です。 ビデオ分析は、 動画内で人や物を追跡し、 店舗での顧客行動などの洞察を提供します。 小売業者は、これを活用して 訪問者の動きを追跡し、 店舗レイアウトを最適化し、 商品の配置を改善できます。 また、交通管理や顧客追跡など、 多くの分野で コンピュータビジョンは役立っています。

目次