非構造化データ

非構造化データ

非構造化データとは、フリーテキスト、画像、ビデオ、オーディオなど、事前定義されたスキーマに従わない情報です。

目的

目的は、構造化されたテーブルでは表現できない複雑な現実世界の情報を取得することです。

重要性

  • 現在生成されるデータの大部分を表します。
  • ビジョン、音声、NLP における高度な AI アプリケーションを可能にします。
  • AIなしでは処理や分析が困難です。
  • ストレージとガバナンスの課題が発生します。

仕組み

  1. ソース (ソーシャル メディア、カメラ、センサー) から非構造化データを収集します。
  2. JSON、マルチメディア、生のログなどの形式で保存します。
  3. AI モデルを適用して意味を抽出します。
  4. 可能な場合は構造化された表現に変換します。
  5. 下流の分析と意思決定で使用します。

例(実世界)

  • トレンド分析に使用されるソーシャル メディアの投稿。
  • 診断のための医療画像。
  • カスタマー サポートのチャット ログ。

参考文献 / さらに読む

次のAIイニシアチブをどのように支援できるか教えてください。