データセットを開く

MLモデルをトレーニングするためのオープンソースデータセットを見つけましょう

データセットを開く

AI / MLモデルを使い始めるためのオープンソースデータセット

AIとMLモデルの出力は、トレーニングに使用するデータと同じくらい優れているため、データの集計とそのデータのタグ付けと識別に適用する精度が重要です。

したがって、新しいAI / MLイニシアチブを開始したい場合、高品質のデータセットがAI /を維持するための燃料であるため、高品質のトレーニングデータを見つけることがプロジェクトのより困難な側面のXNUMXつであることにすぐに気付きます。 MLエンジンが実行されています。 将来のAI / MLモデルを無料で使用し、トレーニングできるオープンデータセットのリストを蓄積しました。

専門化 Data Type データセット名 産業/部門 注釈/ユースケース リンク
+NLP テキスト Amazonのレビュー E-コマース 感情分析 リンク
+NLP テキスト ウィキペディアリンクデータ 全般 リンク
+NLP テキスト スタンドフォードセンチメントツリーバンク エンターテインメント 感情分析 リンク
+NLP テキスト 米航空会社のセンチメント 航空会社 感情分析 リンク
+CV 画像 イメージネット 全般 リンク
+CV 画像 Googleのオープン画像 全般 リンク
+NLP テキスト コーネル映画のセリフ エンターテインメント ダイアログ リンク
+NLP テキスト マルコさん 全般 質問応答 リンク
+NLP テキスト 自然な質問データセット 全般 質問応答 リンク
+NLP テキスト DBペディア 全般 知識グラフ リンク
+NLP テキスト ヤゴ 全般 知識グラフ リンク
+NLP テキスト フリーベース 全般 知識グラフ リンク
+NLP テキスト オントノーツ 全般 意味的役割ラベル付け リンク
+NLP テキスト 2003年CoNLL 全般 名前付きエンティティの認識 リンク
+CV 画像 COCO 全般 オブジェクト検出 リンク
+CV 画像 パスカルVOC 全般 オブジェクト検出 リンク
+CV 画像 街並み 自動運転 セマンティックセグメンテーション リンク
+CV 画像 MNIST 全般 数字の分類 リンク
+CV 画像 ファッション-MNIST 小売商 画像分類 リンク
+NLP オーディオ Libriスピーチ 全般 ASR リンク
+NLP オーディオ テッド・リウム 全般 ASR リンク
+NLP オーディオ ティミット 全般 音素認識 リンク
+NLP オーディオ 一般的な声 全般 ASR リンク
+NLP オーディオ ヴォックスセレブ 全般 話者認識 リンク
+NLP テキスト Wikipedia ダンプ 全般 言語モデリング リンク
+NLP テキスト ギガワード ニュース 言語モデリング リンク
+NLP テキスト IMDBレビュー エンターテインメント 感情分析 リンク
+CV ビデオ キネティクス-700 全般 行動認識 リンク
+CV ビデオ UCF101 全般 行動認識 リンク
+CV ビデオ HMDB51 全般 行動認識 リンク
+CV 画像 CASIA-WebFace 全般 顔認識 リンク
+NLP テキスト スクワッド 全般 読解 リンク
+NLP テキスト マルチNLI 全般 自然言語推論 リンク
+NLP テキスト SNLI 全般 自然言語推論 リンク
+CV 画像 オックスフォードフラワーズ102 植物学 細粒度分類 リンク
+CV 画像 CIFAR-10 全般 画像分類 リンク
+CV 画像 CIFAR-100 全般 画像分類 リンク
+CV 画像 VOC担当者レイアウト 全般 ポーズ推定 リンク
+CV 画像 MPII ヒューマンポーズ 全般 ポーズ推定 リンク
+NLP テキスト 20 のニュースグループ 全般 テキスト分類 リンク