音声ベースの UPI 支払いプロンプト: 多様性を捉えて AI モデルを強化
Shaip の迅速な作成と多様なオーディオ録音に関する専門知識を活用して、高品質で文化的に多様なデータを使用して音声ベースの UPI 支払いシステムをサポートします。
プロジェクト概観
Shaip は大手フィンテック企業と提携し、多様な UPI 決済プロンプトを作成および録音して音声ベースの決済アプリケーションを開発しました。このプロジェクトでは、送金、送金依頼、残高照会、請求書の支払いなど、2,500 種類の決済関連の目的について、87,000 種類の固有のプロンプトと 13 種類の多様なプロンプトを作成しました。これらのプロンプトは、さまざまな地域、背景、年齢層の 200 人の話者によって 45 時間以上にわたって録音され、幅広い言語的および環境的多様性が確保されました。
このプロジェクトの目標は、現実世界の環境で UPI 支払いに関連する音声コマンドを認識して応答できる AI モデル用の高品質なトレーニング データを開発することでした。

主要統計
UPI 支払いプロンプトの音声録音時間
200
多様な背景(年齢、教育、地域)を持つ講演者
45
87,000以上の多様なプロンプトで、あらゆる意図をカバー
13
言語: 英語、さまざまな母国語(クマオニ語、ベンガル語、マラヤーラム語、グジャラート語、ヒンディー語、マラーティー語など)を話す講師
プロジェクト範囲
プロンプトの作成
範囲には、音声ベースの UPI 支払いシステム用の独自のプロンプトの作成が含まれていました。プロンプトは、構造、語彙、名前付きエンティティの多様性を確保しながら、複数の意図をカバーするように設計されました。いくつかの重要な側面は次のとおりです。
13 の主要な意図:
- 送金する: 65,653 のユニークで多様なプロンプト
- 残高照会: 3,052 プロンプト
- お金を要求します: 26,972 プロンプト
- 取引履歴、再チャージ、請求書の支払いなど。
オーディオレコーディング
信頼性と現実世界への適用性を保証するために、プロンプトはさまざまな言語的背景を持つ 45 人の話者によって録音されました。さまざまな母国語、地域の方言、環境 (屋内と屋外) を通じて捉えられた多様性は、トレーニング データの強化に役立ちました。
- 言語の多様性: ユーザーは英語が堪能ですが、クマオニ語、グジャラート語、ヒンディー語、ベンガル語、マラーティー語、マラヤーラム語など、さまざまな母国語を話します。
- 年齢、性別、学歴: データは幅広い人口統計を捉えました。
- 都市部と農村部のスピーカー: 実際の使用状況を反映するために、都市部と地方の両方の話者が対象となりました。
- 録音環境: 音声録音は屋内と屋外の両方の環境で行われ、さまざまな背景ノイズが収録されました。
課題
プロンプトがさまざまな地域の方言や話者の特徴を反映するようにするには、慎重な計画と実行が必要でした。
実際のアプリケーションでは、背景ノイズや環境条件 (屋内と屋外) の処理が重要でした。
さまざまな年齢層、教育的背景、農村部/都市部からの講演者が含まれるため、信頼できるデータを収集することが複雑になりました。
解決策
シャイプは、高度なNLP技術とプロンプトの作成と記録の両方における慎重な計画を実装することで、プロジェクトの課題に対処するソリューションを提供しました。
含まれるソリューション:
プロンプトの作成
- 2,500 それぞれ構造と語彙が多様化した独自のプロンプトが作成されました。
- 13 基本的な支払いリクエストから、取引履歴や請求書の支払いなどのより複雑な問い合わせに至るまで、あらゆる目的がカバーされました。
オーディオレコーディング
- 200時間 音声録音は 45ユーザー母国語、環境、話者の人口統計にわたる多様性を確保します。
- 自然な音声の変化を確保するために、屋内と屋外の両方の環境で録音しました。
- 講演者はさまざまな地域の方言を話し、正確な言語表現を確保しました。
意図 | 送信 | バランスのお問い合わせ | 金を要求する | トランザクション履歴 |
---|---|---|---|---|
プロンプト | 家賃としてスマトリに2100ドルを支払う | 普通預金口座の現在の残高を知りたいです。 | ラジさん、緊急用に318ルピーを頼んでいただけますか? | デビットカードの取引履歴を見せてください。 |
グジャラート語 | સુમાત્રીને ઘરના ભાડા પેટે એકવીસસો ચૂકવો | હું મારા બચત ખાતામાં મારી વર્તમાન બેલેન્સ જાપ વા માંગુ છું。 | શું તમે રાજી પાસેથી ઇમર્જન્સી માટે ત્રણસો અઢા何か? | どうぞ。 |
ヒンディー語 | ログイン して翻訳を追加するाभुगतानकरें | | 名前: 名前: 名前: 名前: 名前: 名前: 名前: 名前: 名前ाहता हूँ। | ログイン して翻訳を追加する何か? | ログイン して翻訳を追加する |
マラヤーラム語 | വീട്ടുവാടകയായി സുമത്രിക്ക് രണ്ടായത്തിഒരു ന്നൂറ് നൽകൂ。 | എൻ്റെ സേവിംഗ്സ് അക്കൗണ്ടിലെ നിലവിലെ തുക അറിയ ാൻ ഞാൻ ആഗ്രഹിക്കുന്നു。 | രാജിയോട് മുന്നൂറ്റി പതിനെട്ട് രൂപ അടിയന്തരാ何か? | よろしくお願いします。 |
テルグ語 | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్ల ించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాల ను తెలుసుకోవాలనుకుంటున్నాను。 | ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిది何か? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపి ంచండి。 |
ベンガル語 বাংলা | বাড়ি ভাড়ার জন্য সুমাত্রিকে ২১,০০০ টাকা পরিশ োধ করুন | আমি আমার সঞ্চয় অ্যাকাউন্টে ব্যালেন্ সজানতেচাই। | 重要な意味を持つ言葉どうですか? | আমার ডেবিট কার্ডের লেনদেনের ইতিহাস দেখান। |
マラーティー語 | सुमात्री ला घरा चे रेंट साठी दोन हजार एक संभर र ुपये चुकवा | 名前: 名前: 名前: 名前: 名前: 名前: 名前: 名前 | 名前: 名前: 名前: 名前: 名前: 名前: 名前: 名前: 名前:何か? | . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
アウトカム
Shaip が提供する高品質で多様な音声データにより、クライアントはさまざまな方言、環境、コンテキストでのコマンドを認識できる AI 駆動型の音声ベースの UPI 決済システムを開発することができました。このデータにより、以下の機能強化が実現しました。
- リアルタイム音声認識 複雑な環境でも。
- より正確なUPI取引 より幅広いユーザーに対応します。
- スケーラビリティ: このプロジェクトは、インドの他の言語への拡大に向けた強固な基盤を築きます。
成果
- 200時間 オーディオファイル(8 kHz PCM WAV 形式、モノラル)
- 87,000+ 独自の意図が注釈された多様なプロンプト
- メタデータ: 話者のプロフィール、環境の詳細、文字起こしの精度
Shaip は、ユニークなプロンプトと本物の音声録音を通じてインドの多様性を捉えることができ、当社の音声ベースの UPI 決済システムに革命をもたらしました。彼らのチームは、プロンプトの作成から録音の品質まで、プロジェクトのあらゆる側面が正確に処理されるようにし、より包括的で堅牢な音声認識モデルの構築を支援しました。