Arābu datu kopa

مجموعة البيانات العربية

Augstas kvalitātes arābu valodas vispārīgā saruna un teksta pārveidošana runā (TTS) mākslīgajam intelektam un runas modeļiem

Pārskats

Nosaukums (valoda)

Arābu valodas datu kopa

Datu kopu veidi

Zvanu centrs, vispārīga saruna, mūzika, scenārija monologs

Valsts

arābu

Apraksts

Šajā datu kopā ir iekļautas neskriptētas sintētiskās aģenta un klienta telefona sarunas (5–15 minūtes), dabiskas cilvēku savstarpējās telefona sarunas Persijas līča arābu valodā (15–60 minūtes) un dziedāšanas audio ieraksti ar transkripcijām, nodrošinot daudzveidīgus runas datus runas un valodas tehnoloģiju apmācībai un novērtēšanai.

Izmantot gadījumu

ASR, virtuālais palīgs, tērzēšanas robots, sarunvalodas AI, runas analīze, TTS, valodu modelēšana

Datu kopas informācija

Datu kopas veids Paraugu ņemšana Rate skaļruņi kanāls Kopējās stundas Kopējais runātāju skaits
Zvanu centrs 8 kHz 2. Skaļruņi Dual 62:52:19 Pēc pieprasījuma
Zvanu centrs 8 kHz 2. Skaļruņi Mono 1,025:09:19 Pēc pieprasījuma
Vispārēja saruna 8 kHz 2. Skaļruņi Dual 254:16:34 626
mūzika 48 kHz Viens skaļrunis Mono 03:17:21 10
Skripts monologs 48 kHz Viens skaļrunis Mono 4,249:00:00 2,125
Skripts monologs 24 kHz Viens skaļrunis Mono 2,300:00:00 Pēc pieprasījuma

Piedāvātie klienti

Pilnvarot komandas veidot pasaulē vadošos AI produktus.

Shaip sazinieties ar mums

Vai nevarat atrast to, ko meklējat?

Tiek apkopotas jaunas gatavas datu kopas par visiem datu veidiem

Sazinieties ar mums tūlīt, lai atbrīvotos no audio/runas apmācības datu vākšanas raizēm

  • Šis lauks ir vērtēšanas mērķiem un jāatstāj nemainīga.
  • Reģistrējoties piekrītu Šaipam Privātuma Politika un Noteikumi un nosacījumi un sniedzu manu piekrišanu B2B mārketinga paziņojumu saņemšanai no Shaip.