Huduma Zaidi Zinazoaminika za Kukusanya Data ya Matamshi kwa AI yako
Treni mifano yako ya NLP, VAs, prototypes za TTS, na zaidi na data bora ya mazungumzo, na huduma zetu za ukusanyaji wa data ya sauti na hotuba.
Gundua mabomba ya data ya sauti bila vikwazo
Wateja Walioangaziwa
Huduma za Kitaalam za Ukusanyaji Data ya Sauti/Sauti
Mada yoyote. Hali yoyote.
Huku Shaip, utaalam wetu upo katika kuunda hifadhidata za usemi za ubora wa juu zilizoundwa kwa mahitaji mbalimbali ya AI/ML. Tunatoa anuwai kubwa ya lugha na kurekodi katika mipangilio tofauti na kufanya seti zetu za data ziwe pana na zinazoweza kubadilika. OLengo lako ni kulisha miundo yenye kiwango cha juu zaidi cha data maalum ya matamshi, kwa muda mfupi iwezekanavyo. Ukiwa nasi, unaweza kutarajia:
- Data ya ubora wa juu ya sauti nyingi / sauti ili kuboresha usahihi
- Kiwango cha juu kinachowezekana cha umaalumu wa kikoa kwa target scenario mbalimbali kuanzisha
- Kadiria muundo wako wa ML ili kuendana na demografia na wima tofauti
- Mazingira ya Kurekodi: Ubora wa Studio, inayoangazia sauti safi na kelele ndogo ya chinichini, & Mazingira ya Asili, ambapo rekodi hujumuisha sauti tulivu ili kuiga hali halisi za ulimwengu.
100 +
55K +
Saa za Data ya Hotuba
250 +
Miradi
60 +
Lugha (100+ lahaja)
8 / 16 / 44 / 48 kHz
Kiwango cha sampuli
Utaalamu wetu
Pangilia Data ya Sauti kwa Miundo Mahiri ya NLP
Shaip inatoa huduma za ukusanyaji wa mwisho-mwisho hadi mwisho katika lugha zaidi ya 100 + kuwezesha teknolojia zinazowezeshwa na sauti kuhudumia seti anuwai ya watazamaji kote ulimwenguni. Tunaweza kufanya kazi kwenye miradi ya upeo wowote na saizi; kutoka kwa kutoa leseni za data zilizopo kwenye rafu, kudhibiti ukusanyaji wa data ya sauti, hadi kunakili sauti na ufafanuzi. Haijalishi mradi wako wa ukusanyaji wa data ya hotuba ni mkubwa kiasi gani, tunaweza kubadilisha huduma za ukusanyaji wa sauti ili kukidhi mahitaji yako ya kujenga hifadhidata za hali ya juu za NLP ambazo zinalenga lahaja, tani na lugha. Chagua kutoka kwa hifadhidata nyingi za matamshi na rasilimali za ukusanyaji wa data za sauti, kwa usanidi wa sauti unaowezesha sauti.
Maneno ya Monologue & Hotuba ya Papo Hapo
Inalenga katika kuchakata hotuba kutoka kwa mzungumzaji mmoja. Tumia vidokezo vilivyoandikwa ili kuingiza faili za sauti za kituo kimoja, kuhakikisha kunaswa kwa mifumo ya kipekee ya matamshi, toni na nuances maalum kwa mtu huyo.
Mazungumzo Yenye Hati na Hotuba ya Papo Hapo
Mwingiliano wa watu wawili, kunakili mazungumzo ya ulimwengu halisi na midahalo yenye udhihirisho wa lugha nyingi kupitia faili za idhaa mbili na rasilimali zilizonakiliwa.
Kikundi/Chama cha Waasi
Majadiliano
Majadiliano ya watu wengi, kunasa mienendo ya kikundi, mwingiliano, na toni tofauti ili kutoa mafunzo kwa usahihi miundo ya usemi.
Wake-word / Mkusanyiko wa Maneno Muhimu / Matamshi
Funza AI kutambua vishazi muhimu au maneno yake au matamshi yenye maana sawa kwa kutumia matamshi mbalimbali, tajiri na halisi kwa ajili ya kuchakata na kuelewana kwa lugha asilia.
Takwimu za Acoustic
mkusanyiko
Tunaweza kurekodi kitaalamu data ya sauti ya ubora wa studio iwe migahawa, ofisi au nyumba au kutoka katika mazingira na lugha mbalimbali, huku tukishughulikia anuwai ya sauti ya sauti (Comprehensive Sound Datasets).
Utambuzi wa Hotuba Moja kwa Moja (ASR)
Boresha usahihi wa mifumo yako ya utambuzi wa matamshi otomatiki (ASR) kwa kupata hifadhidata ya hali ya juu ya usemi/sauti mseto, kutoka kwa safu mbalimbali za demografia.
Data ya Mafunzo ya Usemi/Sauti kwa Lugha nyingi
Wataalamu wetu wenye ujuzi wa lugha, kote ulimwenguni hutoa data ya sauti/hotuba ya lugha nyingi katika lugha na lahaja mbalimbali. Jitihada hii inakuza mawasiliano ya kimataifa na kuunganisha vizuizi vya lugha, na kuchangia katika masuluhisho ya AI yanayojumuisha zaidi na madhubuti.
Nakala-kwa-Hotuba
(TTS)
Unda muundo wa maandishi-kwa-hotuba (TTS) wa lugha nyingi kwa usaidizi wa wafanyakazi wetu wa kimataifa, ambao hukusaidia kukusanya data ya usemi katika lugha 150+ na lahaja ili kuboresha miundo yako ya AI kutoka kwa vidhibiti vya ndani ya gari hadi chatbots na suluhu za kujifunza kwa kutumia kiwango cha juu cha- data ya sauti ya ubora.
Kituo cha simu
Majadiliano
Mabadilishano ya kweli kati ya mawakala na wateja, yanayotumia lugha nyingi kama vile Kihispania, Kijerumani, Kiingereza cha Marekani, Kibengali, Kijapani, Kichina na Kihindi.
Mafanikio Stories
Seti za data za mazungumzo za AI zilizo na data ya zaidi ya saa 3k katika lugha 8
Kutafuta kuunda jukwaa la lugha nyingi kwa lugha za Kihindi, mteja alishirikiana na Shaip kukusanya, kugawanya na kunakili seti kubwa za data katika lugha nyingi za Kihindi. Hili lingesaidia kutengeneza miundo bora ya usemi ambayo inaweza kuwezesha jukwaa jipya la mteja.
Tatizo: Zaidi ya saa 3,000 za data ya sauti iliyokusanywa katika lugha 8 za Kihindi, iliyogawanywa na kunukuliwa ili kuendeleza utambuzi wa matamshi otomatiki.
Ufumbuzi: Tulitoa ukusanyaji wa data, sehemu, unukuzi na kuwasilisha faili za JSON zenye metadata. Tulikusanya saa 3000 za data ya sauti katika lugha 8 za Kihindi kwa kiwango cha mradi wa teknolojia ya matamshi ya mteja.
Sababu za kuchagua Shaip kama Mshirika wako wa Ukusanyaji wa Takwimu za Kuaminika
Watu
Timu zilizojitolea na zilizofunzwa:
- Washirika 30,000+ wa Uundaji wa Takwimu, Kuweka alama na QA
- Timu ya Usimamizi wa Miradi iliyojulikana
- Timu ya Ustawi wa Bidhaa
- Kipaji cha Bwawa la Talanta na Timu ya Kupanda
Mchakato
Ufanisi zaidi wa mchakato umehakikishiwa na:
- Mchakato wa Robust 6 Sigma-Stage-Gate
- Timu iliyojitolea ya mikanda nyeusi 6 ya Sigma - Wamiliki wa mchakato muhimu na uzingatiaji wa Ubora
- Uboreshaji unaoendelea na Kitanzi cha Maoni
Jukwaa
Jukwaa lenye hati miliki linapeana faida:
- Jukwaa la mwisho-mwisho-msingi wa wavuti
- Ubora usiofaa
- TAT ya haraka
- Uwasilishaji usio na mshono
Watu
Timu zilizojitolea na zilizofunzwa:
- Washirika 30,000+ wa Uundaji wa Takwimu, Kuweka alama na QA
- Timu ya Usimamizi wa Miradi iliyojulikana
- Timu ya Ustawi wa Bidhaa
- Kipaji cha Bwawa la Talanta na Timu ya Kupanda
Mchakato
Ufanisi zaidi wa mchakato umehakikishiwa na:
- Mchakato wa Robust 6 Sigma-Stage-Gate
- Timu iliyojitolea ya mikanda nyeusi 6 ya Sigma - Wamiliki wa mchakato muhimu na uzingatiaji wa Ubora
- Uboreshaji unaoendelea na Kitanzi cha Maoni
Jukwaa
Jukwaa lenye hati miliki linapeana faida:
- Jukwaa la mwisho-mwisho-msingi wa wavuti
- Ubora usiofaa
- TAT ya haraka
- Uwasilishaji usio na mshono
Seti za Data ya Sauti/Matamshi ya Nje ya Rafu
Maelezo | Kitambulisho cha Corpus (Kipekee) | Keyword | Seti ya Data ya Lugha | Msimbo wa lugha | Kiwango cha Mfano | Aina ya Seti ya Data | Jumla ya Saa za Sauti | Short Description | Maelezo ya Seti ya Data | Kituo cha Sauti | Jukwaa la Kurekodi | WER (%) | Audio Format | Umbizo la Unukuzi | Tumia Uchunguzi | Idadi ya Spika | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York English_GC_8 | New York Kiingereza | New York Kiingereza | en_US | 8 kHz | Mazungumzo ya Jumla | 107 | Data ya Mazungumzo ya Kiingereza ya New York | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 118, Mwanaume 114, Haijulikani 0 | Wasiliana nasi | |
Kirusi_SM_48 | russian | russian | ru-RU | 48 kHz | Monologue iliyoandikwa | 2,398 | Monologue ya Hati ya Kirusi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1689 Mwanaume 1937 Haijulikani 214 | Wasiliana nasi | |
Punjabi_MA | punjabi | Kipunjabi (Katika Bomba) | punjabi | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kipunjabi (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Punjabi_GC | punjabi | Kipunjabi (Katika Bomba) | punjabi | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Kipunjabi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Punjabi_CC_8 | punjabi | Kipunjabi (Katika Bomba) | punjabi | Kituo cha simu | 60 | Data ya Kipunjabi (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Polandi ya Poland_SM_48 | Kipolishi (Poland) | Kipolishi (Poland) | pl-PL | 48 kHz | Monologue iliyoandikwa | 1,482 | Polandi ya Kipolishi - Monologue iliyoandikwa | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1324 Mwanaume 701 Haijulikani 24 | Wasiliana nasi | |
Kipolandi_MA_16 | Kipolandi | Kipolandi | sw_PL | 16 kHz | Sauti ya Vyombo vya habari | 269 | Sauti ya Kipolandi Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 173 Mwanaume 354 Haijulikani 6 | Wasiliana nasi | |
Oriya_MA | Kioriya | Oriya (Katika Bomba) | au_IN | Sauti ya Vyombo vya habari | 40 | Oriya (In Pipeline) Data ya sauti ya media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Oriya_GC | Kioriya | Oriya (Katika Bomba) | au_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Oriya (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Oriya_CC_8 | Kioriya | Oriya (Katika Bomba) | au_IN | Kituo cha simu | 60 | Data ya Oriya (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
New Zealand_MA_16 | New Zealand Kiingereza | New Zealand Kiingereza | sw_NZ | 16 kHz | Sauti ya Vyombo vya habari | 400 | Sauti ya New Zealand English Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 367, kiume 678, Haijulikani 26 | Wasiliana nasi | |
New Zealand_GC_8 | New Zealand Kiingereza | New Zealand Kiingereza | sw_NZ | 8 kHz | Mazungumzo ya Jumla | 148 | Data ya Mazungumzo ya Kiingereza ya New Zealand | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 167, kiume 121, Haijulikani 4 | Wasiliana nasi | |
New York English_MA_16 | New York Kiingereza | New York Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 140 | Data ya sauti ya New York English Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 66, Mwanaume 230, Haijulikani 11 | Wasiliana nasi | |
Scottish_GC_8 | Kiskoti (Lafudhi ya Kiingereza) | Kiskoti (Lafudhi ya Kiingereza) | sw_AB | 8 kHz | Mazungumzo ya Jumla | 292 | Data ya Mazungumzo ya Jumla ya Uskoti | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 285 , Mwanaume 260, Haijulikani 3 | Wasiliana nasi | |
New York English_CC_8 | New York Kiingereza | New York Kiingereza | en_US | 8 kHz | Kituo cha simu | 103 | Data ya kituo cha simu cha New York English | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 610, Mwanaume 532, Hajui 0 | Wasiliana nasi | |
Uholanzi_SM_48 | dutch | dutch | nl-NL | 48 kHz | Monologue iliyoandikwa | 1,205 | Monologue ya Hati ya Uholanzi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1285 Mwanaume 531 Haijulikani 3 | Wasiliana nasi | |
Meksiko_SM_48 | Kihispania (Mexico) | Kihispania (Mexico) | es-MX | 48 kHz | Monologue iliyoandikwa | 1,492 | Monologue ya Maandishi ya Kihispania ya Meksiko | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1016 Mwanaume 1069 Haijulikani 95 | Wasiliana nasi | |
Marathi_MA | Marathi | Kimarathi (Katika Bomba) | mr_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kimarathi (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Marathi_GC | Marathi | Kimarathi (Katika Bomba) | mr_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kimarathi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Marathi_CC_8 | Marathi | Kimarathi (Katika Bomba) | mr_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Marathi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalayalam_MA | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kimalayalam (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalayalam_GC | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kimalayalam (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalayalam_CC_8 | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Kimalayalam (Katika Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalei_MA_16 | malay | malay | ms_MY | 16 kHz | Sauti ya Vyombo vya habari | 344 | Data ya sauti ya Media ya Malay | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 236, Mwanaume 626, Hajulikani 47 | Wasiliana nasi | |
Kimalei_GC_8 | malay | malay | ms_MY | 8 kHz | Mazungumzo ya Jumla | 266 | Data ya Mazungumzo ya Jumla ya Kimalesia | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kimalesia nchini Malaysia | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 316, Mwanaume 176 , Haijulikani 0 | Wasiliana nasi | |
Kitelugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Mazungumzo ya Jumla | 553 | Data ya Mazungumzo ya Jumla ya Kitelugu | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 574 , Mwanaume 564, Haijulikani 0 | Wasiliana nasi | |
Kiingereza cha Uingereza_WW_16 | Kiingereza cha Uingereza | Kiingereza cha Uingereza | sw_uk | 16 kHz | Omba Neno | 200 Spika | Wake Neno Uingereza Kiingereza | misemo muhimu ukusanyaji wa data
| 1 channel | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Jinsia: 50% wanaume, 50% wanawake, +/- 10%. | Wasiliana nasi | |
Kiwelsh_GC_8 | Kiwelisi (Lafudhi ya Kiingereza) | Kiwelisi (Lafudhi ya Kiingereza) | sw_WL | 8 kHz | Mazungumzo ya Jumla | 278 | Data ya Mazungumzo ya Jumla ya Wales | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 270, Mwanaume 324, Haijulikani 0 | Wasiliana nasi | |
Kivietinamu_MA_16 | vietnamese | vietnamese | vi_VN | 16 kHz | Sauti ya Vyombo vya habari | 257 | Data ya sauti ya Vyombo vya habari vya Kivietinamu | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 249, kiume 200, Haijulikani 45 | Wasiliana nasi | |
Kivietinamu_GC_8 | vietnamese | vietnamese | vi_VN | 8 kHz | Mazungumzo ya Jumla | 295 | Data ya Mazungumzo ya Jumla ya Kivietinamu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, Kaskazini (km, Hanoi), Kati, na Kusini (km, Ho Chi Minh City). | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 400, kiume 380, Haijulikani 2 | Wasiliana nasi | |
Uturuki ya Uturuki_SM_48 | Kituruki Uturuki | Kituruki Uturuki | tr-TR | 48 kHz | Monologue iliyoandikwa | 2,027 | Kituruki Uturuki | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1561 Mwanaume 1241 Haijulikani 31 | Wasiliana nasi | |
Thai_MA_8 | thai | thai | th_TH | 16 kHz | Sauti ya Vyombo vya habari | 173 | Sauti ya Thai Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 143, Mwanaume 502, Haijulikani 26 | Wasiliana nasi | |
Thai_GC_8 | thai | thai | th_TH | 8 kHz | Mazungumzo ya Jumla | 183 | Mazungumzo ya Jumla ya Thai | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Rejesta isiyo rasmi inayotumiwa kati ya marafiki | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 338, Mwanaume 96, Haijulikani 8 | Wasiliana nasi | |
Kitelugu_MA | telugu | Kitelugu (Katika Bomba) | te_IN | Sauti ya Vyombo vya habari | 20 | Data ya sauti ya Kitelugu (In Pipeline) | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_GC | telugu | Kitelugu (Katika Bomba) | te_IN | Mazungumzo ya Jumla | 50 | Data ya Mazungumzo ya Jumla ya Kitelugu (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_CC_8 | telugu | Kitelugu (Katika Bomba) | te_IN | Kituo cha simu | 30 | Data ya Kitelugu (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Sauti ya Vyombo vya habari | 648 | Data ya sauti ya Telugu Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 207, Mwanaume 963, Haijulikani 2 | Wasiliana nasi | |
Kikorea_SM_48 | Korea | Korea | K-KR | 48 kHz | Monologue iliyoandikwa | 1,955 | Monologue ya Hati ya Kikorea | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1195 Mwanaume 1134 Haijulikani 122 | Wasiliana nasi | |
Kitamil_MA | tamil | Kitamil (Katika Bomba) | ta_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kitamil (In Pipeline) | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitamil_GC | tamil | Kitamil (Katika Bomba) | ta_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kitamil (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitamil_CC_8 | tamil | Kitamil (Katika Bomba) | ta_IN | Kituo cha simu | 60 | Data ya Kitamil (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiswidi_MA_16 | swedish | swedish | sv_SE | 16 kHz | Sauti ya Vyombo vya habari | 278 | Data ya sauti ya Vyombo vya habari vya Uswidi | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Kike 195, kiume 500, Haijulikani 21 | Wasiliana nasi | |
Kiswidi_CC_8 | swedish | swedish | sv_SE | 8 kHz | Kituo cha simu | 250 | Data ya Kituo cha Simu cha Uswidi | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Kike 1581, kiume 727, Haijulikani 2 | Wasiliana nasi | |
Swahili_MA_16 | Kiswahili | Kiswahili | sw_KE | 16 kHz | Sauti ya Vyombo vya habari | 265 | Data ya sauti ya Swahili Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 118, Mwanaume 493, Haijulikani 25 | Wasiliana nasi | |
Swahili_CC_8 | Kiswahili | Kiswahili | sw_KE | 8 kHz | Kituo cha simu | 230 | Data ya Kituo cha Simu cha Kiswahili | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 611, Mwanaume 833, Haijulikani 0 | Wasiliana nasi | |
Kiingereza cha Afrika Kusini_MA_16 | Kiingereza cha Afrika Kusini | Kiingereza cha Afrika Kusini | sw_ZA | 16 kHz | Sauti ya Vyombo vya habari | 251 | Data ya sauti ya Media ya Kiingereza ya Afrika Kusini | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 235, Mwanaume 432, Haijulikani 36 | Wasiliana nasi | |
Kiingereza cha Afrika Kusini_CC_8 | Kiingereza cha Afrika Kusini | Kiingereza cha Afrika Kusini | sw_ZA | 8 kHz | Kituo cha simu | 261 | Data ya Kituo cha Simu cha Kiingereza cha Afrika Kusini | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1274 , Mwanaume 935 , Haijulikani 1 | Wasiliana nasi | |
Singapore_MA_16 | Singapore Kiingereza | Singapore Kiingereza | sw_SG | 16 kHz | Sauti ya Vyombo vya habari | 247 | Data ya sauti ya Singapore Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 160, Mwanaume 455, Haijulikani 37 | Wasiliana nasi | |
Singapore_CC_8 | Singapore Kiingereza | Singapore Kiingereza | sw_SG | 8 kHz | Kituo cha simu | 218 | Data ya Kituo cha Simu cha Singapore | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 2139 , Mwanaume 884, Haijulikani 21 | Wasiliana nasi | |
Boston_CC_8 | Boston Kiingereza | Boston Kiingereza | en_US | 8 kHz | Kituo cha simu | 177 | Data ya kituo cha simu cha Boston | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 605, Mwanaume: 711, na Asiyejulikana: 0 | Wasiliana nasi | |
Kiingereza Kina Kusini_CC_8 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 8 kHz | Kituo cha simu | 151 | Data ya English Deep South Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 221 , Mwanaume 1004 , Haijulikani 7 | Wasiliana nasi | |
Kideni_SM_48 | danish | danish | da-DK | 48 kHz | Monologue iliyoandikwa | 2,579 | Monologue ya Hati ya Kideni | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30, Kideni kutoka Denmark. | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1551 Mwanaume 1233 Haijulikani 42 | Wasiliana nasi | |
Kideni_MA_16 | danish | danish | da_DK | 16 kHz | Sauti ya Vyombo vya habari | 664 | Data ya sauti ya Kideni Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 369, Mwanaume: 864, Haijulikani: 27 | Wasiliana nasi | |
Kideni_GC_8 | danish | danish | da_DK | 8 kHz | Mazungumzo ya Jumla | 372 | Data ya Mazungumzo ya Kideni ya Jumla | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 311, Mwanaume: 417, Haijulikani: 0 | Wasiliana nasi | |
Kichina cha Jadi_SM_48 | Kichina cha jadi | Kichina cha jadi | zh-TW | 48 kHz | Monologue iliyoandikwa | 1,028 | Kichina cha jadi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1069 Mwanaume 262 Haijulikani 3 | Wasiliana nasi | |
Kichina Kilichorahisishwa_SM_48 | Kichina Rahisi | Kichina Rahisi | zh-CN | 48 kHz | Monologue iliyoandikwa | 2,762 | Kichina Rahisi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1920 Mwanaume 1535 Haijulikani 270 | Wasiliana nasi | |
Kichina_MA_16 | Kichina Kiingereza | Kichina Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 249 | Data ya sauti ya Media ya Kichina | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 126, Mwanaume: 346 na Asiyejulikana: 6 | Wasiliana nasi | |
Kichina_CC_8 | Kichina Kiingereza | Kichina Kiingereza | en_US | 8 kHz | Kituo cha simu | 169 | Data ya kituo cha simu cha Kichina | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 1790, Mwanaume: 523 na Asiyejulikana: 13 | Wasiliana nasi | |
Kanada_SM_48 | Mfaransa wa Canada | Mfaransa wa Canada | fr-CA | 48 kHz | Monologue iliyoandikwa | 1,222 | Mfaransa wa Canada | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 974 Mwanaume 631 Haijulikani 1 | Wasiliana nasi | |
Boston_MA_16 | Boston Kiingereza | Boston Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 93 | Data ya sauti ya Boston Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 43, Mwanaume: 181, na Asiyejulikana: 2 | Wasiliana nasi | |
Boston_GC_8 | Boston Kiingereza | Boston Kiingereza | en_US | 8 kHz | Mazungumzo ya Jumla | 32 | Data ya Mazungumzo ya Jumla ya Boston | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 53, Mwanaume: 83, na Asiyejulikana: 0 | Wasiliana nasi | |
English Deep South_GC_8 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 8 kHz | Mazungumzo ya Jumla | 56 | Data ya English Deep South General Conversation | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 99, Mwanaume 31, Hajulikani 0 | Wasiliana nasi | |
Kibengali_MA | Kibengali | Kibengali (Katika Bomba) | bn_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kibengali (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kibengali_GC | Kibengali | Kibengali (Katika Bomba) | bn_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kibengali (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kibengali_CC_8 | Kibengali | Kibengali (Katika Bomba) | bn_IN | Kituo cha simu | 60 | Data ya Kibengali (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiassamese_MA | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kiassamese (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiassamese_GC | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kiassamese (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiassamese_CC_8 | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Assamese (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiarabu_SM_48 | arabic | arabic | ar-SA | 48 kHz | Monologue iliyoandikwa | 1,947 | Monologue ya Maandishi ya Kiarabu | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 838 Mwanaume 1209 Haijulikani 78 | Wasiliana nasi | |
Kiarabu_GC_8 | arabic | arabic | ar_AE | 8 kHz | Mazungumzo ya Jumla | 292 | Data ya Mazungumzo ya Jumla ya Kiarabu | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiarabu kutoka nchi za Ghuba | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 171, Mwanaume: 534, na Asiyejulikana: 1 | Wasiliana nasi | |
Kiafrikana_MA_16 | Shule zote nchini Marekani | Shule zote nchini Marekani | af_ZA | 16 kHz | Sauti ya Vyombo vya habari | 658 | Faili za Media za Kiafrika | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 750, Mwanaume: 1278, na Asiyejulikana: 52 | Wasiliana nasi | |
Kiafrikana_GC_8 | Shule zote nchini Marekani | Shule zote nchini Marekani | af_ZA | 8 kHz | Mazungumzo ya Jumla | 368 | Data ya Mazungumzo ya Kiafrikana kwa Jumla | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - Dakika 15-60, Kiafrikana kinachozungumzwa barani Afrika | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 502, Mwanaume: 390, na Asiyejulikana: 2 | Wasiliana nasi | |
sw_US_MA_16 | Waamerika wa Kiafrika | Waamerika wa Kiafrika | en_US | 16 kHz | Sauti ya Vyombo vya habari | 154 | Data ya Vyombo vya Habari vya Kiafrika vya Kienyeji | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 151, Mwanaume: 150, na Asiyejulikana: 10 | Wasiliana nasi | |
HINGLISH_MA_16 | Kihinglish | Kihinglish | hg_IN | 16 kHz | Sauti ya Vyombo vya habari | 216 | HINGLISH Data ya sauti ya Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 75, Mwanaume 380, Hajulikani 0 | Wasiliana nasi | |
Kikorea_MA_16 | Korea | Korea | ko_KR | 16 kHz | Sauti ya Vyombo vya habari | 204 | Data ya sauti ya vyombo vya habari vya Kikorea | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 70 Mwanaume 303, Haijulikani 25 | Wasiliana nasi | |
Kikorea_CC_8 | Korea | Korea | ko_KR | 8 kHz | Kituo cha simu | 107 | Data ya Kikorea Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1086, Mwanaume 210 , Haijulikani 4 | Wasiliana nasi | |
Kikanada_MA | kannada | Kikannada (Katika Bomba) | kn_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kikannada (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kikanada_GC | kannada | Kikannada (Katika Bomba) | kn_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kannada (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kikanada_CC_8 | kannada | Kikannada (Katika Bomba) | kn_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Kannada (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kijapani_SM_48 | japanese | japanese | ja-JP | 48 kHz | Monologue iliyoandikwa | 2,335 | Monologue ya Hati za Kijapani | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1460 Mwanaume 1221 Haijulikani 194 | Wasiliana nasi | |
Kiayalandi_GC_8 | Ireland | Ireland | sw_IE | 8 kHz | Mazungumzo ya Jumla | 192 | Data ya Mazungumzo ya Jumla ya Ireland | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 213 , Mwanaume 153 , Haijulikani 0 | Wasiliana nasi | |
Kiindonesia_MA_16 | indonesian | indonesian | nilifanya | 16 kHz | Sauti ya Vyombo vya habari | 643 | Data ya sauti ya Media ya Indonesia | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 746, Mwanaume 1507, Haijulikani 129 | Wasiliana nasi | |
Kiindonesia_GC_8 | indonesian | indonesian | nilifanya | 8 kHz | Mazungumzo ya Jumla | 496 | Data ya Mazungumzo ya Jumla ya Kiindonesia | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiindonesia cha Bahasa | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 524, Mwanaume 454, Haijulikani 2 | Wasiliana nasi | |
Mhispania_MA_16 | Kiingereza cha Kihispania | Kiingereza cha Kihispania | en_US | 16 kHz | Sauti ya Vyombo vya habari | 155 | Sauti ya Hispanic Call Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 140, Mwanaume 219, Haijulikani 5 | Wasiliana nasi | |
Mhispania_CC_8 | Kiingereza cha Kihispania | Kiingereza cha Kihispania | en_US | 8 kHz | Kituo cha simu | 212 | Data ya Kihispania Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 822, Mwanaume 1262, Haijulikani 0 | Wasiliana nasi | |
sw_US_CC_8 | Waamerika wa Kiafrika | Waamerika wa Kiafrika | en_US | 8 kHz | Kituo cha simu | 211 | Data ya kituo cha simu cha Kiafrika cha Kienyeji | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 612, Mwanaume: 1242, na Asiyejulikana: 12 | Wasiliana nasi | |
HINGLISH_CC_8 | Kihinglish | Kihinglish | hg_IN | 8 kHz | Kituo cha simu | 208 | HINGLISH Data ya kituo cha simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 822, Mwanaume 1262 , Haijulikani 0 | Wasiliana nasi | |
Kihindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Monologue iliyoandikwa | 2,867 | Monologue ya Hati za Kihindi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1977 Mwanaume 1864 Haijulikani 147 | Wasiliana nasi | |
Kihindi_MA_16 | hindi | hindi | hi_IN | 16 kHz | Sauti ya Vyombo vya habari | 219 | Data ya sauti ya Hindi Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 83 , Mwanaume 309, Haijulikani 0 | Wasiliana nasi | |
Kiebrania_MA_16 | Kiyahudi | Kiyahudi | yeye_IL | 16 kHz | Sauti ya Vyombo vya habari | 427 | Data ya sauti ya Kiebrania Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 361 , Mwanaume 513, Haijulikani 13 | Wasiliana nasi | |
Mazungumzo_ya_Kiebrania_8 | Kiyahudi | Kiyahudi | yeye_IL | 8 kHz | Mazungumzo ya Jumla | 399 | Data ya Mazungumzo ya Jumla ya Kiebrania | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiebrania nchini Israeli | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 414 , Mwanaume 399 , Haijulikani 1 | Wasiliana nasi | |
Kigujarati_MA | gujarati | Kigujarati (Katika Bomba) | gu_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kigujarati (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kigujarati_GC | gujarati | Kigujarati (Katika Bomba) | gu_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kigujarati (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kigujarati_CC_8 | gujarati | Kigujarati (Katika Bomba) | gu_IN | Kituo cha simu | 60 | Data ya Kigujarati (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kijerumani_IVR_8 | german | german | de-De | 8 kHz | Ugani wa IVR | 200 | Takwimu za IVR za Ujerumani | Binadamu kwa Mashine. Mtiririko wa aina ya IVR ambapo kuna kidokezo cha TTS (km "Ninaweza kukusaidia vipi") ikifuatiwa na jibu la hiari la mwanadamu. | Mono | Eneo-kazi | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 10115 Mwanaume 8750 Haijulikani 0 | Wasiliana nasi | ||
Kijerumani_CC_8 | german | german | de-De | 8 kHz | Kituo cha simu | 64 | Data ya kituo cha simu cha Ujerumani | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Mono | Eneo-kazi | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 478 Mwanaume 1440 Haijulikani 0 | Wasiliana nasi | ||
English Deep South_MA_16 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 16 kHz | Sauti ya Vyombo vya habari | 266 | Data ya sauti ya Kiingereza Deep South Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 204, Mwanaume 356, Hajulikani 21 | Wasiliana nasi |
Huduma zinazotolewa
Mkusanyiko wa data ya sauti sio mikono-juu-ya staha kwa usanidi kamili wa AI. Katika Shaip, unaweza hata kuzingatia huduma zifuatazo ili kutengeneza modeli kwa njia iliyoenea zaidi kuliko kawaida:
Ukusanyaji wa Takwimu za Nakala
Huduma
Thamani ya kweli ya huduma za ukusanyaji wa data ya Shaip ni kwamba inawapa mashirika ufunguo wa kufungua habari muhimu inayopatikana ndani ya data isiyo na muundo
Huduma za Ukusanyaji wa Takwimu za Picha
Hakikisha kwamba mfano wako wa maono ya kompyuta unabainisha kila picha kwa usahihi, ili kufundisha kwa usawa mifano ya AI ya kizazi kijacho ya siku zijazo
Huduma za Ukusanyaji wa Takwimu za Video
Sasa zingatia maono ya kompyuta pamoja na NLP kwa kufundisha modeli zako kutambua vitu, watu binafsi, vizuizi, na vitu vingine vya kuona kwa ukamilifu
Rasilimali Zinazopendekezwa
Sadaka
Ufafanuzi wa Sauti kwa AI za Akili
Huduma za ufafanuzi wa sauti zimekuwa nguvu ya Shaip tangu mwanzo. Unda, fundisha na uboresha AI ya mazungumzo, gumzo na injini za utambuzi wa usemi kwa huduma zetu za hali ya juu za ufafanuzi wa sauti.
Mwongozo wa Mnunuzi
Mwongozo wa Mnunuzi: Mwongozo Kamili wa AI ya Maongezi
Gumzo ulilozungumza nalo linaendeshwa kwenye mfumo wa hali ya juu wa AI wa mazungumzo ambao umefunzwa, kujaribiwa na kutengenezwa kwa kutumia tani nyingi za seti za data za utambuzi wa usemi.
Katalogi ya Data
Katalogi ya Data ya Matamshi ya Nje ya Rafu na Utoaji Leseni
Kuna anuwai ya matumizi ya kawaida ya data ya hotuba katika miradi ya AI. Tunakupa idadi kubwa ya data ya ubora wa juu iliyo tayari kwa utambuzi wa sauti yako.
Je, ungependa kuunda hifadhidata yako ya sauti?
Wasiliana na mtaalamu wetu wa ukusanyaji wa data ya matamshi ya ndani ili kusanidi hazina ya sauti ambayo inakidhi mahitaji yako
Maswali yanayoulizwa (FAQ)
Ukusanyaji wa Data ya Hotuba kwa Mfano wa ML unarejelea mchakato wa kukusanya rekodi za sauti za lugha inayozungumzwa. Mkusanyiko huu husaidia katika mafunzo na kuboresha kanuni za kujifunza za mashine, hasa zile zinazolenga kuelewa na kuchakata sauti za binadamu.
Unapolenga kukusanya data ya sauti ya Utambuzi wa Usemi Kiotomatiki (ASR), unapaswa kuanza kwa kufafanua mahitaji mahususi ya mradi wako, ikijumuisha lugha unayotaka, lafudhi na aina ya usemi. Baada ya kuweka vigezo hivi, hakikisha unapata ruhusa zote muhimu ili kuheshimu faragha ya mtumiaji. Kisha, tumia vifaa vinavyofaa vya kurekodia au programu ili kunasa sampuli za sauti zilizo wazi. Kila rekodi inapaswa kufafanuliwa kwa uangalifu na manukuu yake au metadata nyingine muhimu na kuhifadhiwa kwa utaratibu kwa ufikiaji rahisi.
Seti ya data ya hotuba katika ujifunzaji wa mashine ni muhimu kwa mafunzo, majaribio na uthibitishaji wa miundo iliyoundwa kutambua, kunakili au kutafsiri lugha inayozungumzwa. Seti kama hizo za data hufungua njia kwa maelfu ya programu, kutoka kwa visaidizi vya sauti na huduma za unukuzi hadi bayometriki za sauti.
Ili kukusanya data sahihi kutoka kwa lugha na lafudhi mbalimbali, ushirikiano na wazungumzaji asilia wa asili ya lugha inayotakikana ni muhimu. Lenga sampuli tofauti na wakilishi ili kufunika wigo mpana wa nuances ya idadi ya watu. Tumia vifaa vya kurekodi vilivyosanifiwa katika mazingira sare ili kuhakikisha uthabiti wa sauti. Na muhimu zaidi, fafanua kila kipande cha data kwa manukuu ya kina na metadata, inayoashiria lugha na lafudhi mahususi.