Huduma Zaidi Zinazoaminika za Kukusanya Data ya Matamshi kwa AI yako
Treni mifano yako ya NLP, VAs, prototypes za TTS, na zaidi na data bora ya mazungumzo, na huduma zetu za ukusanyaji wa data ya sauti na hotuba.
Gundua mabomba ya data ya sauti bila vikwazo.
Wateja Walioangaziwa
Kwa nini Hifadhidata ya Mafunzo ya Hotuba inahitajika kwa Usindikaji wa Lugha Asilia?
Je! Umewahi kugundua smartphone yako VA, yaani Siri, Bixby, au kitu kingine chochote, ikiingiliana? Namna wanavyojibu kila swali na kuchambua na kuwasilisha matokeo kulingana na mahitaji yako!
Sawa, kama vile VA hizi zinatuvutia, rasilimali hizi za akili na programu zinahitaji kufundishwa hatua kwa hatua ili kuweza kujibu, kwa usahihi. Hii ndiyo sababu unapaswa kuzingatia utoaji wa hotuba/sauti, na ukusanyaji wa data ya sauti kwa makampuni maalumu ya kukusanya data, kwa utaalam wa kitaalamu unaothibitisha.
Kuwekeza katika ukusanyaji wa data ya sauti hutayarisha NLP yako inayodaiwa kuhudumia hadhira ya lugha nyingi. Si hivyo tu, ukusanyaji wa data ya hotuba ya NLP, kama na inaposhughulikiwa na mtaalamu, hata huzingatia mkusanyiko wa ndani, uchanganuzi wa kisemantiki, na unukuzi wa sauti. Ukiwa na suluhu za kitaalamu za ukusanyaji wa data ya usemi, unaweza:
- Nunua seti za data za sauti za ubora wa juu ili kuboresha usahihi
- Lenga usanidi wa hali tofauti
- Kukusanya data ya mafunzo ya AI ya lugha nyingi
- Kadiria muundo wako wa ML ili kuendana na demografia na wima tofauti
Huduma za Ukusanyaji wa Takwimu za Sauti / Sauti za NLP
Mada yoyote. Hali yoyote.
Mifumo ya akili ya NLP sio chochote isipokuwa generic. Kulingana na utendakazi wa programu hiyo, itabidi uzingatie huduma za data za sauti na anga, na ambazo zinaweza kutolewa tu na kampuni zinazojulikana za ukusanyaji wa data za sauti. Hapa ndipo Shaip inakuja katika mpango wa vitu kama mtoa huduma wa uunganishaji wa data anayeaminika ambaye anajivunia kufanya kuinua nzito kwa AI zako zinazodhaniwa kuwa zina akili.
Katika Shaip, lengo letu kuu ni kwenye mifano ya kulisha na kiwango cha juu zaidi cha sampuli za hotuba za kawaida, kwa wakati mdogo zaidi. Pamoja nasi kwenye bodi, unaweza kutarajia:
- Mkusanyiko wa data ya sauti / sauti uliopangwa kwa NLP
- Mipango iliyoundwa-iliyoundwa ambayo hujibu kulingana na kesi maalum za utumiaji
- Kufanya uchimbaji wa hifadhidata ya sauti kuwa tayari
- Usindikaji wa data maalum na kiotomatiki
- Kiwango cha juu kabisa cha umaalum wa kikoa
- Wakati wa haraka wa kuuza na mifano ya AI iliyoharakishwa
Utaalamu wetu
Panga Takwimu za Sauti Kuandaa Mifano mahiri ya NLP
Shaip inatoa huduma za ukusanyaji wa mwisho-mwisho hadi mwisho katika lugha zaidi ya 100 + kuwezesha teknolojia zinazowezeshwa na sauti kuhudumia seti anuwai ya watazamaji kote ulimwenguni. Tunaweza kufanya kazi kwenye miradi ya upeo wowote na saizi; kutoka kwa kutoa leseni za data zilizopo kwenye rafu, kudhibiti ukusanyaji wa data ya sauti, hadi kunakili sauti na ufafanuzi. Haijalishi mradi wako wa ukusanyaji wa data ya hotuba ni mkubwa kiasi gani, tunaweza kubadilisha huduma za ukusanyaji wa sauti ili kukidhi mahitaji yako ya kujenga hifadhidata za hali ya juu za NLP ambazo zinalenga lahaja, tani na lugha. Chagua kutoka kwa hifadhidata nyingi za matamshi na rasilimali za ukusanyaji wa data za sauti, kwa usanidi wa sauti unaowezesha sauti.
Mkusanyiko wa Hotuba ya Monologue
Shughulikia mahitaji ya msingi wa hotuba yanayohusu spika ya pekee kwa prototypes zako za Nakala-kwa-kasi na mahitaji maalum ya nakala na kulisha kwa maandishi haraka, kupitia faili za kituo kimoja.
Hotuba ya Mazungumzo
mkusanyiko
Sanidi Wasaidizi wa Virtual wenye busara, mazungumzo maalum ya kasi, na mifano ya Utambuzi wa Hotuba ya Moja kwa moja na ufichuzi wa lugha nyingi kupitia faili mbili za kituo na rasilimali zilizonakiliwa.
Takwimu za Acoustic
mkusanyiko
Tunaweza kurekodi kitaalam data ya sauti ya studio iwe ya mikahawa, ofisi, au nyumba au kutoka mazingira na lugha anuwai, kupitia mtandao wetu wa washirika, wakati unafunika anuwai anuwai
Mkusanyiko wa Matamshi ya Lugha Asilia
Fundisha usanidi mzuri wa kibiashara kutambua vishazi vya wateja vilivyotamkwa tofauti na maana sawa, kwa kufanya AI zijitegemea zaidi kwa wakati
Dijitali / Virtual
Wasaidizi
Zingatia kujenga Msaidizi wako anayekuja wa Virtual kwa mifano ya mafunzo na maonyo ya usemi wa wanadamu, mfiduo wa lugha nyingi, uchambuzi wa muktadha, na NLU.
Utambuzi wa Hotuba Moja kwa Moja (ASR)
Boresha usahihi wa mifumo yako ya utambuzi wa matamshi otomatiki (ASR) kwa kupata hifadhidata ya hali ya juu ya usemi/sauti mseto, kutoka kwa safu mbalimbali za demografia.
Data ya Mafunzo ya Usemi/Sauti kwa Lugha nyingi
Wataalamu wetu wa lugha walio na ujuzi wa hali ya juu kote ulimwenguni, hutoa data ya mafunzo ya Lugha nyingi / usemi katika lugha nyingi na lahaja ikiwa ni pamoja na Kiarabu, Kideni, Kichina, Kiafrikaans, Singapore, New Zealand, Kiebrania, Kiindonesia, Kiayalandi, Kikorea, Malay, Kipolandi, Kiskoti, Kiswidi. , Kifaransa, Kijerumani, Kivietinamu, Kithai, Kiitaliano, Kihispania na zaidi.
Nakala-kwa-Hotuba
(TTS)
Ili kutoa matumizi bora ya mtumiaji na TTS, kuunda mfumo wa sauti wa asili ni muhimu. Unda muundo wa lugha-tofauti wa maandishi-kwa-hotuba (TTS) kwa usaidizi wa wafanyakazi wetu wa kimataifa, ambao hukusaidia kukusanya data ya usemi katika lugha 150+ na lahaja ili kuboresha miundo yako ya AI kutoka kwa vidhibiti vya ndani ya gari hadi chatbots na masuluhisho ya kujifunza kwa kutumia kiwango cha juu cha- data ya sauti ya ubora.
Sababu za kuchagua Shaip kama Mshirika wako wa Ukusanyaji wa Takwimu za Kuaminika
Watu
Timu zilizojitolea na zilizofunzwa:
- Washirika 30,000+ wa Uundaji wa Takwimu, Kuweka alama na QA
- Timu ya Usimamizi wa Miradi iliyojulikana
- Timu ya Ustawi wa Bidhaa
- Kipaji cha Bwawa la Talanta na Timu ya Kupanda
Mchakato
Ufanisi zaidi wa mchakato umehakikishiwa na:
- Mchakato wa Robust 6 Sigma-Stage-Gate
- Timu iliyojitolea ya mikanda nyeusi 6 ya Sigma - Wamiliki wa mchakato muhimu na uzingatiaji wa Ubora
- Uboreshaji unaoendelea na Kitanzi cha Maoni
Jukwaa
Jukwaa lenye hati miliki linapeana faida:
- Jukwaa la mwisho-mwisho-msingi wa wavuti
- Ubora usiofaa
- TAT ya haraka
- Uwasilishaji usio na mshono
Watu
Timu zilizojitolea na zilizofunzwa:
- Washirika 30,000+ wa Uundaji wa Takwimu, Kuweka alama na QA
- Timu ya Usimamizi wa Miradi iliyojulikana
- Timu ya Ustawi wa Bidhaa
- Kipaji cha Bwawa la Talanta na Timu ya Kupanda
Mchakato
Ufanisi zaidi wa mchakato umehakikishiwa na:
- Mchakato wa Robust 6 Sigma-Stage-Gate
- Timu iliyojitolea ya mikanda nyeusi 6 ya Sigma - Wamiliki wa mchakato muhimu na uzingatiaji wa Ubora
- Uboreshaji unaoendelea na Kitanzi cha Maoni
Jukwaa
Jukwaa lenye hati miliki linapeana faida:
- Jukwaa la mwisho-mwisho-msingi wa wavuti
- Ubora usiofaa
- TAT ya haraka
- Uwasilishaji usio na mshono
Lugha: Seti za Data za Sauti Zimekusanywa
Seti za Data ya Sauti/Matamshi ya Nje ya Rafu
Maelezo | Kitambulisho cha Corpus (Kipekee) | Keyword | Seti ya Data ya Lugha | Msimbo wa lugha | Kiwango cha Mfano | Aina ya Seti ya Data | Jumla ya Saa za Sauti | Short Description | Maelezo ya Seti ya Data | Kituo cha Sauti | Jukwaa la Kurekodi | WER (%) | Audio Format | Umbizo la Unukuzi | Tumia Uchunguzi | Idadi ya Spika | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
sw_US_CC_8 | Waamerika wa Kiafrika | Waamerika wa Kiafrika | en_US | 8 kHz | Kituo cha simu | 211 | Data ya kituo cha simu cha Kiafrika cha Kienyeji | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 612, Mwanaume: 1242, na Asiyejulikana: 12 | Wasiliana nasi | |
sw_US_MA_16 | Waamerika wa Kiafrika | Waamerika wa Kiafrika | en_US | 16 kHz | Sauti ya Vyombo vya habari | 154 | Data ya Vyombo vya Habari vya Kiafrika vya Kienyeji | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 151, Mwanaume: 150, na Asiyejulikana: 10 | Wasiliana nasi | |
Kiafrikana_GC_8 | Shule zote nchini Marekani | Shule zote nchini Marekani | af_ZA | 8 kHz | Mazungumzo ya Jumla | 368 | Data ya Mazungumzo ya Kiafrikana kwa Jumla | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - Dakika 15-60, Kiafrikana kinachozungumzwa barani Afrika | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 502, Mwanaume: 390, na Asiyejulikana: 2 | Wasiliana nasi | |
Kiafrikana_MA_16 | Shule zote nchini Marekani | Shule zote nchini Marekani | af_ZA | 16 kHz | Sauti ya Vyombo vya habari | 658 | Faili za Media za Kiafrika | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 750, Mwanaume: 1278, na Asiyejulikana: 52 | Wasiliana nasi | |
Kiarabu_GC_8 | arabic | arabic | ar_AE | 8 kHz | Mazungumzo ya Jumla | 292 | Data ya Mazungumzo ya Jumla ya Kiarabu | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiarabu kutoka nchi za Ghuba | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 171, Mwanaume: 534, na Asiyejulikana: 1 | Wasiliana nasi | |
Kiarabu_SM_48 | arabic | arabic | ar-SA | 48 kHz | Monologue iliyoandikwa | 1,947 | Monologue ya Maandishi ya Kiarabu | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 838 Mwanaume 1209 Haijulikani 78 | Wasiliana nasi | |
Kiassamese_CC_8 | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Assamese (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiassamese_GC | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kiassamese (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kiassamese_MA | Kubafu | Kiassamese (Katika Bomba) | kama_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kiassamese (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kibengali_CC_8 | Kibengali | Kibengali (Katika Bomba) | bn_IN | Kituo cha simu | 60 | Data ya Kibengali (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kibengali_GC | Kibengali | Kibengali (Katika Bomba) | bn_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kibengali (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kibengali_MA | Kibengali | Kibengali (Katika Bomba) | bn_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kibengali (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Boston_CC_8 | Boston Kiingereza | Boston Kiingereza | en_US | 8 kHz | Kituo cha simu | 177 | Data ya kituo cha simu cha Boston | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 605, Mwanaume: 711, na Asiyejulikana: 0 | Wasiliana nasi | |
Boston_GC_8 | Boston Kiingereza | Boston Kiingereza | en_US | 8 kHz | Mazungumzo ya Jumla | 32 | Data ya Mazungumzo ya Jumla ya Boston | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 53, Mwanaume: 83, na Asiyejulikana: 0 | Wasiliana nasi | |
Boston_MA_16 | Boston Kiingereza | Boston Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 93 | Data ya sauti ya Boston Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 43, Mwanaume: 181, na Asiyejulikana: 2 | Wasiliana nasi | |
Kanada_SM_48 | Mfaransa wa Canada | Mfaransa wa Canada | fr-CA | 48 kHz | Monologue iliyoandikwa | 1,222 | Mfaransa wa Canada | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 974 Mwanaume 631 Haijulikani 1 | Wasiliana nasi | |
Kichina_CC_8 | Kichina Kiingereza | Kichina Kiingereza | en_US | 8 kHz | Kituo cha simu | 169 | Data ya kituo cha simu cha Kichina | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 1790, Mwanaume: 523 na Asiyejulikana: 13 | Wasiliana nasi | |
Kichina_MA_16 | Kichina Kiingereza | Kichina Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 249 | Data ya sauti ya Media ya Kichina | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 126, Mwanaume: 346 na Asiyejulikana: 6 | Wasiliana nasi | |
Kichina Kilichorahisishwa_SM_48 | Kichina Rahisi | Kichina Rahisi | zh-CN | 48 kHz | Monologue iliyoandikwa | 2,762 | Kichina Rahisi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1920 Mwanaume 1535 Haijulikani 270 | Wasiliana nasi | |
Kichina cha Jadi_SM_48 | Kichina cha jadi | Kichina cha jadi | zh-TW | 48 kHz | Monologue iliyoandikwa | 1,028 | Kichina cha jadi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1069 Mwanaume 262 Haijulikani 3 | Wasiliana nasi | |
Kideni_GC_8 | danish | danish | da_DK | 8 kHz | Mazungumzo ya Jumla | 372 | Data ya Mazungumzo ya Kideni ya Jumla | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 311, Mwanaume: 417, Haijulikani: 0 | Wasiliana nasi | |
Kideni_MA_16 | danish | danish | da_DK | 16 kHz | Sauti ya Vyombo vya habari | 664 | Data ya sauti ya Kideni Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke: 369, Mwanaume: 864, Haijulikani: 27 | Wasiliana nasi | |
Kideni_SM_48 | danish | danish | da-DK | 48 kHz | Monologue iliyoandikwa | 2,579 | Monologue ya Hati ya Kideni | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30, Kideni kutoka Denmark. | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1551 Mwanaume 1233 Haijulikani 42 | Wasiliana nasi | |
Kiingereza Kina Kusini_CC_8 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 8 kHz | Kituo cha simu | 151 | Data ya English Deep South Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 221 , Mwanaume 1004 , Haijulikani 7 | Wasiliana nasi | |
English Deep South_GC_8 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 8 kHz | Mazungumzo ya Jumla | 56 | Data ya English Deep South General Conversation | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 99, Mwanaume 31, Hajulikani 0 | Wasiliana nasi | |
English Deep South_MA_16 | Kiingereza Kilimo Kusini | Kiingereza Kilimo Kusini | en_US | 16 kHz | Sauti ya Vyombo vya habari | 266 | Data ya sauti ya Kiingereza Deep South Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 204, Mwanaume 356, Hajulikani 21 | Wasiliana nasi | |
Kijerumani_CC_8 | german | german | de-De | 8 kHz | Kituo cha simu | 64 | Data ya kituo cha simu cha Ujerumani | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Mono | Eneo-kazi | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 478 Mwanaume 1440 Haijulikani 0 | Wasiliana nasi | ||
Kijerumani_IVR_8 | german | german | de-De | 8 kHz | Ugani wa IVR | 200 | Takwimu za IVR za Ujerumani | Binadamu kwa Mashine. Mtiririko wa aina ya IVR ambapo kuna kidokezo cha TTS (km "Ninaweza kukusaidia vipi") ikifuatiwa na jibu la hiari la mwanadamu. | Mono | Eneo-kazi | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 10115 Mwanaume 8750 Haijulikani 0 | Wasiliana nasi | ||
Kigujarati_CC_8 | gujarati | Kigujarati (Katika Bomba) | gu_IN | Kituo cha simu | 60 | Data ya Kigujarati (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kigujarati_GC | gujarati | Kigujarati (Katika Bomba) | gu_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kigujarati (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kigujarati_MA | gujarati | Kigujarati (Katika Bomba) | gu_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kigujarati (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Mazungumzo_ya_Kiebrania_8 | Kiyahudi | Kiyahudi | yeye_IL | 8 kHz | Mazungumzo ya Jumla | 399 | Data ya Mazungumzo ya Jumla ya Kiebrania | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiebrania nchini Israeli | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 414 , Mwanaume 399 , Haijulikani 1 | Wasiliana nasi | |
Kiebrania_MA_16 | Kiyahudi | Kiyahudi | yeye_IL | 16 kHz | Sauti ya Vyombo vya habari | 427 | Data ya sauti ya Kiebrania Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 361 , Mwanaume 513, Haijulikani 13 | Wasiliana nasi | |
Kihindi_MA_16 | hindi | hindi | hi_IN | 16 kHz | Sauti ya Vyombo vya habari | 219 | Data ya sauti ya Hindi Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 83 , Mwanaume 309, Haijulikani 0 | Wasiliana nasi | |
Kihindi_SM_48 | hindi | hindi | hi-IN | 48 kHz | Monologue iliyoandikwa | 2,867 | Monologue ya Hati za Kihindi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1977 Mwanaume 1864 Haijulikani 147 | Wasiliana nasi | |
HINGLISH_CC_8 | Kihinglish | Kihinglish | hg_IN | 8 kHz | Kituo cha simu | 208 | HINGLISH Data ya kituo cha simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 822, Mwanaume 1262 , Haijulikani 0 | Wasiliana nasi | |
HINGLISH_MA_16 | Kihinglish | Kihinglish | hg_IN | 16 kHz | Sauti ya Vyombo vya habari | 216 | HINGLISH Data ya sauti ya Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 75, Mwanaume 380, Hajulikani 0 | Wasiliana nasi | |
Mhispania_CC_8 | Kiingereza cha Kihispania | Kiingereza cha Kihispania | en_US | 8 kHz | Kituo cha simu | 212 | Data ya Kihispania Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 822, Mwanaume 1262, Haijulikani 0 | Wasiliana nasi | |
Mhispania_MA_16 | Kiingereza cha Kihispania | Kiingereza cha Kihispania | en_US | 16 kHz | Sauti ya Vyombo vya habari | 155 | Sauti ya Hispanic Call Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 140, Mwanaume 219, Haijulikani 5 | Wasiliana nasi | |
Kiindonesia_GC_8 | indonesian | indonesian | nilifanya | 8 kHz | Mazungumzo ya Jumla | 496 | Data ya Mazungumzo ya Jumla ya Kiindonesia | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kiindonesia cha Bahasa | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 524, Mwanaume 454, Haijulikani 2 | Wasiliana nasi | |
Kiindonesia_MA_16 | indonesian | indonesian | nilifanya | 16 kHz | Sauti ya Vyombo vya habari | 643 | Data ya sauti ya Media ya Indonesia | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 746, Mwanaume 1507, Haijulikani 129 | Wasiliana nasi | |
Kiayalandi_GC_8 | Ireland | Ireland | sw_IE | 8 kHz | Mazungumzo ya Jumla | 192 | Data ya Mazungumzo ya Jumla ya Ireland | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 213 , Mwanaume 153 , Haijulikani 0 | Wasiliana nasi | |
Kijapani_SM_48 | japanese | japanese | ja-JP | 48 kHz | Monologue iliyoandikwa | 2,335 | Monologue ya Hati za Kijapani | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1460 Mwanaume 1221 Haijulikani 194 | Wasiliana nasi | |
Kikanada_CC_8 | kannada | Kikannada (Katika Bomba) | kn_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Kannada (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kikanada_GC | kannada | Kikannada (Katika Bomba) | kn_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kannada (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kikanada_MA | kannada | Kikannada (Katika Bomba) | kn_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kikannada (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kikorea_CC_8 | Korea | Korea | ko_KR | 8 kHz | Kituo cha simu | 107 | Data ya Kikorea Call-center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1086, Mwanaume 210 , Haijulikani 4 | Wasiliana nasi | |
Kikorea_MA_16 | Korea | Korea | ko_KR | 16 kHz | Sauti ya Vyombo vya habari | 204 | Data ya sauti ya vyombo vya habari vya Kikorea | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 70 Mwanaume 303, Haijulikani 25 | Wasiliana nasi | |
Kikorea_SM_48 | Korea | Korea | K-KR | 48 kHz | Monologue iliyoandikwa | 1,955 | Monologue ya Hati ya Kikorea | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1195 Mwanaume 1134 Haijulikani 122 | Wasiliana nasi | |
Kimalei_GC_8 | malay | malay | ms_MY | 8 kHz | Mazungumzo ya Jumla | 266 | Data ya Mazungumzo ya Jumla ya Kimalesia | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Kimalesia nchini Malaysia | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 316, Mwanaume 176 , Haijulikani 0 | Wasiliana nasi | |
Kimalei_MA_16 | malay | malay | ms_MY | 16 kHz | Sauti ya Vyombo vya habari | 344 | Data ya sauti ya Media ya Malay | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 236, Mwanaume 626, Hajulikani 47 | Wasiliana nasi | |
Kimalayalam_CC_8 | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Kimalayalam (Katika Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalayalam_GC | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kimalayalam (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kimalayalam_MA | Malayalam | Kimalayalam (Katika Bomba) | ml_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kimalayalam (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Marathi_CC_8 | Marathi | Kimarathi (Katika Bomba) | mr_IN | Kituo cha simu | 60 | Data ya Kituo cha Simu cha Marathi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Marathi_GC | Marathi | Kimarathi (Katika Bomba) | mr_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kimarathi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Marathi_MA | Marathi | Kimarathi (Katika Bomba) | mr_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kimarathi (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Meksiko_SM_48 | Kihispania (Mexico) | Kihispania (Mexico) | es-MX | 48 kHz | Monologue iliyoandikwa | 1,492 | Monologue ya Maandishi ya Kihispania ya Meksiko | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1016 Mwanaume 1069 Haijulikani 95 | Wasiliana nasi | |
Uholanzi_SM_48 | dutch | dutch | nl-NL | 48 kHz | Monologue iliyoandikwa | 1,205 | Monologue ya Hati ya Uholanzi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1285 Mwanaume 531 Haijulikani 3 | Wasiliana nasi | |
New York English_CC_8 | New York Kiingereza | New York Kiingereza | en_US | 8 kHz | Kituo cha simu | 103 | Data ya kituo cha simu cha New York English | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 610, Mwanaume 532, Hajui 0 | Wasiliana nasi | |
New York English_GC_8 | New York Kiingereza | New York Kiingereza | en_US | 8 kHz | Mazungumzo ya Jumla | 107 | Data ya Mazungumzo ya Kiingereza ya New York | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 118, Mwanaume 114, Haijulikani 0 | Wasiliana nasi | |
New York English_MA_16 | New York Kiingereza | New York Kiingereza | en_US | 16 kHz | Sauti ya Vyombo vya habari | 140 | Data ya sauti ya New York English Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 66, Mwanaume 230, Haijulikani 11 | Wasiliana nasi | |
New Zealand_GC_8 | New Zealand Kiingereza | New Zealand Kiingereza | sw_NZ | 8 kHz | Mazungumzo ya Jumla | 148 | Data ya Mazungumzo ya Kiingereza ya New Zealand | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 167, kiume 121, Haijulikani 4 | Wasiliana nasi | |
New Zealand_MA_16 | New Zealand Kiingereza | New Zealand Kiingereza | sw_NZ | 16 kHz | Sauti ya Vyombo vya habari | 400 | Sauti ya New Zealand English Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 367, kiume 678, Haijulikani 26 | Wasiliana nasi | |
Oriya_CC_8 | Kioriya | Oriya (Katika Bomba) | au_IN | Kituo cha simu | 60 | Data ya Oriya (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Oriya_GC | Kioriya | Oriya (Katika Bomba) | au_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Oriya (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Oriya_MA | Kioriya | Oriya (Katika Bomba) | au_IN | Sauti ya Vyombo vya habari | 40 | Oriya (In Pipeline) Data ya sauti ya media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kipolandi_MA_16 | Kipolandi | Kipolandi | sw_PL | 16 kHz | Sauti ya Vyombo vya habari | 269 | Sauti ya Kipolandi Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 173 Mwanaume 354 Haijulikani 6 | Wasiliana nasi | |
Polandi ya Poland_SM_48 | Kipolishi (Poland) | Kipolishi (Poland) | pl-PL | 48 kHz | Monologue iliyoandikwa | 1,482 | Polandi ya Kipolishi - Monologue iliyoandikwa | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1324 Mwanaume 701 Haijulikani 24 | Wasiliana nasi | |
Punjabi_CC_8 | punjabi | Kipunjabi (Katika Bomba) | punjabi | Kituo cha simu | 60 | Data ya Kipunjabi (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Punjabi_GC | punjabi | Kipunjabi (Katika Bomba) | punjabi | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Kipunjabi (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Punjabi_MA | punjabi | Kipunjabi (Katika Bomba) | punjabi | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kipunjabi (In Pipeline). | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kirusi_SM_48 | russian | russian | ru-RU | 48 kHz | Monologue iliyoandikwa | 2,398 | Monologue ya Hati ya Kirusi | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1689 Mwanaume 1937 Haijulikani 214 | Wasiliana nasi | |
Scottish_GC_8 | Kiskoti (Lafudhi ya Kiingereza) | Kiskoti (Lafudhi ya Kiingereza) | sw_AB | 8 kHz | Mazungumzo ya Jumla | 292 | Data ya Mazungumzo ya Jumla ya Uskoti | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 285 , Mwanaume 260, Haijulikani 3 | Wasiliana nasi | |
Singapore_CC_8 | Singapore Kiingereza | Singapore Kiingereza | sw_SG | 8 kHz | Kituo cha simu | 218 | Data ya Kituo cha Simu cha Singapore | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 2139 , Mwanaume 884, Haijulikani 21 | Wasiliana nasi | |
Singapore_MA_16 | Singapore Kiingereza | Singapore Kiingereza | sw_SG | 16 kHz | Sauti ya Vyombo vya habari | 247 | Data ya sauti ya Singapore Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 160, Mwanaume 455, Haijulikani 37 | Wasiliana nasi | |
Kiingereza cha Afrika Kusini_CC_8 | Kiingereza cha Afrika Kusini | Kiingereza cha Afrika Kusini | sw_ZA | 8 kHz | Kituo cha simu | 261 | Data ya Kituo cha Simu cha Kiingereza cha Afrika Kusini | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1274 , Mwanaume 935 , Haijulikani 1 | Wasiliana nasi | |
Kiingereza cha Afrika Kusini_MA_16 | Kiingereza cha Afrika Kusini | Kiingereza cha Afrika Kusini | sw_ZA | 16 kHz | Sauti ya Vyombo vya habari | 251 | Data ya sauti ya Media ya Kiingereza ya Afrika Kusini | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 235, Mwanaume 432, Haijulikani 36 | Wasiliana nasi | |
Swahili_CC_8 | Kiswahili | Kiswahili | sw_KE | 8 kHz | Kituo cha simu | 230 | Data ya Kituo cha Simu cha Kiswahili | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 611, Mwanaume 833, Haijulikani 0 | Wasiliana nasi | |
Swahili_MA_16 | Kiswahili | Kiswahili | sw_KE | 16 kHz | Sauti ya Vyombo vya habari | 265 | Data ya sauti ya Swahili Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 118, Mwanaume 493, Haijulikani 25 | Wasiliana nasi | |
Kiswidi_CC_8 | swedish | swedish | sv_SE | 8 kHz | Kituo cha simu | 250 | Data ya Kituo cha Simu cha Uswidi | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Kike 1581, kiume 727, Haijulikani 2 | Wasiliana nasi | |
Kiswidi_MA_16 | swedish | swedish | sv_SE | 16 kHz | Sauti ya Vyombo vya habari | 278 | Data ya sauti ya Vyombo vya habari vya Uswidi | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Kike 195, kiume 500, Haijulikani 21 | Wasiliana nasi | |
Kitamil_CC_8 | tamil | Kitamil (Katika Bomba) | ta_IN | Kituo cha simu | 60 | Data ya Kitamil (In Pipeline) ya Kituo cha Simu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitamil_GC | tamil | Kitamil (Katika Bomba) | ta_IN | Mazungumzo ya Jumla | 100 | Data ya Mazungumzo ya Jumla ya Kitamil (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitamil_MA | tamil | Kitamil (Katika Bomba) | ta_IN | Sauti ya Vyombo vya habari | 40 | Data ya sauti ya Kitamil (In Pipeline) | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Mazungumzo ya Jumla | 553 | Data ya Mazungumzo ya Jumla ya Kitelugu | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Msururu) - dakika 15-60, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 574 , Mwanaume 564, Haijulikani 0 | Wasiliana nasi | |
Kitelugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Sauti ya Vyombo vya habari | 648 | Data ya sauti ya Telugu Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 207, Mwanaume 963, Haijulikani 2 | Wasiliana nasi | |
Kitelugu_CC_8 | telugu | Kitelugu (Katika Bomba) | te_IN | Kituo cha simu | 30 | Data ya Kitelugu (In Pipeline) Call-Center | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_GC | telugu | Kitelugu (Katika Bomba) | te_IN | Mazungumzo ya Jumla | 50 | Data ya Mazungumzo ya Jumla ya Kitelugu (In Pipeline). | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Kitelugu_MA | telugu | Kitelugu (Katika Bomba) | te_IN | Sauti ya Vyombo vya habari | 20 | Data ya sauti ya Kitelugu (In Pipeline) | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Wasiliana nasi | ||||
Thai_GC_8 | thai | thai | th_TH | 8 kHz | Mazungumzo ya Jumla | 183 | Mazungumzo ya Jumla ya Thai | Mazungumzo ya simu ambayo hayajaandikwa kati ya watu wawili. Takriban. Muda wa Sauti (Masafa) - dakika 15-60, Rejesta isiyo rasmi inayotumiwa kati ya marafiki | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 338, Mwanaume 96, Haijulikani 8 | Wasiliana nasi | |
Thai_MA_8 | thai | thai | th_TH | 16 kHz | Sauti ya Vyombo vya habari | 173 | Sauti ya Thai Media | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 143, Mwanaume 502, Haijulikani 26 | Wasiliana nasi | |
Uturuki ya Uturuki_SM_48 | Kituruki Uturuki | Kituruki Uturuki | tr-TR | 48 kHz | Monologue iliyoandikwa | 2,027 | Kituruki Uturuki | Rekodi za kutamka moja, ambazo huwa zinaanguka katika safu ya sekunde 5 hadi 30 | Mono | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 1561 Mwanaume 1241 Haijulikani 31 | Wasiliana nasi | |
Kivietinamu_GC_8 | vietnamese | vietnamese | vi_VN | 8 kHz | Mazungumzo ya Jumla | 295 | Data ya Mazungumzo ya Jumla ya Kivietinamu | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, Kaskazini (km, Hanoi), Kati, na Kusini (km, Ho Chi Minh City). | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 400, kiume 380, Haijulikani 2 | Wasiliana nasi | |
Kivietinamu_MA_16 | vietnamese | vietnamese | vi_VN | 16 kHz | Sauti ya Vyombo vya habari | 257 | Data ya sauti ya Vyombo vya habari vya Kivietinamu | Faili za sauti/video za kikoa cha umma zinazoruhusiwa kama vile mahojiano, podikasti n.k - watu 1 hadi 5. Takriban. Muda wa Sauti (Masafa) dakika 15-60 | Mono | Upatikanaji wa Wavuti | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 249, kiume 200, Haijulikani 45 | Wasiliana nasi | |
Kiwelsh_GC_8 | Kiwelisi (Lafudhi ya Kiingereza) | Kiwelisi (Lafudhi ya Kiingereza) | sw_WL | 8 kHz | Mazungumzo ya Jumla | 278 | Data ya Mazungumzo ya Jumla ya Wales | Mazungumzo ya simu ambayo hayajaandikwa kati ya "wakala" na "mteja", Takriban. Muda wa Sauti (Masafa) Dakika 5-15, | Dual | Eneo-kazi | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Mwanamke 270, Mwanaume 324, Haijulikani 0 | Wasiliana nasi | |
Kiingereza cha Uingereza_WW_16 | Kiingereza cha Uingereza | Kiingereza cha Uingereza | sw_uk | 16 kHz | Omba Neno | 200 Spika | Wake Neno Uingereza Kiingereza | misemo muhimu ukusanyaji wa data
| 1 channel | Simu App | 5.0 | .wimbi | .json | ASR, Msaidizi wa Mtandao, Chatbot, AI ya Mazungumzo, Uchanganuzi wa Matamshi, TTS, Kuiga Lugha | Jinsia: 50% wanaume, 50% wanawake, +/- 10%. | Wasiliana nasi |
Huduma zinazotolewa
Mkusanyiko wa data ya sauti sio mikono-juu-ya staha kwa usanidi kamili wa AI. Katika Shaip, unaweza hata kuzingatia huduma zifuatazo ili kutengeneza modeli kwa njia iliyoenea zaidi kuliko kawaida:
Ukusanyaji wa Takwimu za Nakala
Services
Thamani ya kweli ya huduma za ukusanyaji wa data ya Shaip ni kwamba inawapa mashirika ufunguo wa kufungua habari muhimu inayopatikana ndani ya data isiyo na muundo
Huduma za Ukusanyaji wa Takwimu za Picha
Hakikisha kwamba mfano wako wa maono ya kompyuta unabainisha kila picha kwa usahihi, ili kufundisha kwa usawa mifano ya AI ya kizazi kijacho ya siku zijazo
Huduma za Ukusanyaji wa Takwimu za Video
Sasa zingatia maono ya kompyuta pamoja na NLP kwa kufundisha modeli zako kutambua vitu, watu binafsi, vizuizi, na vitu vingine vya kuona kwa ukamilifu
Rasilimali Zinazopendekezwa
Sadaka
Ufafanuzi wa Sauti kwa AI za Akili
Huduma za ufafanuzi wa sauti zimekuwa nguvu ya Shaip tangu mwanzo. Unda, fundisha na uboresha AI ya mazungumzo, gumzo na injini za utambuzi wa usemi kwa huduma zetu za hali ya juu za ufafanuzi wa sauti.
Mwongozo wa Mnunuzi
Mwongozo wa Mnunuzi: Mwongozo Kamili wa AI ya Maongezi
Gumzo ulilozungumza nalo linaendeshwa kwenye mfumo wa hali ya juu wa AI wa mazungumzo ambao umefunzwa, kujaribiwa na kutengenezwa kwa kutumia tani nyingi za seti za data za utambuzi wa usemi.
Katalogi ya Data
Katalogi ya Data ya Matamshi ya Nje ya Rafu na Utoaji Leseni
Kuna anuwai ya matumizi ya kawaida ya data ya hotuba katika miradi ya AI. Tunakupa idadi kubwa ya data ya ubora wa juu iliyo tayari kwa utambuzi wa sauti yako.
Je, ungependa kuunda hifadhidata yako ya sauti?
Wasiliana na mtaalamu wetu wa ukusanyaji wa data ya matamshi ya ndani ili kusanidi hazina ya sauti ambayo inakidhi mahitaji yako
Maswali yanayoulizwa (FAQ)
Ukusanyaji wa Data ya Hotuba kwa Mfano wa ML unarejelea mchakato wa kukusanya rekodi za sauti za lugha inayozungumzwa. Mkusanyiko huu husaidia katika mafunzo na kuboresha kanuni za kujifunza za mashine, hasa zile zinazolenga kuelewa na kuchakata sauti za binadamu.
Unapolenga kukusanya data ya sauti ya Utambuzi wa Usemi Kiotomatiki (ASR), unapaswa kuanza kwa kufafanua mahitaji mahususi ya mradi wako, ikijumuisha lugha unayotaka, lafudhi na aina ya usemi. Baada ya kuweka vigezo hivi, hakikisha unapata ruhusa zote muhimu ili kuheshimu faragha ya mtumiaji. Kisha, tumia vifaa vinavyofaa vya kurekodia au programu ili kunasa sampuli za sauti zilizo wazi. Kila rekodi inapaswa kufafanuliwa kwa uangalifu na manukuu yake au metadata nyingine muhimu na kuhifadhiwa kwa utaratibu kwa ufikiaji rahisi.
Seti ya data ya hotuba katika ujifunzaji wa mashine ni muhimu kwa mafunzo, majaribio na uthibitishaji wa miundo iliyoundwa kutambua, kunakili au kutafsiri lugha inayozungumzwa. Seti kama hizo za data hufungua njia kwa maelfu ya programu, kutoka kwa visaidizi vya sauti na huduma za unukuzi hadi bayometriki za sauti.
Ili kukusanya data sahihi kutoka kwa lugha na lafudhi mbalimbali, ushirikiano na wazungumzaji asilia wa asili ya lugha inayotakikana ni muhimu. Lenga sampuli tofauti na wakilishi ili kufunika wigo mpana wa nuances ya idadi ya watu. Tumia vifaa vya kurekodi vilivyosanifiwa katika mazingira sare ili kuhakikisha uthabiti wa sauti. Na muhimu zaidi, fafanua kila kipande cha data kwa manukuu ya kina na metadata, inayoashiria lugha na lafudhi mahususi.