Kifani: Mkusanyiko wa Matamshi
Imewasilishwa kwa Matamshi 7M+ ili kuunda wasaidizi wa kidijitali wa lugha nyingi katika lugha 13
Suluhisho la Ulimwenguni
Takwimu ambazo zinawezesha mazungumzo ya ulimwengu
Haja ya mafunzo ya Matamshi hutokea kwa sababu si wateja wote wanaotumia maneno au vishazi hususa wanapozungumza au kuuliza maswali kwa wasaidizi wao wa sauti katika umbizo la hati. Ndiyo maana programu mahususi za sauti lazima zifunzwe kuhusu data ya matamshi ya hiari. Kwa mfano, "Hospitali iliyo karibu zaidi iko wapi?" "Tafuta hospitali karibu nami" au "Je, kuna hospitali karibu?" zote zinaonyesha dhamira moja ya utafutaji lakini zimesemwa tofauti.
Tatizo
Ili kutekeleza ramani ya hotuba ya Mratibu wa Dijiti kwa lugha za ulimwenguni pote, timu ilihitaji kupata data nyingi za mafunzo kwa ajili ya muundo wa AI wa utambuzi wa usemi. Mahitaji muhimu ya mteja yalikuwa:
- Pata idadi kubwa ya data ya mafunzo (vidokezo vya mzungumzaji mmoja visivyozidi sekunde 3-30 ) kwa huduma za utambuzi wa usemi katika lugha 13 za kimataifa.
- Kwa kila lugha, mtoa huduma atatoa vidokezo vya maandishi kwa wasemaji kurekodi (isipokuwa faili ya
mteja) na uandike sauti inayotokana. - Toa data ya sauti na unukuzi wa matamshi yaliyorekodiwa na faili zinazolingana za JSON
iliyo na metadata ya rekodi zote. - Hakikisha kuna mchanganyiko mbalimbali wa wazungumzaji kulingana na umri, jinsia, elimu na lahaja
- Hakikisha mchanganyiko tofauti wa mazingira ya kurekodi kulingana na Viagizo.
- Kila rekodi ya sauti itakuwa angalau 16kHz lakini ikiwezekana 44kHz
"Baada ya kutathmini wachuuzi wengi, mteja alichagua Shaip kwa sababu ya utaalam wao katika miradi ya mazungumzo ya AI. Tulivutiwa na umahiri wa utekelezaji wa mradi wa Shaip, utaalam wao wa kupata, kunakili na kutoa matamshi yanayohitajika kutoka kwa wataalamu wa lugha katika lugha 13 ndani ya muda uliowekwa na ubora unaohitajika”
Suluhisho
Kwa uelewa wetu wa kina wa AI ya mazungumzo, tulimsaidia mteja kukusanya, kunakili na kufafanua data na timu ya wataalamu wa lugha na wafafanuzi ili kutoa mafunzo kwa Mfumo wao wa Kuchakata Hotuba wa lugha nyingi unaoendeshwa na AI.
Upeo wa kazi ya Shaip ulijumuisha lakini haukuwa mdogo tu katika kupata kiasi kikubwa cha data ya mafunzo ya sauti kwa ajili ya utambuzi wa usemi, kunukuu rekodi za sauti katika lugha nyingi kwa lugha zote kwenye ramani yetu ya lugha ya Tier 1 na Daraja la 2, na kuwasilisha sambamba. JSON faili zilizo na metadata. Shaipi alikusanya matamshi ya sekunde 3-30 kwa kipimo huku akidumisha viwango vinavyohitajika vya ubora vinavyohitajika ili kutoa mafunzo kwa miundo ya ML kwa miradi changamano.
- Sauti Imekusanywa, Imenukuliwa na Kufafanuliwa: 22,250 masaa
- Lugha Zinazotumika: 13 (Kideni, Kikorea, Kiarabu cha Saudi Arabia, Kiholanzi, Bara & Taiwan Kichina, Kifaransa cha Kanada, Kihispania cha Meksiko, Kituruki, Kihindi, Kipolandi, Kijapani, Kirusi)
- Idadi ya Matamshi: 7M +
- Timeline: 7-8 miezi
Wakati tunakusanya matamshi ya sauti kwa 16 kHz, tulihakikisha mchanganyiko mzuri wa wasemaji kulingana na umri, jinsia, elimu na lahaja katika mazingira tofauti ya kurekodi.
Matokeo yake
Data ya sauti ya ubora wa juu kutoka kwa wataalamu wa lugha ilimwezesha mteja kutoa mafunzo kwa usahihi muundo wao wa Utambuzi wa Usemi wa lugha nyingi katika lugha 13 za Kiwango cha 1 & 2 cha Global. Kwa kutumia hifadhidata za mafunzo ya kiwango cha dhahabu, mteja anaweza kutoa usaidizi wa kidijitali wa akili na dhabiti ili kutatua matatizo ya siku za usoni ya ulimwengu halisi.
Utaalamu wetu
Rasilimali Zinazopendekezwa
Mwongozo wa Mnunuzi
Mwongozo wa Mnunuzi: AI ya Maongezi
Gumzo ulilozungumza nalo linaendeshwa kwenye mfumo wa hali ya juu wa AI wa mazungumzo ambao umefunzwa, kujaribiwa na kutengenezwa kwa kutumia tani nyingi za seti za data za utambuzi wa usemi.
blogu
Hali ya Mazungumzo AI 2021
Infographics ya Mazungumzo AI 2021 huzungumza juu ya AI ya Mazungumzo, mabadiliko yake, aina, Soko la Mazungumzo la AI na Mkoa, Matumizi ya Kesi, changamoto, nk.
blogu
3 Vikwazo kwa Mageuzi ya AI ya Mazungumzo
Shaip ni kuruka-kuanza mageuzi ya AI ya mazungumzo kama zana ya ushiriki wa mteja kwa kutoa data muhimu ya sauti katika 50+ lugha.
Tuambie ni jinsi gani tunaweza kusaidia na mpango wako unaofuata wa AI.