Kifani: Mkusanyiko wa Matamshi

Imewasilishwa kwa Matamshi 7M+ ili kuunda wasaidizi wa kidijitali wa lugha nyingi katika lugha 13

Mkusanyiko wa Matamshi

Suluhisho la Ulimwenguni

Takwimu ambazo zinawezesha mazungumzo ya ulimwengu

Haja ya mafunzo ya Matamshi hutokea kwa sababu si wateja wote wanaotumia maneno au vishazi hususa wanapozungumza au kuuliza maswali kwa wasaidizi wao wa sauti katika umbizo la hati. Ndiyo maana programu mahususi za sauti lazima zifunzwe kuhusu data ya matamshi ya hiari. Kwa mfano, "Hospitali iliyo karibu zaidi iko wapi?" "Tafuta hospitali karibu nami" au "Je, kuna hospitali karibu?" zote zinaonyesha dhamira moja ya utafutaji lakini zimesemwa tofauti.

Mkusanyiko wa Matamshi1

Tatizo

Ili kutekeleza ramani ya hotuba ya Mratibu wa Dijiti kwa lugha za ulimwenguni pote, timu ilihitaji kupata data nyingi za mafunzo kwa ajili ya muundo wa AI wa utambuzi wa usemi. Mahitaji muhimu ya mteja yalikuwa:

  • Pata idadi kubwa ya data ya mafunzo (vidokezo vya mzungumzaji mmoja visivyozidi sekunde 3-30 ) kwa huduma za utambuzi wa usemi katika lugha 13 za kimataifa.
  • Kwa kila lugha, mtoa huduma atatoa vidokezo vya maandishi kwa wasemaji kurekodi (isipokuwa faili ya
    mteja) na uandike sauti inayotokana.
  • Toa data ya sauti na unukuzi wa matamshi yaliyorekodiwa na faili zinazolingana za JSON
    iliyo na metadata ya rekodi zote.
  • Hakikisha kuna mchanganyiko mbalimbali wa wazungumzaji kulingana na umri, jinsia, elimu na lahaja
  • Hakikisha mchanganyiko tofauti wa mazingira ya kurekodi kulingana na Viagizo.
  • Kila rekodi ya sauti itakuwa angalau 16kHz lakini ikiwezekana 44kHz

Kuharakisha AI yako ya Mazungumzo
maendeleo ya maombi kwa 100%

"Baada ya kutathmini wachuuzi wengi, mteja alichagua Shaip kwa sababu ya utaalam wao katika miradi ya mazungumzo ya AI. Tulivutiwa na umahiri wa utekelezaji wa mradi wa Shaip, utaalam wao wa kupata, kunakili na kutoa matamshi yanayohitajika kutoka kwa wataalamu wa lugha katika lugha 13 ndani ya muda uliowekwa na ubora unaohitajika”

Suluhisho

Kwa uelewa wetu wa kina wa AI ya mazungumzo, tulimsaidia mteja kukusanya, kunakili na kufafanua data na timu ya wataalamu wa lugha na wafafanuzi ili kutoa mafunzo kwa Mfumo wao wa Kuchakata Hotuba wa lugha nyingi unaoendeshwa na AI.

Upeo wa kazi ya Shaip ulijumuisha lakini haukuwa mdogo tu katika kupata kiasi kikubwa cha data ya mafunzo ya sauti kwa ajili ya utambuzi wa usemi, kunukuu rekodi za sauti katika lugha nyingi kwa lugha zote kwenye ramani yetu ya lugha ya Tier 1 na Daraja la 2, na kuwasilisha sambamba. JSON faili zilizo na metadata. Shaipi alikusanya matamshi ya sekunde 3-30 kwa kipimo huku akidumisha viwango vinavyohitajika vya ubora vinavyohitajika ili kutoa mafunzo kwa miundo ya ML kwa miradi changamano.

  • Sauti Imekusanywa, Imenukuliwa na Kufafanuliwa: 22,250 masaa
  • Lugha Zinazotumika: 13 (Kideni, Kikorea, Kiarabu cha Saudi Arabia, Kiholanzi, Bara & Taiwan Kichina, Kifaransa cha Kanada, Kihispania cha Meksiko, Kituruki, Kihindi, Kipolandi, Kijapani, Kirusi)
  • Idadi ya Matamshi: 7M +
  • Timeline: 7-8 miezi

Wakati tunakusanya matamshi ya sauti kwa 16 kHz, tulihakikisha mchanganyiko mzuri wa wasemaji kulingana na umri, jinsia, elimu na lahaja katika mazingira tofauti ya kurekodi.

Matokeo yake

Data ya sauti ya ubora wa juu kutoka kwa wataalamu wa lugha ilimwezesha mteja kutoa mafunzo kwa usahihi
kielelezo chao cha Utambuzi wa Usemi wa lugha nyingi katika lugha 13 za Kiwango cha 1 & 2 cha Global. Kwa kutumia hifadhidata za mafunzo ya kiwango cha dhahabu, mteja anaweza kutoa usaidizi wa kidijitali wa akili na dhabiti ili kutatua matatizo ya siku za usoni ya ulimwengu halisi.

Utaalamu wetu

0 +
Saa za Hotuba Zimekusanywa
0
Timu ya Wakusanyaji Data ya Sauti
0 %
PII Inayofuata
0 +
Nambari ya baridi
> 0
Kukubalika kwa Data na Usahihi
0 +
Bahati 500 Mteja

Tuambie ni jinsi gani tunaweza kusaidia na mpango wako unaofuata wa AI.