Kifani: Mkusanyiko wa Matamshi

Imewasilishwa kwa Matamshi 7M+ ili kuunda wasaidizi wa kidijitali wa lugha nyingi katika lugha 13

Suluhisho la Ulimwenguni

Takwimu ambazo zinawezesha mazungumzo ya ulimwengu

Haja ya mafunzo ya Matamshi hutokea kwa sababu si wateja wote wanaotumia maneno au vishazi hususa wanapozungumza au kuuliza maswali kwa wasaidizi wao wa sauti katika umbizo la hati. Ndiyo maana programu mahususi za sauti lazima zifunzwe kuhusu data ya matamshi ya hiari. Kwa mfano, "Hospitali iliyo karibu zaidi iko wapi?" "Tafuta hospitali karibu nami" au "Je, kuna hospitali karibu?" zote zinaonyesha dhamira moja ya utafutaji lakini zimesemwa tofauti.

Tatizo

Ili kutekeleza ramani ya hotuba ya Mratibu wa Dijiti kwa lugha za ulimwenguni pote, timu ilihitaji kupata data nyingi za mafunzo kwa ajili ya muundo wa AI wa utambuzi wa usemi. Mahitaji muhimu ya mteja yalikuwa:

Pata idadi kubwa ya data ya mafunzo (vidokezo vya mzungumzaji mmoja visivyozidi sekunde 3-30 ) kwa huduma za utambuzi wa usemi katika lugha 13 za kimataifa.
Kwa kila lugha, mtoa huduma atatoa vidokezo vya maandishi kwa wasemaji kurekodi (isipokuwa faili ya
mteja) na uandike sauti inayotokana.
Toa data ya sauti na unukuzi wa matamshi yaliyorekodiwa na faili zinazolingana za JSON
iliyo na metadata ya rekodi zote.
Hakikisha kuna mchanganyiko mbalimbali wa wazungumzaji kulingana na umri, jinsia, elimu na lahaja
Hakikisha mchanganyiko tofauti wa mazingira ya kurekodi kulingana na Viagizo.
Kila rekodi ya sauti itakuwa angalau 16kHz lakini ikiwezekana 44kHz

Kuharakisha AI yako ya Mazungumzo
maendeleo ya maombi kwa 100%

"Baada ya kutathmini wachuuzi wengi, mteja alichagua Shaip kwa sababu ya utaalam wao katika miradi ya mazungumzo ya AI. Tulivutiwa na umahiri wa utekelezaji wa mradi wa Shaip, utaalam wao wa kupata, kunakili na kutoa matamshi yanayohitajika kutoka kwa wataalamu wa lugha katika lugha 13 ndani ya muda uliowekwa na ubora unaohitajika”

Suluhisho

Kwa uelewa wetu wa kina wa AI ya mazungumzo, tulimsaidia mteja kukusanya, kunakili na kufafanua data na timu ya wataalamu wa lugha na wafafanuzi ili kutoa mafunzo kwa Mfumo wao wa Kuchakata Hotuba wa lugha nyingi unaoendeshwa na AI.

Upeo wa kazi ya Shaip ulijumuisha lakini haukuwa mdogo tu katika kupata kiasi kikubwa cha data ya mafunzo ya sauti kwa ajili ya utambuzi wa usemi, kunukuu rekodi za sauti katika lugha nyingi kwa lugha zote kwenye ramani yetu ya lugha ya Tier 1 na Daraja la 2, na kuwasilisha sambamba. JSON faili zilizo na metadata. Shaipi alikusanya matamshi ya sekunde 3-30 kwa kipimo huku akidumisha viwango vinavyohitajika vya ubora vinavyohitajika ili kutoa mafunzo kwa miundo ya ML kwa miradi changamano.

Sauti Imekusanywa, Imenukuliwa na Kufafanuliwa: 22,250 masaa
Lugha Zinazotumika: 13 (Kideni, Kikorea, Kiarabu cha Saudi Arabia, Kiholanzi, Bara & Taiwan Kichina, Kifaransa cha Kanada, Kihispania cha Meksiko, Kituruki, Kihindi, Kipolandi, Kijapani, Kirusi)
Idadi ya Matamshi: 7M +
Timeline: 7-8 miezi

Wakati tunakusanya matamshi ya sauti kwa 16 kHz, tulihakikisha mchanganyiko mzuri wa wasemaji kulingana na umri, jinsia, elimu na lahaja katika mazingira tofauti ya kurekodi.

Matokeo yake

Data ya sauti ya ubora wa juu kutoka kwa wataalamu wa lugha ilimwezesha mteja kutoa mafunzo kwa usahihi muundo wao wa Utambuzi wa Usemi wa lugha nyingi katika lugha 13 za Kiwango cha 1 & 2 cha Global. Kwa kutumia hifadhidata za mafunzo ya kiwango cha dhahabu, mteja anaweza kutoa usaidizi wa kidijitali wa akili na dhabiti ili kutatua matatizo ya siku za usoni ya ulimwengu halisi.

Utaalamu wetu

Saa za Hotuba Zimekusanywa

0 +

Timu ya Wakusanyaji Data ya Sauti

PII Inayofuata

0 %

Nambari ya baridi

0 +

Kukubalika kwa Data na Usahihi

> 0

Bahati 500 Mteja

0 +

Rasilimali Zinazopendekezwa

Mwongozo wa Mnunuzi

Mwongozo wa Mnunuzi: AI ya Maongezi

Gumzo ulilozungumza nalo linaendeshwa kwenye mfumo wa hali ya juu wa AI wa mazungumzo ambao umefunzwa, kujaribiwa na kutengenezwa kwa kutumia tani nyingi za seti za data za utambuzi wa usemi.

blogu

Hali ya Mazungumzo AI 2021

Infographics ya Mazungumzo AI 2021 huzungumza juu ya AI ya Mazungumzo, mabadiliko yake, aina, Soko la Mazungumzo la AI na Mkoa, Matumizi ya Kesi, changamoto, nk.

blogu

3 Vikwazo kwa Mageuzi ya AI ya Mazungumzo

Shaip ni kuruka-kuanza mageuzi ya AI ya mazungumzo kama zana ya ushiriki wa mteja kwa kutoa data muhimu ya sauti katika 50+ lugha.

Kuunda NLP ya kliniki ni kazi muhimu ambayo inahitaji utaalam mkubwa wa kikoa kutatua. Ninaona wazi kuwa wewe ni miaka kadhaa mbele ya Google katika eneo hili. Nataka kufanya kazi na wewe na kukupima.

Google, Inc. Mkurugenzi

Timu yangu ya uhandisi ilifanya kazi na timu ya Shaip kwa miaka 2+ wakati wa ukuzaji wa APIs za hotuba ya huduma ya afya. Tumevutiwa na kazi yao iliyofanywa katika NLP maalum ya huduma ya afya na kile wanachoweza kufikia na hifadhidata ngumu.

Google, Inc. Mkuu wa Uhandisi

Tuambie ni jinsi gani tunaweza kusaidia na mpango wako unaofuata wa AI.

Kifani: Mkusanyiko wa Matamshi

Imewasilishwa kwa Matamshi 7M+ ili kuunda wasaidizi wa kidijitali wa lugha nyingi katika lugha 13

Suluhisho la Ulimwenguni

Tatizo

Suluhisho

Matokeo yake

Utaalamu wetu

Rasilimali Zinazopendekezwa

Mwongozo wa Mnunuzi

Mwongozo wa Mnunuzi: AI ya Maongezi

blogu

Hali ya Mazungumzo AI 2021

blogu

3 Vikwazo kwa Mageuzi ya AI ya Mazungumzo

Huduma za Takwimu za AI

Speciality

Viwanda

Bidhaa

kampuni

rasilimali

Wasiliana nasi

Hebu tujue zaidi juu yako!

Hebu tujue zaidi juu yako!

Hebu tujue zaidi juu yako!

Hebu tujue zaidi juu yako!

Hebu tujue zaidi juu yako!

Hebu tujue zaidi juu yako!