Maono ya Kompyuta

22+ Seti za Data Zilizotafutwa Zaidi za Chanzo-wazi kwa Maono ya Kompyuta

Algorithm ya AI ni nzuri tu kama data unayolisha.

Si kauli ya kijasiri wala isiyo ya kawaida. AI ingeweza kuonekana kuwa ya mbali miongo kadhaa iliyopita, lakini Akili Bandia na Kujifunza kwa Mashine zimetoka mbali sana tangu wakati huo.

Maono ya kompyuta husaidia kompyuta kuelewa na kufasiri lebo na picha. Unapofunza kompyuta yako kwa kutumia aina sahihi ya picha, inaweza kupata uwezo wa kutambua, kuelewa na kutambua vipengele mbalimbali vya uso, kugundua magonjwa, kuendesha magari yanayojiendesha, na pia kuokoa maisha kwa kutumia utambazaji wa viungo vya pande nyingi.

Soko la Maono ya Kompyuta linatabiriwa kufikia Milioni ya $ 144.46 ifikapo 2028 kutoka kwa wastani wa $ 7.04 Bilioni mnamo 2020, ikikua kwa CAGR ya 45.64% kati ya 2021 na 2028.

Baadhi ya kesi za matumizi ya maono ya kompyuta ni:

  • Kupiga picha ya matibabu
  • Gari inayojitegemea
  • Utambuzi wa uso na kitu
  • Utambulisho wa kasoro
  • Utambuzi wa eneo

The seti ya picha unalisha na kufundisha kazi zako za Kujifunza kwa Mashine na maono ya kompyuta ni muhimu kwa mafanikio ya mradi wako wa AI. Seti ya data ya ubora ni ngumu sana kupata. Kulingana na utata wa mradi wako, inaweza kuchukua popote kati ya siku chache hadi wiki chache kupata seti za data zinazotegemewa na zinazofaa kwa madhumuni ya kuona kwa kompyuta.

Hapa, tunakupa anuwai (iliyoainishwa kwa urahisi wako) ya mkusanyiko wa hifadhidata huria unayoweza kutumia mara moja.

Orodha ya Kina ya Seti za Data za Maono ya Kompyuta

Mkuu:

  1. ImageNet (Kiungo)

    ImageNet ni seti ya data inayotumika sana, na inakuja na picha za kushangaza milioni 1.2 zilizowekwa katika kategoria 1000. Seti hii ya data imepangwa kulingana na daraja la WorldNet na kugawanywa katika sehemu tatu - data ya mafunzo, lebo za picha na data ya uthibitishaji.

  2. Kinetiki 700 (Kiungo)

    Kinetics 700 ni mkusanyiko mkubwa wa data wa ubora wa juu na klipu zaidi ya 650,000 za madarasa 700 tofauti ya vitendo vya binadamu. Kila hatua ya darasa ina takriban klipu 700 za video. Klipu katika mkusanyiko wa data zina mwingiliano wa binadamu na binadamu na binadamu, ambao unaonekana kusaidia sana wakati wa kutambua matendo ya binadamu katika video.

  3. CIFAR-10 (Kiungo)

    CIFAR 10 ni mojawapo ya hifadhidata kubwa zaidi za maono ya kompyuta inayojivunia picha za rangi 60000 32 x 32 zinazowakilisha madarasa kumi tofauti. Kila darasa lina takriban picha 6000 zinazotumiwa kufunza algoriti za maono ya kompyuta na kujifunza kwa mashine.

Utambuzi wa Uso:

usoni Recognition

  1. Nyuso Zilizoandikwa Porini (Kiungo)

    Inayoitwa Faced in the Wild ni hifadhidata kubwa iliyo na zaidi ya picha 13,230 za karibu watu 5,750 waliotambuliwa kutoka kwa mtandao. Seti hii ya data ya nyuso imeundwa ili kurahisisha kusoma utambuzi wa nyuso bila kikomo.

  2. CASIA WebFace (Kiungo)

    CASIA Web face ni mkusanyiko wa data ulioundwa vyema ambao husaidia kujifunza kwa mashine na utafiti wa kisayansi kuhusu utambuzi wa uso usio na kikomo. Ikiwa na zaidi ya picha 494,000 za karibu vitambulisho halisi 10,000, ni bora kwa kazi za utambuzi wa uso na uthibitishaji.

  3. Seti ya data ya Nyuso za UMD (Kiungo)

    UMD inakabiliwa na seti ya data iliyofafanuliwa vyema ambayo ina sehemu mbili - picha tuli na fremu za video. Seti ya data ina zaidi ya vidokezo 367,800 vya nyuso na fremu za video zenye maelezo milioni 3.7 za masomo.

Utambuzi wa Mwandiko:

  1. Hifadhidata ya MNIST (Kiungo)

    MNIST ni hifadhidata iliyo na sampuli za tarakimu zilizoandikwa kwa mkono kutoka 0 hadi 9, na ina picha 60,000 na 10,000 za mafunzo na majaribio. Iliyotolewa mwaka wa 1999, MNIST hurahisisha kujaribu mifumo ya uchakataji wa picha katika Mafunzo ya Kina.

  2. Seti ya Data ya Herufi Bandia (Kiungo)

    Seti ya Data ya Herufi Bandia ni, kama jina linavyopendekeza, data iliyozalishwa kwa njia ghushi inayoelezea muundo wa lugha ya Kiingereza katika herufi kubwa kumi. Inakuja na zaidi ya picha 6000.

Wacha tujadili mahitaji yako ya Takwimu za Mafunzo ya AI leo.

Kugundua kitu:

  1. MS COCO (Kiungo)

    MS COCO au Vipengee vya Kawaida katika Muktadha ni utambuzi wa kitu na mkusanyiko wa maelezo mafupi.

    Ina zaidi ya picha 328,000 zilizo na utambuzi wa pointi muhimu, utambuzi wa vitu vingi, maelezo mafupi, na vidokezo vya vinyago vya sehemu. Inakuja na kategoria 80 za vitu na vichwa vitano kwa kila picha.

  2. LSUN(Kiungo)

    LSUN, kifupi cha Kuelewa kwa Mahali Kubwa, ina zaidi ya picha milioni zilizo na lebo katika aina 20 za vitu na 10 za onyesho. Baadhi ya kategoria zina takriban picha 300,000, zenye picha 300 mahususi kwa ajili ya uthibitishaji na picha 1000 za data ya majaribio.

  3. Vitu vya Nyumbani(Kiungo)

    Seti ya data ya Vipengee vya Nyumbani ina picha zenye maelezo ya vitu nasibu kutoka nyumbani - jikoni, sebule na bafuni. Seti hii ya data pia ina video chache zilizofafanuliwa na picha 398 ambazo hazina maelezo zilizoundwa kwa majaribio.

Magari:

  1. Seti ya data ya muundo wa jiji (Kiungo)

    Cityscape ni seti ya data ya kwenda unapotafuta mifuatano mbalimbali ya video iliyorekodiwa kutoka matukio kadhaa ya mtaani. Picha hizi zilinaswa kwa muda mrefu na katika hali tofauti za hali ya hewa na mwanga. Vidokezo ni vya madarasa 30 ya picha zilizogawanywa katika kategoria nane tofauti.

  2. Barkley Deep Drive (Kiungo)

    Barkley DeepDrive imeundwa mahususi kwa mafunzo ya magari yanayojiendesha, na ina zaidi ya mfuatano wa video elfu 100 wenye maelezo. Ni mojawapo ya data muhimu zaidi ya mafunzo kwa magari yanayojiendesha kwa kubadilisha barabara na hali ya uendeshaji.

  3. Mapilari (Kiungo)

    Mapillary ina zaidi ya matukio ya barabarani milioni 750 na ishara za trafiki duniani kote, ambayo ni muhimu sana katika kutoa mafunzo kwa miundo ya mtazamo wa kuona katika kujifunza kwa mashine na algoriti za AI. Inakuruhusu kukuza magari yanayojitegemea ambayo yanashughulikia taa na hali ya hewa na maoni anuwai.

Picha za Matibabu:

  1. Covid-19 Open Research Dataset (Kiungo)

    Seti hii ya data asili ina takriban sehemu 6500 za mapafu ya pikseli-polygonal kuhusu eksirei za kifua za AP/PA. Zaidi ya hayo, picha 517 za eksirei ya mgonjwa wa Covid-19 zilizo na vitambulisho vilivyo na jina, eneo, maelezo ya kulazwa, matokeo, na zaidi.

  2. Hifadhidata ya NIH ya X-Rays 100,000 za kifua (Kiungo)

    Hifadhidata ya NIH ni mojawapo ya hifadhidata zinazopatikana kwa umma zaidi zilizo na picha 100,000 za eksirei za kifua na data inayohusiana na hiyo muhimu kwa jumuiya ya kisayansi na utafiti. Hata ina picha za wagonjwa walio na hali ya juu ya mapafu.

  3. Atlas ya Patholojia ya Dijiti (Kiungo)

    Atlas of Digital Pathology inatoa picha kadhaa za kiraka cha histopatholojia, zaidi ya 17,000 kwa jumla, kutoka karibu na slaidi 100 zenye maelezo ya viungo tofauti. Seti hii ya data ni muhimu katika kutengeneza maono ya kompyuta na programu ya utambuzi wa muundo.

Utambuzi wa Scene:

Utambuzi wa Onyesho

  1. Utambuzi wa Onyesho la Ndani (Kiungo)

    Utambuzi wa Mandhari ya Ndani ni seti ya data iliyoainishwa kwa kiwango cha juu yenye takriban picha 15620 za vitu na mandhari ya ndani zitakazotumika katika kujifunza kwa mashine na mafunzo ya data. Inakuja na zaidi ya kategoria 65, na kila aina ina angalau picha 100.

  2. xTazama (Kiungo)

    Kama mojawapo ya mkusanyiko wa data unaojulikana zaidi kwa umma, xView ina toni nyingi za taswira ya maelezo ya juu kutoka matukio mbalimbali changamano na makubwa. Kwa kuwa na takriban madarasa 60 na zaidi ya matukio milioni moja ya vitu, madhumuni ya mkusanyiko huu wa data ni kutoa misaada bora ya maafa kwa kutumia picha za satelaiti.

  3. Maeneo (Kiungo)

    Maeneo, seti ya data iliyochangiwa na MIT, ina zaidi ya picha milioni 1.8 kutoka kategoria 365 tofauti za eneo. Kuna takriban picha 50 katika kila moja ya kategoria hizi kwa uthibitisho na picha 900 za majaribio. Kujifunza vipengele vya kina vya eneo ili kuanzisha utambuzi wa eneo au kazi za utambuzi wa kuona kunawezekana.

Entertainment:

  1. Hifadhidata ya IMDB WIKI (Kiungo)

    IMDB - Wiki ni mojawapo ya hifadhidata za umma maarufu za nyuso zilizo na lebo ya kutosha ya umri, jinsia na majina. Pia ina takriban nyuso elfu 20 za watu mashuhuri na elfu 62 kutoka Wikipedia.

  2. Nyuso za Celeb (Kiungo)

    Celeb Faces ni hifadhidata kubwa iliyo na picha 200,000 za watu mashuhuri. Picha huja na kelele za mandharinyuma na tofauti tofauti, na kuzifanya ziwe muhimu kwa mafunzo ya seti za majaribio katika kazi za kuona kwa kompyuta. Ni ya manufaa sana kwa kupata usahihi wa juu zaidi katika utambuzi wa uso, uhariri, ujanibishaji wa sehemu ya uso, na zaidi.

Kwa kuwa sasa una orodha kubwa ya hifadhidata za picha za chanzo huria ili kuongeza kasi kwenye mashine yako ya kijasusi. Matokeo ya AI yako na miundo ya kujifunza ya mashine inategemea hasa ubora wa hifadhidata unazolisha na kuzifunza. Ikiwa unataka muundo wako wa AI kutoa utabiri sahihi, unahitaji hifadhidata za ubora ambazo zimejumlishwa, kutambulishwa na kuwekewa lebo ya ukamilifu. Ili kukuza mafanikio ya mfumo wa maono ya kompyuta yako, lazima utumie hifadhidata za picha za ubora zinazohusiana na maono yako ya mradi. Ikiwa unatafuta hifadhidata zaidi kama hizo Bonyeza hapa

Kushiriki kwa Jamii

Unaweza pia Like