Bankas čeku datu kopa (dokuments AI)
Izmantot gadījumu: OCR
Formāts: . Jpg
Skaits: 2023
Anotācija: Nē
Apraksts: Bankas čeku datu kopa (AI dokuments): sintētiskie bankas čeki sastāv no mākslīgi ģenerētiem čeku attēliem, kas paredzēti, lai atkārtotu īstu čeku izskatu un saturu. Tas ietver dažādus elementus, piemēram, maksājuma saņēmēju vārdus, summas, datumus, parakstus un čeku numurus. Šī datu kopa tiek izmantota dokumentu AI sistēmu apmācībai un novērtēšanai tādos uzdevumos kā optiskā rakstzīmju atpazīšana (OCR), čeku apstrāde un automatizēta datu ieguve, nodrošinot kontrolētu vidi modeļa izstrādei bez īstu čeku privātuma bažām.
Ierakstīšanas nosacījums: - Noklikšķinātie attēli - Skenētie - Web skrāpis
Bankas izrakstu datu kopa (dokuments AI)
Izmantot gadījumu: OCR
Formāts: .jpg, png
Skaits: 5366
Anotācija: Nē
Apraksts: Bankas izrakstu datu kopa (Document AI): sintētiskie bankas izraksti ietver mākslīgi ģenerētus bankas izrakstus, kas paredzēti reālu finanšu dokumentu simulācijai. Tajā ir dažādi darījumu ieraksti, datumi, summas un konta informācija, kas veidota tā, lai atspoguļotu reālās pasaules formātus un saturu. Šī datu kopa tiek izmantota dokumentu AI sistēmu apmācībai un novērtēšanai tādos uzdevumos kā optiskā rakstzīmju atpazīšana (OCR), datu ieguve un dokumentu analīze, piedāvājot kontrolētu vidi bez faktisko finanšu datu privātuma problēmām.
Ierakstīšanas nosacījums: - Skenēts - Bankas izraksts - Web scrapper
Ķīnas rēķinu datu kopa
Izmantot gadījumu: OCR
Formāts: attēls
Skaits: 6k
Anotācija: Jā
Apraksts: Ķīniešu rēķinu datu kopā ir iekļauti dažādu veidu rēķinu attēli vai teksta paraugi, piemēram, rēķini, kvītis un izraksti, kas rakstīti ķīniešu valodā. Tajā ir dažādi formāti un saturs, tostarp preču apraksti, summas un datumi. Šī datu kopa tiek izmantota tādiem uzdevumiem kā optiskā rakstzīmju atpazīšana (OCR), finanšu dokumentu apstrāde un automatizēta datu ieguve.
Dokumenti / OCR – arābu un angļu valodas OCR satura datu kopa
Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 1,321
Anotācija: Nē
Apraksts: Arābu un angļu valodas satura attēlu kolekcija: attēls + anotācija OCR
Dokumenti/OCR – svītrkodu video datu kopa

Izmantot gadījumu: Dokumenti / OCR
Formāts: video
Skaits: 2,767
Anotācija: Nē
Apraksts: Svītrkodu video (Code128, UPC/EAN, PDF417, Aztec, Multicode)
Dokumenti / OCR – izliekta drukāta teksta datu kopa
Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 18,986
Anotācija: Nē
Apraksts: Izliekts drukāts teksts: apkopojiet attēlus ar izliektu tekstu vai tekstu ar nelineāru bāzes līniju.
Dokumenti/OCR – finanšu dokumenti (bankas, algas lapas, nodokļu, ASV)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 26,446
Anotācija: Nē
Apraksts: Finanšu dokumenti: bankas izraksts, čeks, algas lapa, nodokļu, hipotēkas, apdrošināšanas atlīdzības pieprasījumi (ASV)
Dokumenti / OCR – finanšu dokumenti (1. fāze – hipotēka)
Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 9,192
Anotācija: Nē
Apraksts: Finanšu dokumenti (1. fāze). Hipotēkas datu kopa — drukāšana, skenēšana, fotografēšana
Dokumenti / OCR – finanšu dokumenti (2. fāze – apdrošināšana)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 7,636
Anotācija: Nē
Apraksts: Finanšu dokumenti (2. fāze). Apdrošināšanas datu kopa — drukāšana, skenēšana, fotografēšana
Dokumenti/OCR – ar roku rakstīta teksta datu kopa (Japāna/KR/RU)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 106,313
Anotācija: Nē
Apraksts: Rokrakstā rakstīts teksts: LivePhotos ar rokrakstā rakstītu tekstu (japāņu, korejiešu, krievu valodā)
Dokumenti/OCR – rēķinu datu kopa ar ierobežojošā lodziņa anotāciju

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 87
Anotācija: Jā
Apraksts: Rēķinu datu kopa ar ierobežojošo lodziņu anotācijām ietver skenētus vai digitālus rēķinus, kuros galvenie lauki, piemēram, rēķina numurs, datums, piegādātāja informācija, rindu vienības un kopsummas, ir apzīmēti ar ierobežojošajiem lodziņiem, ļaujot mākslīgā intelekta modeļiem precīzi noteikt un iegūt strukturētu informāciju no nestrukturētiem dokumentiem.
Dokumenti/OCR — LivePhotos ar drukātu tekstu (Japāna/KR/RU)
Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 4,944
Anotācija: Nē
Apraksts: LivePhotos ar drukātu tekstu (japāņu, korejiešu, krievu valodā)
Dokumenti/OCR – daudzvalodu kvīšu/rēķinu datu kopa

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 8,961
Anotācija: Nē
Apraksts: Daudzvalodu kvīšu un rēķinu datu kopa ietver dažādus finanšu dokumentus vairākās valodās, ļaujot mākslīgā intelekta modeļiem apmācīties starpvalodu teksta atpazīšanai, galveno lauku ieguvei un dokumentu izpratnei.
Dokumenti / OCR – sintētiskie bankas izraksti (40 veidnes)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 1,290
Anotācija: Nē
Apraksts: Bankas izraksti — unikāla veidne — 40: Sintētiski bankas izraksti
Dokumenti / OCR – sintētiskās algas lapas (60 veidnes)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 2,010
Anotācija: Nē
Apraksts: Čeks — unikāla veidne — 60: sintētiskas algas lapas
Dokumenti / OCR – sintētiskās algas lapas (130 veidnes)

Izmantot gadījumu: Dokumenti / OCR
Formāts: Attēli
Skaits: 2,023
Anotācija: Nē
Apraksts: Algas lapas — unikāla veidne — 130: sintētisks bankas čeks
Maksājumu kvīšu datu kopa (dokuments AI)

Izmantot gadījumu: OCR
Formāts: . Jpg
Skaits: 2010
Anotācija: Nē
Apraksts: Darba samaksas čeku datu kopa (AI dokuments): sintētiskās algas biļetes sastāv no mākslīgi ģenerētu algu lapu attēliem bez jebkādām anotācijām. Tajā ir iekļauti dažādi algas kvīšu formāti un informācija, piemēram, darbinieku vārdi, algas un datumi, ko izmanto dokumentu AI sistēmu apmācībai un testēšanai tādos uzdevumos kā OCR un dokumentu apstrāde.
Ierakstīšanas nosacījums: - Skenēts - Web skrāpis


