Gadījuma izpēte: satura regulēšana

Vairāk nekā 30 XNUMX tīmekļa dokumentu ir sagriezti un anotēti satura regulēšanai

Satura moderēšana – baneris

Pieaug pieprasījums pēc AI nodrošināta satura regulēšanas, kas cenšas nodrošināt tiešsaistes telpu, kurā mēs savienojamies un sazināmies.

Tā kā sociālo mediju lietojums turpina pieaugt, kiberhuligānisms ir kļuvis par būtisku šķērsli platformām, kas cenšas nodrošināt drošu tiešsaistes telpu. Pārsteidzoši 38% cilvēku katru dienu saskaras ar šo kaitīgo rīcību, uzsverot steidzamo pieprasījumu pēc izgudrojošiem satura moderēšanas paņēmieniem. Mūsdienās organizācijas paļaujas uz mākslīgā intelekta izmantošanu, lai proaktīvi risinātu ilgstošo kiberhuligānisma problēmu.

Kiberdrošība:

Facebook 4. ceturkšņa kopienas standartu izpildes ziņojumā atklāts, ka darbība pret 6.3 miljoniem huligānisma un uzmākšanās satura ar proaktīvu atklāšanas līmeni 49.9%

Izglītība:

2021 pētījums atklāja, ka 36.5% skolēnu Amerikas Savienotajās Valstīs vecumā no 12 & 17 gadu laikā, kad viņi ir piedzīvojuši kiberhuligānismu vienā vai otrā mācību posmā.

Saskaņā ar 2020. gada ziņojumu globālā satura moderēšanas risinājumu tirgus vērtība 4.07. gadā tika novērtēta USD 2019 miljardu apmērā, un tika paredzēts, ka līdz 11.94. gadam tas sasniegs USD 2027 miljardus ar CAGR 14.7%.

Reālās pasaules risinājums

Dati, kas regulē globālas sarunas

Klients izstrādāja stabilu automātisku satura moderēšanas mašīnmācīšanās modeli savam mākoņa piedāvājumam, kuram viņi meklēja domēna specifisku piegādātāju, kas varētu palīdzēt ar precīziem apmācības datiem.

Izmantojot savas plašās zināšanas dabiskās valodas apstrādē (NLP), mēs palīdzējām klientam apkopot, klasificēt un anotēt vairāk nekā 30,000 XNUMX dokumentu gan angļu, gan spāņu valodā, lai izveidotu automātisku satura regulēšanas mašīnmācīšanās modeli, kas sadalīts toksiskā, pieaugušajiem vai seksuāli izteiktā saturā. kategorijas.

Reālās pasaules risinājums

Problēma

  • Tīmeklī tiek iegūti 30,000 XNUMX dokumenti gan spāņu, gan angļu valodā no prioritārajiem domēniem
  • Apkopotā satura iedalīšana īsos, vidējos un garos segmentos
  • Apkopoto datu marķēšana kā toksisks, pieaugušajiem vai seksuāla rakstura saturs
  • Augstas kvalitātes anotāciju nodrošināšana ar vismaz 90% precizitāti.

Šķīdums

  • Tīmeklī tika izņemti 30,000 XNUMX dokumenti spāņu un angļu valodā no BFSI, veselības aprūpes, ražošanas, mazumtirdzniecības. Saturs tika tālāk sadalīts īsos, vidēji garos un garos dokumentos 
  • Veiksmīgi klasificētā satura marķēšana kā toksisks, pieaugušajiem vai seksuāla rakstura saturs
  • Lai sasniegtu 90% kvalitāti, Shaip ieviesa divu līmeņu kvalitātes kontroles procesu:
    » 1. līmenis: kvalitātes nodrošināšanas pārbaude: 100% failu, kas jāapstiprina.
    » 2. līmenis: kritiskās kvalitātes analīzes pārbaude: Shaips CQA komanda novērtē 15–20% retrospektīvo paraugu.

Rezultāts

Apmācības dati palīdzēja izveidot automatizētu satura moderēšanas ML modeli, kas var dot vairākus rezultātus, kas ir noderīgi drošākas tiešsaistes vides uzturēšanai. Daži no galvenajiem rezultātiem ietver:

  • Efektivitāte, lai apstrādātu lielu datu apjomu
  • Konsekvence, nodrošinot mērenības politikas vienotu izpildi
  • Mērogojamība, lai pielāgotos augošajai lietotāju bāzei un satura apjomam
  • Reāllaika moderācija var identificēt un
    noņemiet potenciāli kaitīgu saturu, tiklīdz tas tiek ģenerēts
  • Rentabilitāte, samazinot paļaušanos uz moderatoriem

Pastāstiet mums, kā mēs varam palīdzēt jūsu nākamajā AI iniciatīvā.