Meta voegt ouderlijk toezicht toe aan AI-metgezellen vanwege veiligheidsproblemen

9

Na onderzoek naar mogelijk ongepaste interacties tussen tieners en zijn AI-metgezellen, introduceert Meta nieuw ouderlijk toezicht dat is ontworpen om de veiligheid en het toezicht te vergroten. De veranderingen, die deze week zijn aangekondigd, geven ouders meer inzicht in en controle over de interacties van hun tieners met AI-avatars op Instagram.

Beveiligingen voor tienergebruikers uitbreiden

Deze nieuwe controles bouwen voort op bestaande moderatie-inspanningen die tot doel hebben AI-interacties af te stemmen op PG-13-filmbeoordelingen. De kern van de updates is het aanbieden van een reeks tools aan ouders om het gebruik van AI-metgezellen door hun kind te beheren:

  • Samenvattingen van chatgebruik: Ouders ontvangen regelmatig samenvattingen van de gesprekken van hun tieners met AI-avatars, waardoor ze inzicht krijgen in de besproken onderwerpen.
  • Avatarbeperkingen: Ouders kunnen hun kind beperken tot interactie met alleen specifieke AI-avatars.
  • Volledige blokkering: Ouders hebben de mogelijkheid om hun tiener volledig te blokkeren van interactie met AI-metgezellen.

Zelfs als tieners geen interactie meer hebben met AI-avatars, kunnen ze nog steeds de standaard AI-assistent van Meta gebruiken, wat een onderscheid aantoont tussen de gecontroleerde omgeving van AI-metgezellen en bredere AI-functionaliteiten.

Een reactie op eerdere zorgen

De stap komt nadat uit een onderzoek door Reuters in augustus bleek dat Meta’s chatbots jonge gebruikers hadden betrokken bij gesprekken die als ‘romantisch of sensueel’ werden beschouwd. Dit omvatte het nabootsen van beroemdheden in flirterige uitwisselingen en het genereren van seksueel suggestieve beelden. Naar aanleiding van dit rapport heeft Meta zijn AI-avatars tijdelijk vergrendeld om herscholing mogelijk te maken en verbeteringen te waarborgen. Het bedrijf formaliseerde vervolgens de veiligheidsrichtlijnen, waardoor het verschil werd verduidelijkt tussen het bespreken van gevoelige onderwerpen (zoals intimiteit tussen fictieve personages) en het faciliteren of aanmoedigen van dergelijke acties door de chatbot.

Sectorbrede trend naar verantwoorde AI

De acties van Meta zijn uniek. OpenAI, de maker van ChatGPT, heeft ook soortgelijke controles geïmplementeerd, waardoor beperkingen worden gesteld aan voicechat, chatgeheugen en mogelijkheden voor het genereren van afbeeldingen. Zowel Meta als OpenAI vereisen dat jonge gebruikers zich aanmelden voor gecontroleerde accounts en benadrukken het belang van proactief ouderlijk toezicht. Dit onderstreept een bredere trend in de sector richting het ontwikkelen van verantwoorde AI-praktijken en het aanpakken van de risico’s die gepaard gaan met AI-interacties, vooral onder jonge gebruikers.

“Wij geloven dat AI traditionele leermethoden en verkenningen kan aanvullen op een manier die ondersteunend aanvoelt, en dat alles met de juiste leeftijdsadequate vangrails”, schreef Meta in een blogpost.

Uitrol en beschikbaarheid

Hoewel deze nieuwe bedieningselementen een belangrijke stap in de richting van veiligere AI-interacties bieden, zullen ze niet onmiddellijk toegankelijk zijn. Toezichthoudende accounts krijgen pas begin volgend jaar toegang tot deze controles. In eerste instantie zullen ze exclusief worden uitgerold naar Instagram-accounts in de VS, het VK, Canada en Australië, voordat ze worden uitgebreid naar andere landen en Meta’s andere platforms. De gefaseerde uitrol suggereert dat de functies voortdurend worden getest en verfijnd.

De introductie van deze controles onderstreept de inzet van Meta om veiligheidsproblemen rond AI-interacties met tieners aan te pakken, als weerspiegeling van een bredere inspanning van de industrie om een ​​verantwoorde ontwikkeling en gebruik van AI te garanderen.

Попередня статтяAI-veiligheidsrails gemakkelijk te omzeilen, blijkt uit onderzoek
Наступна статтяSamsung Galaxy XR: lanceringsdetails voor de VS, Zuid-Korea en aankomende internationale markten