Hoe Intuit AI gebruikte om maanden van belastingwetgeving om te zetten in dagen van ontwikkeling

13

Toen de ‘One Big Beautiful Bill’ (OBBB) werd geïntroduceerd als een enorm, ongestructureerd document van 900 pagina’s, stond het TurboTax-team van Intuit voor een enorme uitdaging. Ze hoefden geen gestandaardiseerde formulieren te volgen, geen officiële IRS-instructies en een strikte deadline. Traditioneel zou de implementatie van dergelijke complexe wetgeving maanden van handenarbeid vergen.

In plaats daarvan ontwikkelde Intuit een gespecialiseerde AI-gestuurde workflow die maanden werk in slechts enkele dagen comprimeerde. Dit was niet alleen een overwinning voor de belastingvoorbereiding; het creëerde een blauwdruk voor elke sector – zoals de gezondheidszorg, de advocatuur of de financiële sector – die complexe regelgeving moet vertalen in nauwkeurige software die veel op het spel staat.

De uitdaging: complexiteit zonder routekaart

Om de omvang van deze prestatie te begrijpen, moet je kijken naar de manier waarop Intuit voorheen met grote wetgevende verschuivingen omging. Tijdens de Tax Cuts and Jobs Act (TCJA) van 2017 werkte het team zonder AI, waarbij het handmatig de juridische secties decodeerde en naging hoe deze met elkaar verbonden waren.

De OBBB bracht zelfs nog grotere hindernissen met zich mee:
Structurele chaos: Het kwam aan als een ongestructureerd document zonder vast schema.
Inconsistentie van de wetgeving: De versies van het Huis en de Senaat gebruikten verschillende bewoordingen om dezelfde bepalingen te beschrijven.
Het probleem van het “bewegende doel”: Het team moest beginnen met coderen voordat de IRS zelfs maar officiële formulieren of instructies had vrijgegeven.

In een gereguleerde sector is er een nulmarge voor fouten. Eén enkele fout in een belastingberekening kan aanzienlijke juridische en financiële gevolgen hebben voor miljoenen gebruikers.

De workflow: van juridische tekst tot functionele code

Intuit vroeg ChatGPT niet simpelweg om hun code te schrijven. In plaats daarvan hanteerden ze een meerlaagse strategie die van algemene analyse overging op zeer gespecialiseerde implementatie.

1. Snelle documentdistillatie

Het team gebruikte Large Language Models (LLM’s) voor algemene doeleinden, zoals ChatGPT, om het zware werk van documentanalyse uit te voeren. Ze gebruikten deze modellen om:
– Vat de versies van het Huis en de Senaat samen.
– Verzoen de verschillen tussen de twee.
– Filter de enorme tekst om alleen de specifieke bepalingen te identificeren die van invloed waren op TurboTax-klanten.

Deze fase veranderde wat voorheen weken van handmatig lezen was, in een kwestie van uren.

2. De kloof overbruggen met domeinspecifieke AI

Algemene AI-modellen stuitten op een muur als het ging om de daadwerkelijke codering. TurboTax draait niet op standaard programmeertalen; het is afhankelijk van een gepatenteerde, domeinspecifieke taal die wordt onderhouden door Intuit.

Om dit op te lossen wendde het team zich tot Claude. In tegenstelling tot algemene modellen werd Claude gebruikt voor het in kaart brengen van diepgaande afhankelijkheid, waarbij werd geïdentificeerd hoe nieuwe wettelijke bepalingen zouden interageren met decennia van bestaande, complexe code. Hierdoor konden ontwikkelaars negeren wat hetzelfde bleef en zich uitsluitend concentreren op wat er veranderde.

3. Het automatiseren van de gebruikerservaring en het testen

Om ervoor te zorgen dat de snelheid de kwaliteit niet in gevaar bracht, heeft Intuit twee cruciale eigen tools gebouwd:
Automatisch gegenereerde gebruikersinterface: Een tool die automatisch productschermen genereert op basis van de nieuwe wet, waardoor er minder handmatig ontwerp nodig is.
Geavanceerde unit-tests: Traditioneel testen vertelt u alleen of een stukje code ‘goed’ of ‘mislukt’ is. Het nieuwe raamwerk van Intuit identificeert het exacte codesegment dat een fout heeft veroorzaakt en legt uit waarom, waardoor ontwikkelaars fouten direct binnen het raamwerk kunnen oplossen.

Een blauwdruk voor gereguleerde industrieën

Het succes van dit project biedt een vierledig raamwerk voor elke organisatie die binnen strikte wettelijke grenzen werkt:

  1. Gebruik algemene AI voor analyse: Maak gebruik van commerciële LLM’s om enorme hoeveelheden ongestructureerde gegevens te parseren, samen te vatten en te filteren.
  2. Gebruik gespecialiseerde tools voor implementatie: Wanneer u van ‘lezen’ naar ‘bouwen’ gaat, stap dan over op tools die uw specifieke, bedrijfseigen omgeving begrijpen.
  3. Geef prioriteit aan intelligent testen: Bouw niet alleen ‘geslaagd/mislukt’-tests; bouw een diagnostische infrastructuur die verklaart waarom er een fout is opgetreden.
  4. Verdeel AI vloeiend: AI mag geen hulpmiddel zijn dat voorbehouden is aan ingenieurs; het moet in alle afdelingen worden geïntegreerd om ervoor te zorgen dat de hele organisatie de technologie effectief kan valideren en gebruiken.

“Het komt erop neer dat je over menselijke expertise beschikt om zo ongeveer alles te kunnen valideren en verifiëren”, zegt Sarah Aerni, VP Technology bij Intuit.


Conclusie
Door AI voor algemene doeleinden voor snelle analyse te combineren met eigen tools voor gespecialiseerde codering en testen, bewees Intuit dat AI ontwikkelingscycli drastisch kan versnellen zonder de absolute nauwkeurigheid op te offeren die vereist is door gereguleerde industrieën.