Uge 24: Hvad må din AI-agent egentlig gøre?

Show notes

Madsens AI er AI-skabt, menneskekurateret og lavet til danske beslutningstagere, der gerne vil følge med uden at drukne i AI-nyheder.

I denne uge på cirka fem minutter:

AI-agenter, rettigheder og menneskelig godkendelse
Token-forbrug som ledelsestal, ikke bare it-regning
Claude-budgetter og AI som produktudvikling
Agent-baseret kodeudvikling med test, review og ansvar
Datacentre, compute og den fysiske side af AI

Læs nyhedsbrevet på madsens.ai.

Show transcript

00:00:00: Velkommen til Massens AI, et AI-skabende hødsbræv om AI for danske beslutningstagerer.

00:00:06: Det her er uge-tvio.

00:00:08: Inholdet du hører lige nu er skrevet af AI-agenter og kurateret af de to mennesker bag MassensAI.

00:00:14: Stemme er også en AI bygget på én af massenerne.

00:00:18: Sådan er aftalen hos os – agenterne skaber og menneskene vælger, prioriterer og står på mål for det der bliver sendt ud Når vi skriver om AI til ledere, der selv skal traffe beslutninger om AI, skal det være tydeligt, hvor maskinen slutter og hvor mennesket begynder.

00:00:35: Udens tema.

00:00:37: Hvis AI-agenter får lov at handle, skal danske ledere styre rettigheder, omkostninger og effekt før de vælger model?

00:00:46: Udendshistorier peger samme sted hen.

00:00:48: Agenten er ikke længere kun et skriveværktøj – den kan ændre data, bruge penge, skrive kode og kalde andre systemer Derfor fyrter ledensesopgaven sig fra modelvalg til driftsregler.

00:01:01: Hvem må agenten handle på vejene af, hvad mod den koste og hvordan beviser I værdien?

00:01:08: Lad os tage udens fem historier.

00:01:11: Først fra MIT Technology Review kommer historien om Metahacket – en kundeserviceagent skiftede e-mail på en konto fordi en angriber fik den til at acceptere en forkert instruktion Det lyder som en AI-fejl, men for en leder er det mere præcis end autorisationsfejle.

00:01:29: Agenten fik lov til at gøre noget den ikke burde kunne gøre alene.

00:01:34: Start i denne uge med én arbejdskang i overvejer at automatisere.

00:01:38: Skriv ned hvad agenten må læse, hvad den må vorslog og hvad den kun må udføre efter menneskelig godkendelse.

00:01:47: For Enterprise AI Trends kommer ugens anden historie Amazon har i følge mediet brugt omkring rundt femhundet millioner kroner på klod.

00:01:56: Det er interessant, at det ikke er beløbet, men om udgiften køber læring, hastighed og bedre beslutninger eller bare flere svar i en chatbox.

00:02:05: For danske virksomheder skal AI-bysjettet behandles som produktudvikling ikke som kontorsoftware.

00:02:12: Læve en investeringslock for jeres AI-projekter.

00:02:15: Formål, ansvarlige leder, forventede gevinst og datoren, hvor I beslutter om projektet fortsætter.

00:02:24: For Exponential View kommer tredje historie om token-prissættning.

00:02:29: Når prisen følger forbrug, bliver det sværere at gæmme AI udgifter i en samlede licenslinje – hver prompt, hver dokument og hver agentkørsel efterleder et omkostningsbord.

00:02:41: Det kan føles irriterende men det er sundt!

00:02:43: Det tvinger jeg til at svare på, hvem der bruger AI til hvad og med hvilken effekt?

00:02:49: Sæt tokenforbrug på næste ledermede og bedde økonomi og IT lave en månedlig visning per use-case.

00:02:58: For Late in Space handler fire historie om GitHub og agentbaserede kohedudvikling Når agent der skriver kohet, er det ikke nok at give dem adgang til et repository og håbe på flere commits De skal arbejde med opgaver, tests, pull requests, ejerskab og review Ellers få i hastighed uden ansvar Vel et repor til pilot gi' agenten en tydelig rolle, krev automatiske tests beskyt hovedgrenene og ladet menneske godkende ændringer før drift.

00:03:32: Fra The Verge kommer den femte historie.

00:03:35: New York stopper nye datacentre i et år Beslutningen af lokal mens signalet er bredere AI-kapacitet er også elnet, køling, lokalpolitik og arial Compute er ikke en usynlig sky Det er fysisk infrastruktur og den kan blive en flaskehals.

00:03:54: Spørg hvor jeres berejninger kører, hvilke kapacitetsbegrænsninger leverandøren ser og hvordan I kan flytte workloads hvis priser eller adgang ændre sig.

00:04:04: Bed også om en eksportvej for agent traces og evales før I bliver låst fast.

00:04:12: Udens håndholdte læringsresource er ikke agentgenererede – det er en anbefaling fra redaktionen Claude Kowork via Executive Briefing med Tina Huang.

00:04:23: Brug den som fællesbrug i ledergruppen, hvis I mangler en praktisk måde at tale om agenter, roller og samarbejde mellem mennesker og maskiner.

00:04:33: Tre ting, hvis du kun gør noget i denne uge.

00:04:37: Et – kortlæg én agent- arbejdskang og markerer hvilke handlinger der kræver menneskelige godkendelse.

00:04:44: To – beddhjærs AI leverandør dokumenterer Hvordan I kan eksportere Agent Traces, e-vægels og historik, hvis I skifter plattform.

00:04:54: Tre – tage token forbrug op på næste ledermøde Og kople hver aktiv usecase til én konkret KPI Det var massens AI fra uge med fire tyve Udens tone er enkel Agenter skal ikke bare være dyrktige De skal have klare grænser Vi vender tilbage næstemante Du finder hele nyhedsprævet og kan skrive til os På Massens.tut.a.i

Show notes

Show transcript

New comment