Uge 20: AI-gevinsten ligger i workflows, ikke modeller

Show notes

Ugens fem historier:

Ars Technica — Mozilla fandt 271 sårbarheder med AI, men kun fordi de byggede et eget testlag. Uden det fandt værktøjet 22.
Future of Work (Nirit Cohen) — Anthropic afslører at LLM'er kun bruges til en tredjedel af det, de kan. Forklaringen er organisatorisk, ikke teknisk.
Nate's Substack — Codex blev god. Nu er kontekst flaskehalsen, ikke modellen.
Superhuman AI — Claude er nu et reelt alternativ til Copilot i Microsoft 365.
The Verge AI — Musk-Altman-retsdokumenterne afslører, hvor lidt eksklusivt Microsoft-OpenAI-forholdet egentlig er.

Tre ting, hvis du kun gør noget i denne uge:

Bed jeres CISO om en konkret vurdering af AI-pentesting-værktøjer inden næste kvartal.
Sæt AI-adoptionsgabet på dagsordenen til næste ledermøde.
Forhandl multi-model-klausuler ind i jeres næste Microsoft- eller OpenAI-aftale.

Læs hele nyhedsbrevet på madsens.ai.

Madsens AI er AI-kurateret og menneskeligt forfinet. Skrevet af AI-agenter, kurateret af Kristian Thorsted Madsen og Kristian Hjort-Madsen. Stemmen er en AI bygget på en af Madsen'erne.

Show transcript

00:00:00: Velkommen til Massens AI, et AI-skabt nyhedspræv om AI for danske beslutningstagerer.

00:00:06: Det her er uge tyve.

00:00:08: Inholdet du hører lige nu er skrevet af AI-agenter og kurateret af de to mennesker bag MassensAI.

00:00:14: Stemmen er også en AI bygget på én af massenerne.

00:00:18: Sådan er aftalen hos os.

00:00:20: Agenterne skaber og menneskene vælger, prioriterer og står på mål fra det der bliver sendt ud Når vi skriver om AI til ledere, der selv skal traffe beslutninger om AI, skal det være tydeligt hvor maskinen slutter og hvor mennesket begynder.

00:00:35: Udens tema – Giv vensten ligger i workflows ikke i modellerne Den vigtigste AI-beslutning for en dansk leder lige nu handler ikke om hvilken model der er bedst, men om hvordan organisationen er sat op til at bruge den Mozilla fandt lang flere sorgbarheder fordi de byggede et integrationslag rundt om modellen Anthropic viser, at virksomheder kun udnytter en trededel af det deres modeller kan.

00:01:01: Klort er nu i Microsoft's three hundred and sixty ved siden af Co-Pilot.

00:01:06: Det er workflowet, som afgører om investeringen leverer.

00:01:10: Lad os tage udens fem historier.

00:01:12: Først fra Ars Technica.

00:01:14: Mozilla har fundet two hundred and one hundred and fifty sovbarheder i Firefox med AI men kun fordi de byggede deres eget testlag oven på modellen Uden det fandt værktøjet turetyge.

00:01:27: Det integrationen i sikkerhedstesten, der gør forskellen ikke modellen.

00:01:32: For danske CIS-o'er i finans og kritisk infrastruktur er poænken klar.

00:01:37: Inde IS-to kravne er der allerede?

00:01:40: Spørgsmålet er om jeres pendtesting værkterier er klar eller om I selv skal bygge testledet.

00:01:46: Mytors talene gør vi venter til en risikobeslutning!

00:01:51: Fra Future of Work nyhedsberedet kommer udens anden historie.

00:01:55: Anthropik afslører et brutalt misforhold.

00:01:58: Språmodeller kan teoretisk hjælpe med op til fyrst procent af opgaverne, men bliver kun brugt til en tredje del.

00:02:05: Forklaringen ligger ikke i teknologien, men i organisationen.

00:02:10: Gudkendelses flows og rolle-definitioner er bygget til en verden uden agender Når HR-direktøjer uddeler co-pilot licenser uden at rette sigende strukturerne ender investeringen som en dyre Microsoft Office.

00:02:24: Det er ikke licenserne, der mangler – det er i friktionen, der skal væk.

00:02:29: Videre til Nate's Substack OpenAI har gjort Codex så stærk, at flaskehalsen nu af konteksten ikke modellen.

00:02:38: Et team der bruger Codex uden af dokumenterede reviewstandard og fejlmønstre for hurtigere forkert kode ikke bedre.

00:02:46: Mange danske softwarehuse har skalerede AI-kodenning uden at opdaterer intern dokumentation, resultatet af en dyre Stack Overflow Pak konteksten som infrastruktur, plugins med jeres standard og fejlhistorik, investerer i dokumentation ikke i flere licenser fra Superhuman AI.

00:03:08: Klort er nu et reelt alternativ i Microsoft III.

00:03:13: For første gang kan danske virksomheder på Microsoft's stacken vælge mellem to Frontier-modeller i samme produktivitetsmiljø.

00:03:21: Modellerne er deaktiveret som standard og er aktuelt ikke omfattet af Microsofts EU Data Boundary.

00:03:29: Vallet mellom Copilot og Claude handler ikke om specs, men om workflows.

00:03:34: I T-direktøjer med M.M.A.T.E.R.S.

00:03:37: Autaler bør teste Claude på konkrete dokumenter nu før næste forhandling med Microsoft.

00:03:44: Og til sidst fra The Verge AI.

00:03:47: Ratsdokumenterne fra Musk mod Ordmann afslører, hvor afhængig Microsoft selv vurderer at være er OpenAI og hvor lidt eksklusivt forholdet er.

00:03:57: Til danske inkøbschefer – ekskositivitet er ikke længere markedsstandart.

00:04:02: Hvis ihjeres AI-aftaler er bundet til én udbyder bør igen besøge exit-klausuler og multimodelt bestemme sig!

00:04:10: Multimodell er den eneste defensible position, og mistren hører hjemme på listen når I forhandler.

00:04:17: En kort håndholdt anbefaling Satya Nadella og Larry Fink udfolder i en lang samtale AI som en kognitiv for stærker der genstarter vidensarbetet fra bunden Hvad at lytte til hvis I diskuterer AI som et projektkonto i stedet for et organisatorisk skifte?

00:04:35: Tre ting hvis du kun gør noget i denne uge Bede jer at se ISO om en konkret vurdering af AI penttesting værktøjer inde næste kvartal.

00:04:46: Tog, set AI-adoptionskabet på dagshorten til Næste Ledermedde.

00:04:52: Hvilke godkendelsesflås blockerer for, at licenserne rent faktisk bliver brugt?

00:04:57: Træ – forhandel multimodell-klausuler ind i jeres næst Microsoft eller OpenAI-aftale Det var Massens AI fra uge tyve Denne uge handler ikke om hvilken model der vinder, men om at have workflowet til at bruge den.

00:05:12: Vi vender tilbage næste mand da!

00:05:15: Du finder hele nyhedsberedet og kan skrive til os på massens.ai

Show notes

Show transcript

New comment