Det börjar liksom att klia. Och när det börjat, så bara måste jag klia tillbaka. Det går inte att inte göra.
Jag bara måste.
Precis den känslan, det där med att det kliar, kan jag få om idéer. Det går liksom inte att hålla den där idén kvar som en flyktig tanke, den bara måste komma till livs på något sätt.
Den känslan var början på detta experiment. En idé om att kunna effektivisera enklare och rutinmässiga arbetsflöden med hjälp av AI. Att automatisera bort en massa tråkiga grejer i vardagen.
Ända sedan jag för drygt ett år sedan fick tillgång till OpenAIs AI verktyg GPT3, har jag utforskat och experimenterat. Språkmodellen som från början mest var uppmärksammad bland andra nördar kom att hamna på allas läppar med utvecklingen av nästa version, chatGPT. Det var spännande att utforska vad jag kunde göra med denna AI. Att bearbeta, förändra, utforska och skapa texter. Ett enastående verktyg på många sätt. Och även om chatGPT var spännande, så var det en annan av OpenAIs tjänster som kom att få mig att börja fundera rejält. Under hösten förra året bestämde sig OpenAI för att släppa Whisper som open source. En AI för att göra det talade ordet till text. Att kunna transkribera på ett enkelt sätt var en otroligt kittlande tanke.
Med hjälp av Whisper kunde jag för första gången automatiskt transkribera det jag sa till text, med enastående kvalitet. Det var med dessa två steg, att först omsätta tal till text, och därefter bearbeta texten till ett specifikt format, som jag bara var tvungen att experimentera vidare. Nu gick det inte längre, jag var bara tvungen att pröva. Med hjälp av dessa två olika AI-tjänster började jag utforska möjligheterna med att transkribera och bearbeta mina tankar och mötesanteckningar.
Jag spelade in ett möte med några kollegor på jobbet, bara för att några minuter efter mötet ha ett färdigt mötesprotokoll, klart för justering. Whisper hade transkriberat mötet, och GPT3 hade gjort om talspråket till ett färdigt mötesprotokoll, inklusive datum, närvarande och dagordning. Därefter började jag utforska andra format. Hur blev det att transkribera en projektidé? Skulle jag kunna få ett utkast till en projektplan? Absolut! Går det att skriva inlägg till sociala medier? Inga problem. Minnesanteckningar? I ett nafs. Jag spelade in, kopierade in texten i Whisper, förde över texten till GPT3, gav den instruktioner, och fick ut ett resultat. Lite omständigt var det. Många steg och risk för att trassla till det. Och lite för bökigt för att vara praktiskt i alla lägen.
Det funkade, men det fanns potential för mer. Jag ville automatisera processen. Tänk om det var möjligt att med lite programmering sy ihop hela upplevelsen till en app? Tanken gick inte att bara gå omkring med. Det kliade helt enkelt för mycket. Så jag spelade in en kort video med mitt problem, och skickade den till Micke, min vän och kollega som gärna tar sig an en digital utmaning.
Svaret lät inte dröja särskilt länge.
Det som började som en enkel önskan om att automatisera en arbetsprocess blev så en diskussion med Micke om möjligheterna med AI i arbetslivet, och hur vi kunde utnyttja dessa tekniker för att utveckla hur vi arbetar. Det var ur denna utmaning som tankarna appen Diane föddes. En app som kombinerar Whisper AI och ChatGPT för att skapa ett sömlöst och effektivt arbetsflöde, som gör det enkelt att transkribera och bearbeta talade ord till användbara texter. Diane skulle bli en AI-assistent som kunde förvandla prat till produktivitet.
Tanken med appen var enkel. Som användare skulle du kunna gå från att vara sekreterare till justerare. Istället för att göra dina anteckningar och skriva din text, så formas i stället texten ur ditt talade ord, och du justerar resultatet istället. En förflyttning som sparar tid och energi i första hand, men också öppnar upp för många tillämpningar och möjligheter som inte varit möjliga.
Så efter några samtal inleddes en intensiv period av experiment och prototypande där Micke med mig som bollplank under ett par veckor skapade en fungerande prototyp, skriven i programspråket Python. Diane blev till. Appen fungerade med några enkla knapptryckningar: spela in, transkribera, bearbeta, och spara. Bonusfunktionen var att generera bilder med DALL-E, en annan AI-tjänst från OpenAI.
Mitt första möte med Diane, att pröva att transkribera och få en färdig text, överträffade mina föreställningar om vad som var möjligt. Detta lilla experimenterade började plötsligt väcka många nya frågor. Vilka fler har behov av en sådan här tjänst? Vilka arbetsprocesser skulle förbättras av att automatiseras? Vilka risker med automatiseringen finns?
Under hela processen av att experimentera fram appen Diane, delade vi våra tankar och idéer med varandra på LinkedIn. Genom att ge oss en i allra högsta grad deltagande publik, skapade vi ett intresse för projektet. Vi fick frågor, reaktioner och önskemål. Antalet intresserade av att använda Diane var stort och med frågor från allt från gruvindustrin, försvarsmakten, skolan, sjukvården och pensionsfonder, kunde vi konstatera att detta lilla experiment väckt många tankar och funderingar, inte bara hos oss. Det var uppenbart att det börjat klia hos många andra med.
Det var nu Micke bestämde sig för att ge sig själv en ny utmaning. Han hade aldrig själv skapat en mobilapp för iOS tidigare, och aldrig programmerat i Swift. Kunde det vara möjligt att med hjälp av chatGPT som lärare ta sig an utmaningen att göra om appen Diane till en app för iOS, i AppStore? Kunde det vara möjligt att skapa något som skulle kunna nå en bredare publik?
Med hjälp av ChatGPT och Xcode började Micke lära sig Swift, språket för att bygga iOS-appar. Genom att arbeta tillsammans med ChatGPT, lyckades han på under trettio timmar bryta ner Diane’s kod och omvandla den till en fungerande iOS-app, trots hans begränsade erfarenhet inom området. Diane hade nu förvandlats från en experimentell idé till en app, och med det kom nya möjligheter. Helt plötsligt var Diane inte bara en idé om någonting, utan ett verktyg som kan bidra till att förändra hur vi arbetar.
Hela denna resa från idé till experiment, från prat till produktivitet, har inte bara utvecklat min och Mickes kunskaper inom AI och apputveckling. Den har fått många andra att se möjligheter med den pågående förändring som AI innebär för de flesta av oss. Valet att dela vårt arbete öppet, framförallt på Linkedin men också på Mastodon, har varit väldigt givande. Men för mig har resan mest av allt öppnat upp för nya tankar, nya projekt. Nu kliar det igen. På ett nytt ställe.
Utvecklingen av Diane går att ta del av i efterhand på LinkedIn och en serie filmer, som är länkade därifrån. Här följer dessa länkar i kronologisk ordning
Utvecklingen av Diane
Mickes meck från prototyp till app
Inledning
Del 1
Del 2
Del 3
Del 4
Del 5